近日,“大語言模型離人類語言有多遠(yuǎn):新一輪科技創(chuàng)新與產(chǎn)業(yè)革命的風(fēng)口”學(xué)術(shù)研討會在我校云龍校區(qū)順利召開。本次論壇由我校語言能力省部共建協(xié)同創(chuàng)新中心主辦,語言能力省部共建協(xié)同創(chuàng)新中心機(jī)器語言能力平臺、語言科學(xué)與藝術(shù)學(xué)院、江蘇省重點(diǎn)培育智庫語言能力高等研究院、江蘇省人工智能學(xué)會自然語言處理專委會承辦。來自清華大學(xué)、北京大學(xué)、中國人民大學(xué)、復(fù)旦大學(xué)、武漢大學(xué)、百度、科大訊飛、出門問問等數(shù)十家高校、科研機(jī)構(gòu)和企業(yè)界的近百名專家學(xué)者和業(yè)界人士參加了本次論壇。
副校長婁崢嶸主持大會開幕式。副校長商亮致歡迎辭,向與會嘉賓介紹語言能力協(xié)同創(chuàng)新中心的學(xué)科發(fā)展情況。江蘇省教育廳科學(xué)技術(shù)與產(chǎn)業(yè)處副處長徐寧出席會議并致辭,高度評價(jià)了語言能力協(xié)同創(chuàng)新中心在加強(qiáng)基礎(chǔ)研究提供政策依據(jù)、推普脫貧攻堅(jiān)和服務(wù)社會發(fā)展等方面的代表性作用。教育部高等學(xué)校中國語言文學(xué)教學(xué)指導(dǎo)委員會副主任委員、北京語言大學(xué)原校長劉利代表教指委致辭時(shí)表示,江蘇師范大學(xué)語言學(xué)學(xué)科已成為我國新文科建設(shè)的突出代表。
與會專家圍繞大語言模型的成長及功能、大語言模型與腦科學(xué)的互動(dòng)、人與機(jī)器語言理解的比較分析、人工智能技術(shù)與智慧教育、語言加工認(rèn)知機(jī)制的計(jì)算建模研究等議題展開深入討論,共開展了19場特邀報(bào)告。在與會專家的報(bào)告中,大語言模型與人類語言的比較分析成為熱議的話題。
教育部長江學(xué)者特聘教授、我校語言能力協(xié)同創(chuàng)新中心主任楊亦鳴教授指出,以ChatGPT為代表的大語言模型的出現(xiàn)是人類科技發(fā)展史上的重大突破,它開啟了全球第四次科技革命——“智能化”的浪潮。百度公司技術(shù)委員會主席吳華研究員介紹了百度公司的知識增強(qiáng)大語言模型“文心一言”,并就大模型能力和應(yīng)用范式進(jìn)行了探討??拼笥嶏w副總裁汪張龍研究員展示的科大訊飛星火認(rèn)知智能模型在賦能智能語言學(xué)習(xí)全場景表現(xiàn)出色,開啟了智能語言學(xué)習(xí)新時(shí)代。出門問問副總裁李維博士介紹了該公司的一站式AIGC產(chǎn)品矩陣,剖析了大語言模型的本性及內(nèi)容創(chuàng)作新范式。這些國內(nèi)頂尖科技公司的生成式人工智能大模型在邏輯思考、數(shù)學(xué)證明、智能編程、文檔問答與摘要、圖表生成、圖片理解等領(lǐng)域展現(xiàn)出驚人的天賦與優(yōu)良的性能,受到與會專家的高度好評。
清華大學(xué)人工智能研究院常務(wù)副院長孫茂松教授展示了大語言模型在具備一定規(guī)模之后涌現(xiàn)出的類似于數(shù)學(xué)符號推導(dǎo)的推理“創(chuàng)新”能力,他認(rèn)為語言生成模型之所以具有強(qiáng)大的生成能力,其深刻內(nèi)因在于它使用了向量語言,進(jìn)而可實(shí)現(xiàn)“萬物皆向量”。北京大學(xué)計(jì)算語言學(xué)研究所副所長詹衛(wèi)東教授、浙江大學(xué)生物醫(yī)學(xué)工程與儀器科學(xué)學(xué)院研究員丁鼐教授、我校語言科學(xué)與藝術(shù)學(xué)院吳燕京教授、北京師范大學(xué)認(rèn)知神經(jīng)科學(xué)與學(xué)習(xí)國家重點(diǎn)實(shí)驗(yàn)室丁國盛教授等專家學(xué)者就這一話題進(jìn)行了深入研討,認(rèn)為人類有著天賦的語言機(jī)制,這一機(jī)制有許多大語言模型無法模擬的方面。
楊亦鳴教授指出,大語言模型的語言“創(chuàng)新”與人類語言的創(chuàng)新存在本質(zhì)區(qū)別。大語言模型是將人類加工過的語言及其衍生品(文本、圖片等)轉(zhuǎn)化為數(shù)字信息并依據(jù)同現(xiàn)概率等統(tǒng)計(jì)信息進(jìn)行進(jìn)一步處理的,大語言模型涌現(xiàn)能力的呈現(xiàn)依然受人類的影響。北京外國語大學(xué)王克非教授、武漢大學(xué)趙世舉教授等也指出,正是由于大語言模型與人類語言存在本質(zhì)不同,過度依賴大數(shù)據(jù)和云計(jì)算也造成了,如能源消耗過高,數(shù)據(jù)資源即將耗盡,價(jià)值觀、道德觀的偏離等問題。
最后,與會專家們對大語言模型的未來發(fā)展進(jìn)行了展望。中國科學(xué)院院士、清華大學(xué)人工智能研究院院長張鈸教授指出,大語言模型的未來發(fā)展路徑之一是擴(kuò)展多模態(tài),擴(kuò)大模型規(guī)模,研究與發(fā)展GPT語言,但其生成式方法的局限性決定了大語言模型并不適用于確定性答案、邏輯推理等語言應(yīng)用領(lǐng)域,需要研究者另辟蹊徑。楊亦鳴教授指出,人腦“預(yù)裝”的語言機(jī)制是大語言模型難以超越人類語言的根本原因,應(yīng)當(dāng)從分子、細(xì)胞、行為、功能層面開展全方位的語言腦機(jī)制研究,破譯人腦語言加工之謎,以此建構(gòu)可以“預(yù)裝”的“語言腦”,可能是我國人工智能發(fā)展的一條創(chuàng)新路徑。
本次會議聚集了多學(xué)科領(lǐng)域的頂級專家共同聚焦當(dāng)前科技前沿,激發(fā)出更多關(guān)于大語言模型發(fā)展方向創(chuàng)新思路的想法,為更好的把握科技創(chuàng)新和產(chǎn)業(yè)革命的風(fēng)口、推動(dòng)大語言模型與人類語言更進(jìn)一步開風(fēng)氣之先,具有重要的現(xiàn)實(shí)意義,受到人民日報(bào)、光明日報(bào)、新華日報(bào)、中國教育電視臺等多家媒體的關(guān)注與報(bào)道。
![]() |
![]() |