語言是人類智能的重要標(biāo)志,在人類文明中的地位與作用毋庸置疑,自然語言處理,通俗地解釋就是“讓計(jì)算機(jī)學(xué)習(xí)人類語言”。清華大學(xué)新設(shè)立的中心旨在通過加強(qiáng)人工智能的基礎(chǔ)研究及其與人文社科學(xué)科的交叉合作,建立更強(qiáng)大的機(jī)器用知識(shí)庫,進(jìn)而提升人工智能對(duì)語言的學(xué)習(xí)和處理的能力。
孫茂松認(rèn)為,目前人工智能同社會(huì)科學(xué)和人文科學(xué)的結(jié)合有兩個(gè)主要的橋梁,一個(gè)是狹義的數(shù)據(jù),比如說金融市場(chǎng)上的數(shù)據(jù),可根據(jù)數(shù)據(jù)來預(yù)測(cè)市場(chǎng)行為;另一個(gè)就是語言文字形成的文本,比如新聞、消息、用戶在社交網(wǎng)絡(luò)上反映觀點(diǎn)和情緒的各種“短信息”等等。
基于人類語言文字這一橋梁,自2015年底起,他指導(dǎo)一個(gè)最初以兩位本科生為主體的課題小組,通過深度神經(jīng)網(wǎng)絡(luò)的方法,讓機(jī)器對(duì)全部古代詩歌進(jìn)行“閱讀”并“理解”,在此基礎(chǔ)上,推出了會(huì)作詩的AI——“九歌”,使人工智能“跨界”到了文學(xué)創(chuàng)作領(lǐng)域。由于公眾的關(guān)注與參與,到目前為止“九歌”已經(jīng)產(chǎn)生了差不多400萬首詩,“從古流傳至今的詩歌總量估計(jì)達(dá)不到400萬首,如果這么想,效果也還不錯(cuò)?!毙〗M目前正在研究現(xiàn)代詩的生成,以期滿足大眾越來越多樣的“作詩要求”。
社會(huì)人文學(xué)科是一個(gè)很寬廣的概念。除了文學(xué)外,今年以來人工智能研究院正在與清華大學(xué)法學(xué)院合作,在原有的法學(xué)基礎(chǔ)上更多地加入計(jì)算與人工智能的成分。法學(xué)院越來越認(rèn)識(shí)到,“計(jì)算法學(xué)”是未來法學(xué)研究的一個(gè)發(fā)展趨勢(shì)。孫茂松也提到,近年來最高人民法院領(lǐng)導(dǎo)的案卷卷宗數(shù)字化、公開化是計(jì)算法學(xué)發(fā)展的一個(gè)重要基礎(chǔ)。
未來是否會(huì)有“AI法官”時(shí),孫茂松說,“應(yīng)該會(huì)有‘人工智能輔助法官’。雖然本質(zhì)上機(jī)器的能力肯定超不過優(yōu)秀的法官,但機(jī)器確實(shí)有它的長(zhǎng)處,比如說它可以快速閱讀大量的卷宗,人有時(shí)候會(huì)判斷有片面性、情緒上會(huì)有所波動(dòng)、法官水平也會(huì)參差不齊,機(jī)器則不會(huì)?!?/p>
孫茂松指出,人工智能目前基于大數(shù)據(jù)的深層神經(jīng)網(wǎng)絡(luò)方法(也叫深度學(xué)習(xí)方法,見后)有可能為某些社會(huì)人文領(lǐng)域帶來研究范式的改變。雖然清華人工智能研究院目前剛剛開始進(jìn)行外匯兌換率預(yù)測(cè)的研究,但他認(rèn)為人工智能與金融、經(jīng)濟(jì)的深度融合可望帶來極具震撼力的成果,一旦深度學(xué)習(xí)方法被創(chuàng)造性地、系統(tǒng)性地應(yīng)用到這個(gè)領(lǐng)域,甚至“這幾年國(guó)際上能出一個(gè)諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)”。
針對(duì)金融、經(jīng)濟(jì)系統(tǒng)的高度復(fù)雜性,孫茂松認(rèn)為,當(dāng)把各類相關(guān)信息都涵蓋進(jìn)來,并且有高超的手段對(duì)這些信息進(jìn)行“大一統(tǒng)”式的有效處理時(shí),這個(gè)復(fù)雜系統(tǒng)的可預(yù)測(cè)性便會(huì)顯著上升。他舉了個(gè)例子,“螞蟻王國(guó)有自己的一套運(yùn)作規(guī)律,但這個(gè)規(guī)律有時(shí)會(huì)變得非常脆弱,因?yàn)榭赡芡蝗粊硪粋€(gè)人,啪地來一腳,便給這個(gè)王國(guó)帶來了滅頂之災(zāi)。僅僅從螞蟻的世界來看,這個(gè)突發(fā)事件是不可預(yù)測(cè)的。但如果把人的因素包含進(jìn)來,細(xì)致了解這個(gè)人的秉性,比如他是否是一個(gè)有愛心的人、是否是一名佛教徒等等,他的行為的可預(yù)測(cè)性就會(huì)大大提高,螞蟻王國(guó)的不可預(yù)測(cè)性也會(huì)隨之大大降低”。
在孫茂松看來,經(jīng)典金融學(xué)或經(jīng)濟(jì)學(xué)的研究范式主要是依靠人的理性思辨和求解方程(無論是線性還是非線性方程)。但復(fù)雜且龐大的金融和經(jīng)濟(jì)系統(tǒng)里充滿了不確定性,很多現(xiàn)象難以用方程顯式地刻畫。但深度學(xué)習(xí)方法具有高度的非線性性質(zhì),在大數(shù)據(jù)的驅(qū)動(dòng)下,理論上它能隱式地模擬任何復(fù)雜的方程,更加有效地處理系統(tǒng)的不確定性。這就使得一種全新的金融學(xué)或經(jīng)濟(jì)學(xué)研究范式的產(chǎn)生成為可能。把“黑盒子”變成“灰盒子”
孫茂松的書架上擺著金融、語言、邏輯等各領(lǐng)域的書籍
“當(dāng)代人工智能教父”、2018年圖靈獎(jiǎng)得主約書亞·本吉奧(Yoshua Bengio)認(rèn)為,人工智能領(lǐng)域在近些年出現(xiàn)巨大變革要?dú)w功于 “深度學(xué)習(xí)”(deep learning)的出現(xiàn)。他在一篇名為《深度學(xué)習(xí):人工智能的復(fù)興》的署名文章中說,“近年來,深度學(xué)習(xí)已經(jīng)成為了驅(qū)動(dòng)人工智能領(lǐng)域發(fā)展的最主要力量,各大信息技術(shù)公司在這方面共擲下了數(shù)十億美元的資金。”
本吉奧此前接受澎湃新聞(www.thepaper.cn)記者專訪時(shí)表示,現(xiàn)有的自然語言處理系統(tǒng)掌握了大量的詞匯量和語言轉(zhuǎn)換的技巧,但是卻并不理解句子的真正含義,機(jī)器“會(huì)犯一些非常愚蠢的錯(cuò)誤,甚至沒有兩歲小孩的理解能力”。同時(shí)他認(rèn)為,模擬人腦的神經(jīng)網(wǎng)絡(luò)以期能夠?qū)崿F(xiàn)類人工智能的機(jī)器學(xué)習(xí)技術(shù),即神經(jīng)網(wǎng)絡(luò)技術(shù)對(duì)于新時(shí)代的意義是巨大的。
盡管意義巨大,但目前的深層神經(jīng)網(wǎng)絡(luò)系統(tǒng)存在著一個(gè)重大不足:給定一個(gè)輸入,系統(tǒng)給出相應(yīng)結(jié)果的深刻原因?qū)θ藖碚f是不透明的,從這個(gè)意義上來說,它基本上是一個(gè)“黑盒子”。這就導(dǎo)致系統(tǒng)的穩(wěn)健性會(huì)變大打折扣,系統(tǒng)的適用范圍也會(huì)縮窄。當(dāng)我們深究機(jī)器為什么犯錯(cuò)時(shí)(如機(jī)器翻譯系統(tǒng)為什么把一句話翻成這樣、而不翻成那樣),機(jī)器卻無法給出解釋,“反正我就翻成這樣,你看著用吧。”
此外,深度學(xué)習(xí)最擅長(zhǎng)處理的是關(guān)聯(lián)性:當(dāng)輸入“公雞打鳴”這個(gè)詞語時(shí),它會(huì)自動(dòng)聯(lián)想到“太陽升起來了”這句話。這體現(xiàn)了一種關(guān)聯(lián)性,但顯然前者不是導(dǎo)致后者的原因。深度學(xué)習(xí)現(xiàn)在基本上沒有因果推理能力。孫茂松說,深度學(xué)習(xí)只是在統(tǒng)計(jì)意義上“覺得”某兩個(gè)東西是相關(guān)的,但兩者之間到底有沒有邏輯關(guān)系,它卻渾然不知。
孫茂松進(jìn)一步闡釋,自然語言處理研究面臨著同樣的難題,實(shí)際上,“可解釋性”是整個(gè)人工智能領(lǐng)域目前面臨的困境,也是目前的國(guó)際學(xué)術(shù)研究前沿。研究者們正在努力讓這個(gè)人工智能“黑盒子”至少變成一個(gè)“灰盒子”。孫茂松認(rèn)為,在自然語言處理方面,知識(shí)庫的構(gòu)建或許是一個(gè)解決方法。以古詩詞寫作舉例:“灞橋”后接“折柳”,深度學(xué)習(xí)應(yīng)該能從詩庫中捕捉到這個(gè)知識(shí)關(guān)聯(lián),但其它眾多知識(shí)關(guān)聯(lián)是否都能學(xué)到,就不好說了。但如果我們自覺地把跟“灞橋”相關(guān)的東西全預(yù)先列出來,如“灞水、驛站、銷魂、斷腸、長(zhǎng)安、關(guān)中八景、李白、李商隱、孟浩然…”,建立起一個(gè)知識(shí)圖譜,那么,機(jī)器就可以根據(jù)這個(gè)知識(shí)圖譜比較自覺地去寫詩,針對(duì)性更強(qiáng),寫詩過程也便具有了一定的可解釋性。
根據(jù)人工智能研究院院長(zhǎng)張鈸院士的說法,人工智能在其發(fā)展史上已經(jīng)先后經(jīng)歷了理性主義和經(jīng)驗(yàn)主義兩代。第三代人工智能應(yīng)該是這兩者的完美結(jié)合。解決可解釋性問題,是其核心研究任務(wù)之一。
因?yàn)橹R(shí)天然地具有一定解釋性,知識(shí)庫就帶有一種可解釋性。
“通專雖應(yīng)兼顧,而重心所寄, 應(yīng)在通而不在?!?/strong>
以人工智能和大數(shù)據(jù)為標(biāo)志的第四次工業(yè)革命到來之際,國(guó)內(nèi)多所高校開始布局人工智能教育。2017年5月,中國(guó)科學(xué)院大學(xué)成立人工智能技術(shù)學(xué)院,成為我國(guó)人工智能技術(shù)領(lǐng)域首個(gè)全面開展教學(xué)和科研工作的新型學(xué)院;2018年,上海交通大學(xué)與南京大學(xué)先后建立了人工智能研究院與人工智能學(xué)院,南京大學(xué)還招收了首批人工智能專業(yè)本科學(xué)生。
而作為中國(guó)頂尖的高等學(xué)府,清華大學(xué)對(duì)頂尖人才培養(yǎng)一貫高度重視。2005年設(shè)立的計(jì)算機(jī)科學(xué)實(shí)驗(yàn)班(因其創(chuàng)始人、“圖靈獎(jiǎng)”唯一華人獲獎(jiǎng)?wù)咭ζ谥嵌妹耙Π唷保┦侨珖?guó)乃至全球領(lǐng)先的計(jì)算機(jī)人才培養(yǎng)的搖籃。一流的高等教育有責(zé)任助力計(jì)算機(jī)科學(xué)和人工智能達(dá)至下一個(gè)令人鼓舞的高度,更應(yīng)該能夠給這個(gè)時(shí)代帶來顛覆性的影響。
那么,人工智能本科專業(yè)的設(shè)置是否必要?人工智能要不要在本科階段就獨(dú)立成系?
“通專雖應(yīng)兼顧,而重心所寄, 應(yīng)在通而不在專”,孫茂松用清華大學(xué)老校長(zhǎng)梅貽琦的一句話為澎湃新聞?dòng)浾呓忉屃藝?guó)內(nèi)頂尖高校對(duì)于人工智能本科教育或許應(yīng)有的態(tài)度。在參考了全球名校如MIT(麻省理工學(xué)院Massachusetts Institute of Technology)、斯坦福大學(xué)、CMU(卡耐基梅隆大學(xué)Carnegie Mellon University)等的課程建構(gòu)后,孫茂松認(rèn)為人工智能不應(yīng)貿(mào)然獨(dú)立于計(jì)算機(jī)科學(xué)技術(shù)的一級(jí)學(xué)科。當(dāng)然,各個(gè)高校根據(jù)各自不同的情況和需要制定自己的發(fā)展策略,也是可以理解的。
“清華主要的還是要穩(wěn),沒有特殊的需求不要變,一變反而變亂了,兩撥人可能無序競(jìng)爭(zhēng)了?!?整體穩(wěn)定、積極探索是清華大學(xué)在人工智能本科教育上的方針。
今年,清華大學(xué)在“姚班”之外新設(shè)立了“智班”,全稱為“清華學(xué)堂人工智能班”,在計(jì)算機(jī)教育結(jié)構(gòu)大體不變的前提下,這個(gè)規(guī)模不大的實(shí)驗(yàn)班將對(duì)人工智能人才、特別是頂尖人才本科階段的培養(yǎng)進(jìn)行深度探索。而人工智能研究院的工作主要定位在研究生階段,特別是博士生階段的培養(yǎng)。
在本中心之前,清華大學(xué)陸續(xù)成立了人工智能研究院基礎(chǔ)理論研究中心、智能機(jī)器人研究中心等七個(gè)研究機(jī)構(gòu)。
孫茂松說,這八個(gè)中心的核心力量主要對(duì)應(yīng)著人工智能研究的“初心”,也就是研究人的感知和認(rèn)知。感知最重要的通道是視覺和聽覺,所以設(shè)立了視覺智能和聽覺智能中心;而認(rèn)知體現(xiàn)人的語言、推理、邏輯、學(xué)習(xí)的能力,所以設(shè)立了基礎(chǔ)理論中心、知識(shí)智能中心和自然語言處理中心等。再向外探索就是智能人機(jī)交互與智能多模態(tài)信息交互乃至機(jī)器人的相關(guān)研究,中心和中心之間是緊密聯(lián)系、相互合作的。
剛滿一周歲的清華人工智能研究院已基本實(shí)現(xiàn)了“整合力量、統(tǒng)籌安排”的目標(biāo)。孫茂松表示,接下來的兩個(gè)中心會(huì)分別以“社交網(wǎng)絡(luò)大數(shù)據(jù)”和“人工智能芯片”為關(guān)鍵詞。
-
人工智能
+關(guān)注
關(guān)注
1796文章
47806瀏覽量
240588 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8447瀏覽量
133130
原文標(biāo)題:對(duì)話清華教授孫茂松:第三代人工智能要處理“可解釋性”問題
文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
小白學(xué)解釋性AI:從機(jī)器學(xué)習(xí)到大模型
![小白學(xué)<b class='flag-5'>解釋性</b><b class='flag-5'>AI</b>:從機(jī)器學(xué)習(xí)到大模型](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
EE-230:第三代SHARC系列處理器上的代碼疊加
![EE-230:<b class='flag-5'>第三代</b>SHARC系列<b class='flag-5'>處理</b>器上的代碼疊加](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
EE-220:將外部存儲(chǔ)器與第三代SHARC處理器和并行端口配合使用
![EE-220:將外部存儲(chǔ)器與<b class='flag-5'>第三代</b>SHARC<b class='flag-5'>處理</b>器和并行端口配合使用](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
第三代半導(dǎo)體廠商加速出海
第三代半導(dǎo)體對(duì)防震基座需求前景?
![<b class='flag-5'>第三代</b>半導(dǎo)體對(duì)防震基座需求前景?](https://file1.elecfans.com/web3/M00/04/08/wKgZPGduYgaARkTkAACC0axgwO0712.png)
第三代半導(dǎo)體產(chǎn)業(yè)高速發(fā)展
第三代寬禁帶半導(dǎo)體:碳化硅和氮化鎵介紹
![<b class='flag-5'>第三代</b>寬禁帶半導(dǎo)體:碳化硅和氮化鎵介紹](https://file1.elecfans.com/web3/M00/01/21/wKgZO2dRBGKAYqzFAAAPiDff15w414.jpg)
第三代半導(dǎo)體的優(yōu)勢(shì)和應(yīng)用
在第三代C2000器件上實(shí)現(xiàn)EEPROM的模擬操作
![在<b class='flag-5'>第三代</b>C2000器件上實(shí)現(xiàn)EEPROM的模擬操作](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
瞻芯電子第三代1200V 13.5mΩ SiC MOSFET通過車規(guī)級(jí)可靠性測(cè)試認(rèn)證
![瞻芯電子<b class='flag-5'>第三代</b>1200V 13.5mΩ SiC MOSFET通過車規(guī)級(jí)可靠<b class='flag-5'>性</b>測(cè)試認(rèn)證](https://file1.elecfans.com/web2/M00/F2/31/wKgZomZ4yWCAdONmAABzW6iU5Bg220.png)
高通推出第三代驍龍7+移動(dòng)平臺(tái)
高通重磅發(fā)布第三代驍龍7+,引領(lǐng)AI與性能新紀(jì)元
高通推出迄今為止最強(qiáng)大的驍龍7系移動(dòng)平臺(tái)—第三代驍龍?7+移動(dòng)平臺(tái)
為什么說第三代驍龍8s恰逢其時(shí)?
![為什么說<b class='flag-5'>第三代</b>驍龍8s恰逢其時(shí)?](https://file1.elecfans.com//web2/M00/C6/3F/wKgaomX8MEeAKNJ_AATOMQyQuFU854.png)
評(píng)論