前言:本文是未來(lái)智能實(shí)驗(yàn)室關(guān)于人工智能智商的最新研究文章,主要提出智能系統(tǒng)的智能水平會(huì)因?yàn)闇y(cè)試目的的不同,產(chǎn)生三種不同的智商類型,針對(duì)這三種AI智商,本文也提出對(duì)應(yīng)的測(cè)試方法和數(shù)學(xué)公式。
我們?cè)谘芯恐邪l(fā)現(xiàn),人類在討論AI的智能發(fā)展水平時(shí),需求和目的并不相同,由此在評(píng)估AI智商時(shí)也會(huì)出現(xiàn)差異,第一個(gè)目的和需求是評(píng)判當(dāng)前的AI系統(tǒng)(或機(jī)器人)是否在智力上超越人類 ,第二個(gè)需求和目的是了解一個(gè)智能產(chǎn)品在服務(wù)人類時(shí),究竟有多么聰明,和要付出多少價(jià)格。根據(jù)這一關(guān)鍵區(qū)別,未來(lái)智能實(shí)驗(yàn)室提出AI系統(tǒng)應(yīng)該存在三種智商,分別是通用智商、服務(wù)智商和價(jià)值智商。
0.背景
伴隨著2016年AlphaGo戰(zhàn)勝人類圍棋冠軍李世石,世界范圍人工智能迅猛發(fā)展,人工智能威脅論也因此廣泛傳播,同時(shí)智能產(chǎn)品蓬勃發(fā)展,不斷涌現(xiàn)。人工智能究竟能不能超越人類?這些智能產(chǎn)品的智能究竟達(dá)到什么水平?回答這些問(wèn)題都需要用定量的方法測(cè)試智能系統(tǒng)的發(fā)展水平。
從1950年圖靈測(cè)試提出以來(lái),科學(xué)家已經(jīng)為人工智能發(fā)展的評(píng)價(jià)體系做了很多工作。1950年,圖靈提出了著名的圖靈實(shí)驗(yàn),采用提問(wèn)和人類裁判的方法,判斷一臺(tái)計(jì)算機(jī)是否具有同人相當(dāng)?shù)闹橇?。作為最被廣泛應(yīng)用的人工智能測(cè)試方法,但圖靈測(cè)試并不檢驗(yàn)Ai的智能發(fā)展水平,只是判斷智能系統(tǒng)能否與人類智能相同,而且受人為因素干擾太多,嚴(yán)重依賴于裁判者和被測(cè)試者的主觀判斷,因此往往有人在沒(méi)有得到嚴(yán)格驗(yàn)證的情況下宣稱其程序通過(guò)圖靈測(cè)試,
2015年3月24日“美國(guó)科學(xué)院院刊(PNAS)發(fā)表一篇論文,提出一種新的圖靈測(cè)試方法“Visual Turing test” ,這種測(cè)試方法用來(lái)對(duì)計(jì)算機(jī)的圖像認(rèn)知能力進(jìn)行更為深入的評(píng)估。
2014年美國(guó)佐治亞技術(shù)學(xué)院的瑞德教授(Mark O. Riedl)認(rèn)為,智能的本質(zhì)在于創(chuàng)造力。他設(shè)計(jì)了一個(gè)叫做Lovelace 2.0 版本的測(cè)試。Lovelace 2.0 的測(cè)試范圍包括:創(chuàng)作有虛擬故事的小說(shuō)、詩(shī)歌創(chuàng)作、油畫和音樂(lè)等。
在解決人工智能定量測(cè)試的問(wèn)題上,包括圖靈測(cè)試在內(nèi)的各種方案還存在兩個(gè)問(wèn)題:第一,這些測(cè)試方法沒(méi)有形成統(tǒng)一的智能模型,并以此為基礎(chǔ)進(jìn)行分析,區(qū)分智能的多個(gè)分類。導(dǎo)致無(wú)法將不同的智能系統(tǒng)包括人類進(jìn)行統(tǒng)一的測(cè)試;第二是這些測(cè)試方法無(wú)法定量分析人工智能,或者只定量分析智能的某個(gè)方面,但這個(gè)系統(tǒng)究竟達(dá)到人類智慧的百分之多少,發(fā)展速度與人類智慧發(fā)展速度比率如何,這些問(wèn)題在上述研究中沒(méi)有涉及。
針對(duì)這些問(wèn)題,研究團(tuán)隊(duì)提出:根據(jù)評(píng)測(cè)目的的不同,智能系統(tǒng)的智能水平評(píng)估存在三種智商,分別是:智能系統(tǒng)的通用智商,服務(wù)智商和價(jià)值智商。這三種智商的理論基礎(chǔ),詳細(xì)定義和評(píng)測(cè)方法將在以下內(nèi)容中做詳細(xì)闡述。
1.理論基礎(chǔ):標(biāo)準(zhǔn)智能系統(tǒng)和擴(kuò)展的馮諾依曼架構(gòu)
對(duì)智能系統(tǒng)包括人類和人工智能系統(tǒng)的智力能力進(jìn)行評(píng)測(cè)面臨兩個(gè)重要挑戰(zhàn):第一,人工智能系統(tǒng)目前沒(méi)有形成統(tǒng)一的模型;第二,人工智能系統(tǒng)與以人類為代表的生命體之間的比較目前沒(méi)有統(tǒng)一的模型。
針對(duì)這一問(wèn)題,2014年 ,中科院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心同時(shí)也是未來(lái)智能實(shí)驗(yàn)室研究團(tuán)隊(duì)成員,劉鋒,石勇,劉穎參考馮·諾伊曼結(jié)構(gòu)、戴維·韋克斯勒人類智力模型、知識(shí)管理領(lǐng)域DIKW模型體系等。提出“標(biāo)準(zhǔn)智能模型”,統(tǒng)一描述人工智能系統(tǒng)和人類的特征和屬性,將任何一個(gè)智能體視為一個(gè)具有“知識(shí)的獲取,掌握,創(chuàng)新和反饋”的系統(tǒng)。
基于這個(gè)模型與馮諾依曼架構(gòu)結(jié)合,可以形成擴(kuò)展的馮諾依曼架構(gòu),相比馮諾依曼架構(gòu),這個(gè)模型增加了創(chuàng)新創(chuàng)造功能,即能夠根據(jù)已有的知識(shí),發(fā)現(xiàn)新的知識(shí)元素和新的規(guī)律,使之進(jìn)入到存儲(chǔ)器,供計(jì)算機(jī)和控制器使用,并通過(guò)輸入/輸出系統(tǒng)與外部進(jìn)行知識(shí)交互。第二個(gè)增加的是能夠進(jìn)行知識(shí)共享的外部知識(shí)庫(kù)或云存儲(chǔ)器,而馮·諾伊曼架構(gòu)的外部存儲(chǔ)只為單一系統(tǒng)服務(wù)。擴(kuò)展的馮諾依曼架構(gòu)在構(gòu)建AI的智商中將起到重要的作用。
2.智能系統(tǒng)三種不同智商的定義
2.1 AI通用智商的提出
基于標(biāo)準(zhǔn)智能模型,研究團(tuán)隊(duì)建立AI智商測(cè)試量表,分別與2014年和2016年對(duì)包括谷歌、Siri、百度、Bing等50多個(gè)人工智能系統(tǒng)和6歲,12歲和18歲人群進(jìn)行AI智商測(cè)試。從測(cè)試結(jié)果看,谷歌、百度等人工智能系統(tǒng)的性能比兩年前已有大幅提高,但仍與6歲兒童有一定差距.
應(yīng)該說(shuō)上述AI智商測(cè)試是為了解決AI能否超越人類智能這個(gè)問(wèn)題而開展的,這個(gè)研究是將每一個(gè)智能系統(tǒng)包括機(jī)器人,AI軟件系統(tǒng),人類,動(dòng)物和其他生物當(dāng)做平等的智能體,觀察其與自然界,其他智能體在交互中顯示出來(lái)的智能水平。
AI通用智商的定義如下:基于標(biāo)準(zhǔn)智能模型,為了解決“評(píng)價(jià)各智能系統(tǒng)發(fā)展水平高低”的問(wèn)題,將各智能系統(tǒng)視為平等的智能體,通過(guò)統(tǒng)一的AI智商測(cè)試量表形成的智能評(píng)測(cè)分?jǐn)?shù),可以稱為AI系統(tǒng)的通用智商 Artificial intelligence General intelligence quotient (AI G IQ)。
2.2. AI服務(wù)智商的提出
在實(shí)踐中,我們發(fā)現(xiàn)除了少數(shù)AI系統(tǒng)的產(chǎn)生是出于科學(xué)實(shí)驗(yàn)?zāi)康模粸槿祟愄峁┹o助性服務(wù),其他大多數(shù)AI系統(tǒng)是為了更好的服務(wù)于人類而被制造出來(lái),它的智能也主要體現(xiàn)在為人類服務(wù)的過(guò)程中,智能水平越高,也就能更好的為人類提供服務(wù)。
這種情況下,如果用AI的通用智商標(biāo)準(zhǔn)進(jìn)行評(píng)測(cè),就明顯與產(chǎn)品的最初被制造出來(lái)的目的有重大差異。這就需要我們根據(jù)此類AI系統(tǒng)的特點(diǎn),基于標(biāo)準(zhǔn)智能模型,選擇與服務(wù)相關(guān)的指標(biāo)進(jìn)行評(píng)測(cè),
這些指標(biāo)與AI的通用智商評(píng)測(cè)指標(biāo)有相關(guān)性,但又有比較大的差異。包括對(duì)人工智能的法律,倫理道德等約束條件也應(yīng)該放在智能系統(tǒng)服務(wù)智商中。而不用放在智能系統(tǒng)的通用智商中。
AI服務(wù)智商的定義:基于標(biāo)準(zhǔn)智能模型,為了回答“智能系統(tǒng)如何才是更好的服務(wù)于人類”的問(wèn)題,對(duì)智能產(chǎn)品在服務(wù)過(guò)程中體現(xiàn)的智能水平進(jìn)行測(cè)試,并形成的智能評(píng)測(cè)分?jǐn)?shù),可以稱為AI系統(tǒng)的服務(wù)智商,Artificial intelligence seveice intelligence quotient (AI S IQ)。
2.3.AI價(jià)值智商提出
為人類提供服務(wù)或支撐性工作的AI系統(tǒng),往往會(huì)由不同的公司和企業(yè)提供相應(yīng)的智能產(chǎn)品,例如智能音箱就有亞馬遜、百度等品牌,智能聊天機(jī)器人包括科大訊飛、蘋果Siri等,由于是由不同企業(yè)生產(chǎn)制造,完成相同或相近功能,每個(gè)企業(yè)的造價(jià)或售價(jià)也會(huì)不同,服務(wù)智商與成本或價(jià)格關(guān)聯(lián)會(huì)對(duì)消費(fèi)者購(gòu)買智能產(chǎn)品產(chǎn)生重要的影響。
AI價(jià)值智商的定義:基于標(biāo)準(zhǔn)智能模型,為了幫助使用者判斷需要用多大經(jīng)濟(jì)代價(jià)獲得智能系統(tǒng)的智力能力, 將智能系統(tǒng)的服務(wù)智商除以該系統(tǒng)的出售價(jià)格,形成的智能評(píng)測(cè)分?jǐn)?shù),可以稱為AI系統(tǒng)的價(jià)值智商,Artificial intelligence Value intelligence quotient (AI V IQ)。
3.智能系統(tǒng)通用智商和服務(wù)智商的測(cè)試量表設(shè)計(jì)。
3.1.智能系統(tǒng)通用智商的測(cè)試量表
為了解決AI能否超越人類智慧的問(wèn)題,2014年開始,本文研究者根據(jù)標(biāo)準(zhǔn)智能模型把智能分為“知識(shí)的獲取,掌握,創(chuàng)新和反饋”四類能力,在這四類之下又分成15個(gè)小分類能力,從更多維度評(píng)測(cè)AI,人類的智能。這15個(gè)小分類是:圖像、文字、聲音的識(shí)別和輸出,常識(shí)、計(jì)算、翻譯、排列,創(chuàng)作、挑選、猜測(cè)、發(fā)現(xiàn)等能力,每個(gè)小分類有不同的權(quán)重。
2017年,根據(jù)人工智能的發(fā)展和對(duì)智能的最新研究。研究團(tuán)隊(duì)將AI通用智商評(píng)測(cè)量表從測(cè)試分類和分類權(quán)重進(jìn)行調(diào)整,主要調(diào)整的內(nèi)容增加了:1.識(shí)別動(dòng)態(tài)圖像的能力,2.情緒的識(shí)別與表達(dá)能力,3.識(shí)別敵我的能力,4.偽裝真實(shí)意圖的能力,5.實(shí)現(xiàn)移動(dòng)定位的能力,6.實(shí)現(xiàn)改造世界的能力。除此之外對(duì)常識(shí)和創(chuàng)作的測(cè)試也做了更為細(xì)化的工作。
令智能系統(tǒng)的通用智商為IQAIG,F(xiàn)Gi是二級(jí)評(píng)價(jià)指標(biāo)項(xiàng)得分,WGi是二級(jí)評(píng)價(jià)指標(biāo)項(xiàng)的權(quán)重,N是評(píng)價(jià)指標(biāo)項(xiàng)的個(gè)數(shù)。因此智能系統(tǒng)的通用智商公式如下:
3.2.智能系統(tǒng)的服務(wù)智商測(cè)試量表
目前存在大量智能系統(tǒng),例如聊天機(jī)器人,智能化的搜索引擎,智能音箱,智能手機(jī),智能汽車,智能洗衣機(jī),智能冰箱等,它們大部分是作為商品服務(wù)于人類的某一需求,這些智能系統(tǒng)可以稱為智能產(chǎn)品。
在標(biāo)準(zhǔn)智能系統(tǒng)和擴(kuò)展的馮諾依曼架構(gòu)下,提煉他們共同的智能特征,并根據(jù)不同的服務(wù)需求,形成如下智能系統(tǒng)服務(wù)智商的測(cè)試量表。在這個(gè)服務(wù)智商的測(cè)試量表中主要突出了以下幾個(gè)方面.
1.感知周圍智能系統(tǒng)和使用者身份的能力
2.與互聯(lián)網(wǎng)云端交互的能力
3.將自身內(nèi)部狀況實(shí)時(shí)顯示給使用者,出現(xiàn)故障給予支持的能力
4.按符合當(dāng)?shù)胤珊蛡惱淼赖路?wù)人類的能力
5.危險(xiǎn)情況下保護(hù)使用者和其他人的能力
6.自身能源使用和自動(dòng)補(bǔ)充的能力
智能系統(tǒng)的服務(wù)智商為IQAIS,F(xiàn)Si是二級(jí)評(píng)價(jià)指標(biāo)項(xiàng)得分,WSi是二級(jí)評(píng)價(jià)指標(biāo)項(xiàng)的權(quán)重,N是評(píng)價(jià)指標(biāo)項(xiàng)的個(gè)數(shù)。因此智能系統(tǒng)的服務(wù)智商公式如下:
作為一個(gè)智能產(chǎn)品服務(wù)智商的標(biāo)準(zhǔn)量表,為了盡量全面的覆蓋不同種類的智能產(chǎn)品,在設(shè)計(jì)智能產(chǎn)品服務(wù)智商測(cè)試量表時(shí),在測(cè)試量表中從知識(shí)的獲取,掌握,創(chuàng)新和反饋四個(gè)方面為同智能產(chǎn)品留下接口:
-
在知識(shí)的獲取分類中增加了”其他”信息輸入方式,用來(lái)評(píng)估智能產(chǎn)品在知識(shí)輸入方面的新方式。
-
在知識(shí)的掌握中,增加了“專業(yè)常識(shí)”,用來(lái)評(píng)估不同領(lǐng)域智能產(chǎn)品的專業(yè)方面技能,
-
在知識(shí)的輸出能力中,增加其他輸出能力,用來(lái)評(píng)估智能產(chǎn)品在知識(shí)輸出方面的新方式。
3.3 AI價(jià)值智商的形成方法
根據(jù)智能系統(tǒng)AI價(jià)值智商(AIVIQ)的定義,如果該智能系統(tǒng)通過(guò)出售變?yōu)楫a(chǎn)品服務(wù)于人類,令智能系統(tǒng)的服務(wù)智商為AISIQ,該智能產(chǎn)品的公開售價(jià)為P,形成智能系統(tǒng)價(jià)值智商的公式如下:
IQAIV=(IQAIS/p)*100
4.總結(jié)
通過(guò)AI三種智商認(rèn)為,智能系統(tǒng)根據(jù)不同的使用和評(píng)測(cè)目標(biāo),可以有三種不同的智能水平評(píng)測(cè)方法和由此得出的三種智商:AI通用智商,AI服務(wù)智商和AI的價(jià)值智商,其中AI的通用智商已在2014年以來(lái)的論文中進(jìn)行深入研究,也通過(guò)AI系統(tǒng)和人類的共同評(píng)測(cè),分析了谷歌,SiRi,百度等與人類通用智商的差異。
本文新提出的AI服務(wù)智商和AI的價(jià)值智商為評(píng)測(cè)智能產(chǎn)品的智能水平提供了理論分析和實(shí)現(xiàn)方法。后續(xù)工作將基于AI服務(wù)智商量表,面向具體的智能產(chǎn)品,如智能音箱,智能手機(jī),智能汽車,智能洗衣機(jī),智能電冰箱等,開展他們的AI通用智商、服務(wù)智商和AI價(jià)值智商的評(píng)測(cè)工作。
未來(lái)智能實(shí)驗(yàn)室是人工智能學(xué)家與科學(xué)院相關(guān)機(jī)構(gòu)聯(lián)合成立的人工智能,互聯(lián)網(wǎng)和腦科學(xué)交叉研究機(jī)構(gòu)。由互聯(lián)網(wǎng)進(jìn)化論作者,計(jì)算機(jī)博士劉鋒與中國(guó)科學(xué)院虛擬經(jīng)濟(jì)與數(shù)據(jù)科學(xué)研究中心石勇、劉穎教授創(chuàng)建。
未來(lái)智能實(shí)驗(yàn)室的主要工作包括:建立AI智能系統(tǒng)智商評(píng)測(cè)體系,開展世界人工智能智商評(píng)測(cè);開展互聯(lián)網(wǎng)(城市)云腦研究計(jì)劃,構(gòu)建互聯(lián)網(wǎng)(城市)云腦技術(shù)和企業(yè)圖譜,為提升企業(yè),行業(yè)與城市的智能水平服務(wù)。
-
AI
+關(guān)注
關(guān)注
87文章
31753瀏覽量
270540 -
人工智能
+關(guān)注
關(guān)注
1796文章
47818瀏覽量
240605
原文標(biāo)題:如何測(cè)量智能產(chǎn)品的AI智商水平,論AI的三種智商 |未來(lái)研究
文章出處:【微信號(hào):AItists,微信公眾號(hào):人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
高中數(shù)學(xué)公式大全
讓你在不看任何數(shù)學(xué)公式的情況下理解傅里葉分析
FOC有哪些數(shù)學(xué)公式
高等數(shù)學(xué)公式大全
![高等<b class='flag-5'>數(shù)學(xué)公式</b>大全](https://file.elecfans.com/web2/M00/49/60/pYYBAGKhtEqAOWCnAAAOwSgyQgA265.jpg)
數(shù)學(xué)公式編輯器 V3.1
數(shù)學(xué)公式幫助自動(dòng)駕駛司機(jī)規(guī)避風(fēng)險(xiǎn)
MathType7.4數(shù)學(xué)公式編輯器應(yīng)用程序免費(fèi)下載
數(shù)學(xué)公式:可幫助5G網(wǎng)絡(luò)有效共享通信頻率
由數(shù)學(xué)公式和電磁理論分析PCB產(chǎn)品的特性和原理
![由<b class='flag-5'>數(shù)學(xué)公式</b>和電磁理論分析PCB產(chǎn)品的特性和原理](https://file.elecfans.com/web1/M00/C0/CE/pIYBAF8G1fKANiAjAACPcYZdNcI150.png)
特性阻抗的數(shù)學(xué)公式和各種參數(shù)詳細(xì)概述
![特性阻抗的<b class='flag-5'>數(shù)學(xué)公式</b>和各種參數(shù)詳細(xì)概述](https://file.elecfans.com/web1/M00/CB/FC/pIYBAF-SRi2AGXySAADojXOeLrQ368.png)
基于Transformer與覆蓋注意力機(jī)制建模的手寫數(shù)學(xué)公式識(shí)別
如何在Arduino UNO上實(shí)現(xiàn)數(shù)學(xué)公式
![如何在Arduino UNO上實(shí)現(xiàn)<b class='flag-5'>數(shù)學(xué)公式</b>](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
高斯如何得到他理論的結(jié)果?聊聊高斯概率分布的數(shù)學(xué)公式
![高斯如何得到他理論的結(jié)果?聊聊高斯概率分布的<b class='flag-5'>數(shù)學(xué)公式</b>](https://file1.elecfans.com/web2/M00/8C/E0/wKgZomS0phSAaLXOAAAHxt47VEw759.jpg)
評(píng)論