本文由半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)編譯自quantamagazine
光學(xué)神經(jīng)網(wǎng)絡(luò)使用光子而不是電子,比傳統(tǒng)系統(tǒng)具有優(yōu)勢。摩爾定律已經(jīng)相當(dāng)快了。它認(rèn)為,計(jì)算機(jī)芯片每兩年左右就會安裝兩倍數(shù)量的晶體管,從而在速度和效率上產(chǎn)生重大飛躍。但深度學(xué)習(xí)時代的計(jì)算需求增長速度甚至更快——這種速度可能不可持續(xù)。國際能源署預(yù)測,2026年人工智能消耗的電力將是2023年的10倍。計(jì)算硬件公司Lightmatter的創(chuàng)始人兼首席執(zhí)行官尼克·哈里斯 (Nick Harris)表示,人工智能所需的算力每3個月就會翻一番,速度遠(yuǎn)遠(yuǎn)快于摩爾定律的預(yù)測。最有前途的方法之一是不使用可靠的電子來處理信息,而是使用光子流。最近的結(jié)果表明,對于現(xiàn)代人工智能的某些基礎(chǔ)計(jì)算任務(wù),基于光的“光學(xué)計(jì)算機(jī)”可能具有優(yōu)勢。劍橋大學(xué)物理學(xué)家納塔利婭·貝爾洛夫表示,光計(jì)算的發(fā)展“為人工智能等需要高速、高效處理的領(lǐng)域的突破鋪平了道路” 。
理論上,光提供了誘人的潛在好處。其一,光信號比電信號可以攜帶更多信息——它們有更多的帶寬。光頻率也比電頻率高得多,因此光系統(tǒng)可以在更短的時間內(nèi)以更少的延遲運(yùn)行更多的計(jì)算步驟。然后是效率問題。除了相對浪費(fèi)的電子芯片造成的環(huán)境和經(jīng)濟(jì)成本之外,它們的運(yùn)行溫度也非常高,以至于只有一小部分晶體管(所有計(jì)算機(jī)核心的微小開關(guān))可以隨時處于活動狀態(tài)。理論上,光學(xué)計(jì)算機(jī)可以同時進(jìn)行更多操作,在消耗更少能源的同時處理更多數(shù)據(jù)。斯坦福大學(xué)電氣工程師戈登·韋茨斯坦(Gordon Wetzstein ) 表示,“如果我們能夠利用”這些優(yōu)勢,“這將帶來許多新的可能性?!笨吹綕撛诘膬?yōu)勢,研究人員長期以來一直嘗試將光用于人工智能這個計(jì)算需求量很大的領(lǐng)域。例如,在 20 世紀(jì) 80 年代和 90 年代,研究人員使用光學(xué)系統(tǒng)構(gòu)建了一些最早的神經(jīng)網(wǎng)絡(luò)。Demetri Psaltis 和加州理工學(xué)院的兩名同事使用這些早期光學(xué)神經(jīng)網(wǎng)絡(luò) (ONN) 之一創(chuàng)建了一個巧妙的面部識別系統(tǒng)。他們將一個受試者(實(shí)際上是研究人員之一)的圖像作為全息圖存儲在光折變晶體中。研究人員使用全息圖來訓(xùn)練 ONN,然后 ONN 可以識別研究人員的新圖像并將他與同事區(qū)分開來。但光也有缺點(diǎn),光子通常不會相互作用,因此一個輸入信號很難控制另一個信號,而這正是普通晶體管的優(yōu)勢?,F(xiàn)在,它們已被放置在數(shù)十億枚硬幣大小的芯片上,這是數(shù)十年漸進(jìn)式改進(jìn)的產(chǎn)物。
近年來,研究人員發(fā)現(xiàn)了光學(xué)計(jì)算的殺手級應(yīng)用:矩陣乘法。
一些簡單的數(shù)學(xué)
矩陣或數(shù)字?jǐn)?shù)組相乘的過程是大量重型計(jì)算的基礎(chǔ)。具體來說,在神經(jīng)網(wǎng)絡(luò)中,矩陣乘法是如何在舊數(shù)據(jù)上訓(xùn)練網(wǎng)絡(luò)以及如何在經(jīng)過訓(xùn)練的網(wǎng)絡(luò)中處理新數(shù)據(jù)的基本步驟。光可能是比電更好的矩陣乘法媒介。
這種人工智能計(jì)算方法在 2017 年爆發(fā),當(dāng)時麻省理工學(xué)院的 Dirk Englund 和 Marin Solja?i? 領(lǐng)導(dǎo)的團(tuán)隊(duì)描述了如何在硅芯片上構(gòu)建光學(xué)神經(jīng)網(wǎng)絡(luò)。研究人員將他們想要相乘的各種量編碼成光束,然后將光束發(fā)送通過一系列改變光束相位(光波振蕩方式)的組件,每個相位改變代表一個乘法步驟。通過反復(fù)分裂光束、改變相位、重新組合,可以使光有效地進(jìn)行矩陣乘法。在芯片的末端,研究人員放置了光電探測器來測量光束并揭示結(jié)果。研究人員教他們的實(shí)驗(yàn)設(shè)備識別口語元音,這是神經(jīng)網(wǎng)絡(luò)的常見基準(zhǔn)任務(wù)。憑借光的優(yōu)勢,它可以比電子設(shè)備更快、更有效地完成這一任務(wù)。其他研究人員已經(jīng)知道光有利于矩陣乘法;2017 年的論文展示了如何將其付諸實(shí)踐。
康奈爾大學(xué)光子學(xué)專家Peter McMahon表示,這項(xiàng)研究“激起了人們對 ONN 的巨大興趣,那個人影響力非常大。”
聰明的想法
自 2017 年發(fā)表論文以來,隨著各種研究人員提出了新型光學(xué)計(jì)算機(jī),該領(lǐng)域取得了穩(wěn)步進(jìn)展。Englund 和幾位合作者最近推出了一種名為 HITOP 的新型光網(wǎng)絡(luò),該網(wǎng)絡(luò)結(jié)合了多項(xiàng)先進(jìn)技術(shù)。最重要的是,它的目標(biāo)是隨著時間、空間和波長的增加計(jì)算吞吐量。前麻省理工學(xué)院博士后、現(xiàn)任職于南加州大學(xué)的Zaijun Chen表示,這有助于 HITOP 克服光學(xué)神經(jīng)網(wǎng)絡(luò)的缺點(diǎn)之一:將數(shù)據(jù)從電子元件傳輸?shù)焦鈱W(xué)元件需要大量能量,反之亦然。但Zaijun Chen說,通過將信息打包到光的三個維度中,它可以更快地通過 ONN 推送更多數(shù)據(jù),并將能源成本分散到許多計(jì)算中。這降低了每次計(jì)算的成本。研究人員報告說,HITOP 可以運(yùn)行比以前基于芯片的 ONN 大 25,000 倍的機(jī)器學(xué)習(xí)模型。
需要明確的是,該系統(tǒng)仍遠(yuǎn)不能與其電子前輩相媲美。Chen表示,HITOP 每秒執(zhí)行約 1 萬億次運(yùn)算,而先進(jìn)的 Nvidia 芯片可以處理 300 倍的數(shù)據(jù),他希望擴(kuò)大該技術(shù)的規(guī)模,使其更具競爭力。但光學(xué)芯片的效率卻非常引人注目。“這里的游戲是我們將能源成本降低了 1,000 倍,”Chen說。其他小組已經(jīng)創(chuàng)建了具有不同優(yōu)勢的光學(xué)計(jì)算機(jī)。去年,賓夕法尼亞大學(xué)的一個團(tuán)隊(duì)描述了一種新型 ONN,它提供了不同尋常的靈活性。這種基于芯片的系統(tǒng)將激光照射到構(gòu)成電子芯片的半導(dǎo)體部分上,從而改變半導(dǎo)體的光學(xué)特性。激光有效地映射了光信號的路徑,從而完成了它執(zhí)行的計(jì)算。這使得研究人員可以輕松地重新配置系統(tǒng)的功能。這與大多數(shù)其他基于芯片的系統(tǒng)(光學(xué)和電子系統(tǒng))有著明顯的區(qū)別,在這些系統(tǒng)中,路線是在制造工廠中仔細(xì)制定的,并且很難改變。該研究的主要作者吳天偉說:“我們所擁有的東西非常簡單。我們可以重新編程,動態(tài)改變激光圖案?!毖芯咳藛T利用該系統(tǒng)設(shè)計(jì)了一個成功區(qū)分元音的神經(jīng)網(wǎng)絡(luò)。大多數(shù)光子系統(tǒng)在構(gòu)建之前都需要進(jìn)行訓(xùn)練,因?yàn)橛?xùn)練必然涉及重新配置連接。但由于該系統(tǒng)很容易重新配置,研究人員在將模型安裝到半導(dǎo)體上后對其進(jìn)行了訓(xùn)練。他們現(xiàn)在計(jì)劃增加芯片的尺寸,并用不同顏色的光編碼更多信息,這應(yīng)該會增加它可以處理的數(shù)據(jù)量。
即使是在 90 年代創(chuàng)建面部識別系統(tǒng)的 Psaltis 也對這一進(jìn)步感到印象深刻。“與實(shí)際發(fā)生的事情相比,我們 40 年前最瘋狂的夢想顯得非常渺小。”
第一縷曙光
雖然光學(xué)計(jì)算在過去幾年中發(fā)展迅速,但它還遠(yuǎn)未取代實(shí)驗(yàn)室外運(yùn)行神經(jīng)網(wǎng)絡(luò)的電子芯片。論文宣布光子系統(tǒng)比電子系統(tǒng)效果更好,但它們通常使用舊的網(wǎng)絡(luò)設(shè)計(jì)和較小的工作負(fù)載來運(yùn)行小型模型。安大略省皇后大學(xué)的 Bhavin Shastri 表示,許多關(guān)于光子霸權(quán)的報道數(shù)據(jù)并沒有說明全部情況?!昂茈y與電子產(chǎn)品進(jìn)行同類比較,”他說:“例如,當(dāng)他們使用激光時,他們并沒有真正談?wù)摓榧す?a target="_blank">供電的能量。”
實(shí)驗(yàn)室系統(tǒng)需要擴(kuò)大規(guī)模才能顯示出競爭優(yōu)勢。Bhavin Shastri 問道:“要把它做大到什么程度才能獲勝?”答案是:非常大。這就是為什么沒有人能與英偉達(dá)制造的芯片相媲美,英偉達(dá)的芯片為當(dāng)今許多最先進(jìn)的人工智能系統(tǒng)提供動力。在此過程中,需要解決大量的工程難題——電子方面已經(jīng)解決了幾十年的問題。麥克馬洪說:“電子領(lǐng)域從一開始就具有巨大的優(yōu)勢?!币恍┭芯咳藛T認(rèn)為,基于 ONN 的人工智能系統(tǒng)將首先在提供獨(dú)特優(yōu)勢的專業(yè)應(yīng)用中取得成功。Shastri 表示,一種有前途的用途是抵消不同無線傳輸之間的干擾,例如 5G 蜂窩塔和幫助飛機(jī)導(dǎo)航的雷達(dá)高度計(jì)。今年年初,Shastri 和幾位同事創(chuàng)建了一個 ONN,可以整理不同的傳輸并實(shí)時挑選出感興趣的信號,處理延遲低于 15 皮秒(15 萬億分之一秒)——不到千分之一電子系統(tǒng)所花費(fèi)的時間,同時使用不到 1/70 的功率。
但Bhavin Shastri 表示,宏偉的愿景——一種可以超越通用電子系統(tǒng)的光學(xué)神經(jīng)網(wǎng)絡(luò)——仍然值得追求。去年,他的團(tuán)隊(duì)進(jìn)行的模擬顯示,十年內(nèi),足夠大的光學(xué)系統(tǒng)可以使某些人工智能模型的效率比未來電子系統(tǒng)的效率提高 1000 倍以上?!艾F(xiàn)在很多公司都在努力爭取1.5倍的收益。一千倍的好處,那就太神奇了?!彼f:“如果成功的話,這可能是一個為期 10 年的項(xiàng)目?!?/p>
-
人工智能
+關(guān)注
關(guān)注
1796文章
47818瀏覽量
240597 -
光芯片
+關(guān)注
關(guān)注
3文章
96瀏覽量
10967 -
計(jì)算機(jī)芯片
+關(guān)注
關(guān)注
0文章
43瀏覽量
3561
發(fā)布評論請先 登錄
相關(guān)推薦
人工智能發(fā)展需要新的芯片技術(shù)
![<b class='flag-5'>人工智能</b>發(fā)展<b class='flag-5'>需要</b>新的<b class='flag-5'>芯片</b>技術(shù)](https://file1.elecfans.com/web3/M00/01/6E/wKgZO2dTq_OAKFdgAAAU53HW370553.jpg)
嵌入式和人工智能究竟是什么關(guān)系?
人工智能云計(jì)算大數(shù)據(jù)三者關(guān)系
Orin芯片在人工智能中的應(yīng)用
《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感
AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感
《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得
人工智能云計(jì)算是什么
risc-v在人工智能圖像處理應(yīng)用前景分析
名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新
FPGA在人工智能中的應(yīng)用有哪些?
2024年十大頂尖的人工智能芯片制造供應(yīng)商
![2024年十大頂尖的<b class='flag-5'>人工智能</b><b class='flag-5'>芯片</b>制造供應(yīng)商](https://file1.elecfans.com/web2/M00/E7/D3/wKgaomZJnDyABPN2AAAoeqFY44s340.png)
5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)
人工智能芯片封裝新篇章:先進(jìn)技術(shù)的領(lǐng)航者
![<b class='flag-5'>人工智能</b><b class='flag-5'>芯片</b>封裝新篇章:先進(jìn)技術(shù)的領(lǐng)航者](https://file1.elecfans.com/web2/M00/C5/2A/wKgaomXyVGOASo8AAABXHZ5OXIo181.png)
評論