近日,Nature刊載IBM新研究,使用光學器件打造的“全光學”深度神經網絡可以比傳統(tǒng)計算方式的能效更高,同時具備可擴展性、無需光電轉換和高帶寬等優(yōu)勢。這一發(fā)現(xiàn)可能給未來光學神經網絡加速器的出現(xiàn)打下基礎。
光纖能夠以光的形式在世界范圍內傳輸數據,成為現(xiàn)代電信技術的支柱。不過如果需要分析這些傳輸數據,要將其從光信號轉換為電子信號,然后用電子設備進行處理。曾經有一段時間,光學被認為是未來最具潛力的計算技術的基礎,但與電子計算機的快速進步相比,光學計算技術的競爭力明顯不足。
不過,在過去幾年中,業(yè)界越來越關注對計算能源的成本問題。因此,光學計算系統(tǒng)再次受到關注。光學計算的能耗低,又能作為AI算法(如深度神經網絡(DNN))的專用加速硬件。 近日,F(xiàn)eldmann等人在《自然》期刊上發(fā)表了這種“全光學網絡實現(xiàn)”的最新進展。
深度神經網絡包括多層人工神經元和人工突觸。這些連接的強度稱為網絡權重,可以是陽性,表示神經元的興奮,或陰性,表示神經元的抑制。網絡會盡力將實際輸出和期望輸出之間的差異實現(xiàn)最小化,從而改變突觸的權重,來執(zhí)行圖像識別等任務。
CPU和其他硬件加速器通常用于DNN的計算。DNN的訓練可以使用已知數據集,而經過訓練后的DNN可以用來推理任務中的未知數據。雖然計算量很大,但計算操作的多樣性不會很高,因為“乘法累加”操作在許多突觸權重和神經元激勵中占主導地位。
DNN在計算精度較低時仍能正常工作。因此,DNN網絡代表了非傳統(tǒng)計算技術的潛在機會。研究人員正在努力打造基于新型非易失性存儲器件的DNN加速器。這類設備在切斷電源時也能保存信息,通過模擬電子計算提升DNN的速度和能效。
那么,為什么不考慮使用光學器件呢?導光部件中可以包含大量數據 - 無論是用于電信的光纖還是用于光子芯片上的波導。在這種波導內部,可以使用“波分復用”技術,讓許多不同波長的光一起傳播。然后可以以與電子到光學調制和光電子檢測相關的可用帶寬限制的速率調制(以可以攜帶信息的方式改變)每個波長。
圖1 全光學脈沖神經元回路
使用諧振器可以實現(xiàn)單個波長的添加或移除,就像對貨車的裝貨和卸貨一樣。使用微米級環(huán)形諧振器可以構建DNN網絡突觸權重陣列。這種諧振器可以采用熱調制,電光調制,或通過相變材料調制。這些材料可以在非晶相和結晶相之間切換,不同的材料的吸光能力差別很大。在理想條件下,進行乘法累加運算的功耗很低。
Feldmann研究團隊在毫米級光子芯片上實現(xiàn)了“全光學神經網絡”,其中網絡內沒有使用光電轉換。輸入的數據被電子調制到不同的波長上注入網絡,但此后所有數據都保留在芯片上。利用集成相變材料實現(xiàn)突觸權重的調節(jié)和神經元的集成。
圖2 人工神經元的脈沖生成與操作
本文作者小規(guī)模地展示了有監(jiān)督和無監(jiān)督的學習 - 即使用標記數據實現(xiàn)訓練(DNN學習的方式),以及使用未標記的數據訓練(類似人類的學習方式)。
圖3 基于相變全光學神經元系統(tǒng)實現(xiàn)監(jiān)督學習和非監(jiān)督學習
因為權重表達是通過光的吸收實現(xiàn)的,所以負權重需要更大的偏置信號,該信號不能激活相變材料。一種替代方法是使用Mach-Zehnder干涉儀的裝置,將單個波導分成兩個臂,然后重新組合,這時的透射光量取決于兩個傳播路徑之間光學相位的差異。然而,要想將這種方法與波分復用相結合可能難度較大,因為每個干涉儀的臂需要為每個波長引入適當的相位差。
全光學實現(xiàn)的DNN仍然存在重大挑戰(zhàn)。在理想情況下,它們的總功率使用率可能較低,經常需要熱光功率來調節(jié)和維持每個Mach-Zehnder干涉儀臂中的光學相位差異。
圖4 全光學神經網絡的可擴展架構
此外,對注入含有相變材料的系統(tǒng)的總光功率必須仔細校準,以使材料對輸入信號的響應符合預期。盡管相變材料也可以用于調整Mach-Zehnder相位,但是材料吸收光的強度和減慢光速之間會出現(xiàn)不可避免的交叉耦合,這會增加系統(tǒng)的復雜性。
傳統(tǒng)的DNN規(guī)模已經發(fā)展到很大,可能包含數千個神經元和數百萬個突觸。但是光子網絡的波導需要彼此間隔很遠才能防止耦合,并且避免急劇彎曲以防止光離開波導。因為兩個波導的交叉可能會將不需要的功率注入錯誤路徑,這對光子芯片設計的2D特性造成了實質性的限制。
圖5 單層脈沖神經網絡的實驗實現(xiàn)
實現(xiàn)光學器件打造神經網絡需要很長的距離和很大的面積,但是每個光學結構的關鍵部分的制造需要高精度。這是因為波導和耦合區(qū)域,比如在每個微環(huán)諧振器的入口和出口處,必須達到相應網絡性能所需的精確尺寸。對于如何制造小型微環(huán)諧振器也存在諸多限制。
最后,調制技術提供的光學效應較弱,需要很長的相互作用區(qū)域,以使其對通過的光的有限影響能夠達到顯著水平。
Feldmann 團隊的研究中所取得的進步,有望推動該領域的未來發(fā)展,該研究可能會為未來高能效、可擴展的光學神經網絡加速器的出現(xiàn)打下基礎。
-
神經網絡
+關注
關注
42文章
4782瀏覽量
101216 -
神經元
+關注
關注
1文章
363瀏覽量
18515
原文標題:下一代計算架構革命,從“全光學神經網絡”開始
文章出處:【微信號:icsmart,微信公眾號:芯智訊】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論