IBM Research 稱(chēng),已經(jīng)開(kāi)發(fā)出了一種內(nèi)存計(jì)算新方法,可以為微軟和谷歌尋求的高性能和機(jī)器學(xué)習(xí)應(yīng)用的硬件加速器提供答案。
在近日 Nature Electronics 期刊上發(fā)表的一篇論文中,IBM 研究人員描述了這種新的 “混合精度內(nèi)存計(jì)算” 方法。
IBM 關(guān)注傳統(tǒng)計(jì)算體系結(jié)構(gòu)的不同看法,在這種體系結(jié)構(gòu)中,軟件需要在單獨(dú)的 CPU 和 RAM 單元之間進(jìn)行數(shù)據(jù)傳輸。
據(jù) IBM 稱(chēng),這種被稱(chēng)為 “馮·諾依曼” 的體系結(jié)構(gòu)設(shè)計(jì),為數(shù)據(jù)分析和機(jī)器學(xué)習(xí)應(yīng)用制造了一個(gè)瓶頸,這些應(yīng)用需要在處理單元和內(nèi)存單元之間進(jìn)行更大的數(shù)據(jù)傳輸。傳輸數(shù)據(jù)也是一個(gè)耗能的過(guò)程。
應(yīng)對(duì)這一挑戰(zhàn),IBM 給出的一種方法是模擬相變內(nèi)存(PCM)芯片,該芯片目前還處于原型階段,500 萬(wàn)個(gè)納米級(jí) PCM 器件組成 500×2000 交叉陣列。
PCM 的一個(gè)關(guān)鍵優(yōu)勢(shì)是可以處理大多數(shù)密集型數(shù)據(jù)處理,而無(wú)需將數(shù)據(jù)傳輸?shù)?CPU 或 GPU,這樣以更低的能量開(kāi)銷(xiāo)實(shí)現(xiàn)更快速的處理。
IBM 的 PCM 單元將作為 CPU 加速器,就像微軟用于加速 Bing 和加強(qiáng)機(jī)器學(xué)習(xí)的 FPGA 芯片一樣。
據(jù) IBM 稱(chēng),研究表明在某些情況下,其 PCM 芯片能夠以模擬的方式進(jìn)行操作,執(zhí)行計(jì)算任務(wù),并提供與 4 位 FPGA 存儲(chǔ)器芯片相當(dāng)?shù)臏?zhǔn)確度,但能耗降低了 80 倍。
模擬 PCM 硬件并不適合高精度計(jì)算。所幸的是,數(shù)字型 CPU 和 GPU 是適合的,IBM 認(rèn)為混合架構(gòu)可以實(shí)現(xiàn)更高性能、更高效率和更高精度的平衡。
這種設(shè)計(jì)將大部分處理留給內(nèi)存,然后將較輕的負(fù)載交給 CPU 進(jìn)行一系列的精度修正。
根據(jù) IBM 蘇黎世實(shí)驗(yàn)室的電氣工程師、也是該論文的主要作者 Manuel Le Gallo 稱(chēng),這種設(shè)計(jì)有助于云中的認(rèn)知計(jì)算,有助于釋放對(duì)高性能計(jì)算機(jī)的訪(fǎng)問(wèn)。
Le Gallo 表示:“憑借我們現(xiàn)在的精確度,我們可以將能耗降低到是使用高精度 GPU 和 CPU 的 1/6?!?/p>
“所以我們的想法是,為了應(yīng)對(duì)模擬計(jì)算中的不精確性,我們將其與標(biāo)準(zhǔn)處理器結(jié)合起來(lái)。我們要做的是將大量計(jì)算任務(wù)轉(zhuǎn)移到 PCM 中,但同時(shí)得到最終的結(jié)果是精確的?!?/p>
這種技術(shù)更適合于如數(shù)字圖像識(shí)別等應(yīng)用,其中誤解少數(shù)像素并不會(huì)妨礙整體識(shí)別,此外還有一些醫(yī)療應(yīng)用。
“你可以用低精度完成大量計(jì)算——以模擬的方式,PCM 會(huì)非常節(jié)能——然后使用傳統(tǒng)處理器來(lái)提高精度?!?/p>
對(duì)于只有 1 兆字節(jié)大小的 IBM 原型內(nèi)存芯片,現(xiàn)在還處于初期階段。為了適用于現(xiàn)代數(shù)據(jù)中心的規(guī)?;瘧?yīng)用,它需要達(dá)到千兆字節(jié)的內(nèi)存量級(jí),分布在數(shù)萬(wàn)億個(gè) PCM 中。
盡管如此,IBM 認(rèn)為可以通過(guò)構(gòu)建更大規(guī)模的 PCM 設(shè)備或使其中 PCM 并行運(yùn)行來(lái)實(shí)現(xiàn)這一目標(biāo)。
-
IBM
+關(guān)注
關(guān)注
3文章
1769瀏覽量
74882 -
cpu
+關(guān)注
關(guān)注
68文章
10911瀏覽量
213151 -
gpu
+關(guān)注
關(guān)注
28文章
4788瀏覽量
129431
原文標(biāo)題:IBM 取得內(nèi)存計(jì)算新突破,AI 訓(xùn)練能耗降低 80 倍
文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
ADS1248一旦配置Burnout Current,檢測(cè)到的值精度降低了很多,為什么?
為什么隔離ADC的采樣頻率可以如此顯著的提高?但是帶寬反而降低了?
虛擬內(nèi)存和云計(jì)算的關(guān)系
虛擬內(nèi)存對(duì)計(jì)算機(jī)性能的影響
AMD Alveo V80計(jì)算加速器網(wǎng)絡(luò)研討會(huì)
是什么原因降低了INA116的輸入阻抗?
淺析如何降低數(shù)據(jù)中心電力能耗
![淺析如何<b class='flag-5'>降低</b>數(shù)據(jù)中心電力<b class='flag-5'>能耗</b>](https://file1.elecfans.com//web2/M00/05/D1/wKgaombVP4qAbCVGAAGicqyiOHM264.jpg)
IBM與日本AIST攜手,共創(chuàng)量子計(jì)算新紀(jì)元
淺析物聯(lián)網(wǎng)環(huán)境下小麥加工過(guò)程能耗監(jiān)測(cè)系統(tǒng)設(shè)計(jì)
![淺析物聯(lián)網(wǎng)環(huán)境下小麥加工過(guò)程<b class='flag-5'>能耗</b>監(jiān)測(cè)系統(tǒng)設(shè)計(jì)](https://file1.elecfans.com//web2/M00/EB/94/wKgZomZeuriAPN30AAiMB2B1OoU850.png)
高性能計(jì)算集群的能耗優(yōu)化
![高性能<b class='flag-5'>計(jì)算</b>集群的<b class='flag-5'>能耗</b>優(yōu)化](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
借助全新 AMD Alveo? V80 計(jì)算加速卡釋放計(jì)算能力
![借助全新 AMD Alveo? V<b class='flag-5'>80</b> <b class='flag-5'>計(jì)算</b>加速卡釋放<b class='flag-5'>計(jì)算</b>能力](https://file1.elecfans.com/web2/M00/E6/DA/wKgaomZFo1aAbF-gAAV64asQSn0097.png)
評(píng)論