致力于開發(fā)AI工作負(fù)載加速器的英國公司Graphcore今天上午宣布了一個(gè)里程碑: 其智能處理單元(IPU)已在Azure上啟動(dòng)。 這標(biāo)志著微軟等大型云供應(yīng)商首次公開提供對(duì)Graphcore芯片的支持。
Graphcore說,Azure上的IPU向客戶開放,優(yōu)先授權(quán)那些“專注于[自然語言處理]的邊界”和“在機(jī)器智能方面取得新突破”的用戶。
資料顯示,Graphcore(由Simon Knowles和Nigel Toon于2016年創(chuàng)立)迄今已從Robert Bosch Venture Capital,三星,Amadeus Capital Partners,C4 Ventures,Draper Esprit,F(xiàn)oundation Capital,Pitango Capital和人工智能使ARM聯(lián)合創(chuàng)始人Hermann Hauser和DeepMind聯(lián)合創(chuàng)始人Demis Hassabis處獲得了投資,公司的估值也達(dá)到15億美元。 他們的第一個(gè)商業(yè)產(chǎn)品是16納米PCI Express卡(C2),該卡將于2018年面世,而該軟件包也同樣將在Azure上發(fā)布。
“微軟與Graphcore緊密合作了兩年多。 在此期間,由杰出工程師Marc Tremblay領(lǐng)導(dǎo)的Microsoft團(tuán)隊(duì)一直在開發(fā)Azure的系統(tǒng),并一直在IPU上增強(qiáng)高級(jí)機(jī)器視覺和自然語言處理模型,” Toon說。 “一段時(shí)間以來,我們一直在與許多領(lǐng)先的搶先體驗(yàn)客戶和合作伙伴進(jìn)行廣泛合作,以確保[這些產(chǎn)品]可以面向公眾發(fā)布。 ”
C2具有兩個(gè)互連的Colossus IPU,每個(gè)都包含16個(gè)內(nèi)核和236億個(gè)晶體管。 單個(gè)芯片的1,216個(gè)IPU可以與每個(gè)300核內(nèi)存配對(duì),, 可達(dá)到每個(gè)內(nèi)核100 GFLOPS(其中一個(gè)GFLOP等于每秒十億個(gè)浮點(diǎn)運(yùn)算)的運(yùn)算能力,并可以運(yùn)行多達(dá)10,000個(gè)程序。 其中,每芯片的內(nèi)存帶寬為45TB / s,這就使得使C2的全卡帶寬為90TB / s 。 Graphcore聲稱,理論上的最大數(shù)據(jù)量比HBM2圖形芯片的100倍。
C2旨在與Graphcore定制的Poplar(一種用于AI和機(jī)器學(xué)習(xí)的圖形工具鏈)配合使用。 它與Google的TensoRFlow框架和Open Neural Network Exchange(可互換AI模型的生態(tài)系統(tǒng))集成在一起。 據(jù)預(yù)計(jì),到2019年第四季,他們將實(shí)現(xiàn)與Facebook PyTorch的初步兼容性,而全部的功能支持將在2020年初到來。
為了證明IPU的效率,Graphcore說它和Microsoft開發(fā)人員通過Google的Transformers雙向編碼器表示(BERT)語言模型實(shí)現(xiàn)了最先進(jìn)的性能和準(zhǔn)確性,該語言模型通過預(yù)先訓(xùn)練句子之間的關(guān)系來學(xué)習(xí)句子之間的關(guān)系。 他們用一臺(tái)裝有八張C2卡的IPU服務(wù)器在56小時(shí)內(nèi)訓(xùn)練了一個(gè)BERT變種(BERT Base),他們聲稱客戶的推理吞吐量平均提高了3倍,延遲提高了20%以上。
微軟技術(shù)研究員道格·伯格(Doug Burger)說: “自然語言處理模型對(duì)Microsoft極為重要。 在Azure上運(yùn)行我們內(nèi)部的AI工作負(fù)載和同時(shí)為AI客戶服務(wù)。 ” “我們對(duì)與Graphcore處理器上的新合作將為我們的客戶帶來的巨大潛力性感到非常興奮。 Graphcore產(chǎn)品擴(kuò)展了Azure的功能,我們?cè)诖怂龅呐κ谴_保Azure仍然是AI最佳云的策略的一部分。 ”
在等式的圖像識(shí)別方面,Graphcore表示,歐洲搜索引擎Qwant設(shè)法在IPU上運(yùn)行Facebook的模塊化ResNext架構(gòu)而獲得了收益。 正如Graphcore解釋的那樣,ResNext包含重復(fù)的塊,這些塊匯總了IPU“有效”支持的轉(zhuǎn)換集。 Qwant和Graphcore報(bào)告說,對(duì)于組卷積(即信號(hào)和圖像處理中的互相關(guān)聯(lián)),圖像搜索的性能提高了3.5倍,吞吐速度提高了77倍。
“我們現(xiàn)在非常高興能夠?qū)raphcore技術(shù)商業(yè)化地提供給更多的客戶,” Toon補(bǔ)充說。 “我們期待支持創(chuàng)新者實(shí)現(xiàn)IPU機(jī)器智能的下一個(gè)重大突破。 ”
Graphcore芯片在Azure上的發(fā)布是在Untether AI成立一周后進(jìn)行的。 UntetherAI是一家多倫多創(chuàng)業(yè)公司,該公司正在開發(fā)用于AI推理工作負(fù)載的高效芯片。 他們獲得了2000萬美元的風(fēng)險(xiǎn)投資。 而總部位于加利福尼亞州的Mythic亦籌集了8,520萬美元用于開發(fā)自定義內(nèi)存結(jié)構(gòu),他們預(yù)計(jì)到2025年將達(dá)到911.8億美元的市場(chǎng)中。 換而言之,Graphcore不乏毗鄰的競(jìng)爭(zhēng)對(duì)手。
總部位于舊金山的初創(chuàng)公司AI Storm今年早些時(shí)候?yàn)槠銩I邊緣計(jì)算芯片系列完成了1320萬美元的融資,總部位于山景城的Flex Logix于4月推出了推理協(xié)處理器,該處理器聲稱其吞吐量可達(dá)到現(xiàn)有芯片的10倍。 另一個(gè)競(jìng)爭(zhēng)對(duì)手Xnor.ai最近推出了一款始終在線的太陽能供電設(shè)備,該設(shè)備能夠加速最新的機(jī)器學(xué)習(xí)算法。 去年11月,世界語科技公司(Esperanto Technologies)為其7納米AI芯片技術(shù)籌集了5800萬美元。
Graphcore今天還宣布,其IPU已與Dell服務(wù)器機(jī)架技術(shù)集成在一起,這意味著企業(yè)客戶將能夠在自己的場(chǎng)所構(gòu)建機(jī)器智能計(jì)算。 更多細(xì)節(jié)將在下周在丹佛舉行的超級(jí)計(jì)算會(huì)議上宣布。
-
微軟
+關(guān)注
關(guān)注
4文章
6635瀏覽量
104539 -
IPU
+關(guān)注
關(guān)注
0文章
34瀏覽量
15602
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
諾基亞擴(kuò)展與微軟Azure的數(shù)據(jù)中心網(wǎng)絡(luò)供應(yīng)協(xié)議
德賽西威為smart#5提供IPU04P智能駕駛域控制器
微軟Azure首獲英偉達(dá)GB200 AI服務(wù)器
智譜AI宣布GLM-4-Flash大模型免費(fèi)開放
Palantir計(jì)劃在微軟Azure平臺(tái)上部署其人工智能產(chǎn)品
微軟宣布將逐步淘汰Azure數(shù)據(jù)資源管理器的虛擬網(wǎng)絡(luò)注入功能
軟銀擬4億英鎊收購Graphcore,拓展半導(dǎo)體版圖
軟銀擬巨資收購Graphcore,英國政府審查成關(guān)鍵
微軟Azure云部門裁員數(shù)千人
Napatech IPU解決方案助力優(yōu)化數(shù)據(jù)中心存儲(chǔ)工作負(fù)載
![Napatech <b class='flag-5'>IPU</b>解決方案助力優(yōu)化數(shù)據(jù)中心存儲(chǔ)工作負(fù)載](https://file1.elecfans.com/web2/M00/EA/11/wKgZomZWpmiAXLkpAAAf50w5e8E162.png)
評(píng)論