“這是百度大腦歷史上最具跨越性的升級?!?/p>
近日的百度開發(fā)者大會上,百度首席技術(shù)官王海峰正式發(fā)布百度大腦5.0,并在下午的百度大腦分論壇,公布了其在AI算法、計算架構(gòu)和應(yīng)用場景各方面的新進展。
提出流式多級的截斷注意力模型SMLTA
升級后的百度大腦5.0更加強調(diào)AI技術(shù)的標準化、自動化和模塊化。
百度語音技術(shù)部高級總監(jiān)高亮介紹,識別方面,百度提出流式多級的截斷注意力模型SMLTA,這是國際上首次實現(xiàn)局部注意力建模超越整句的注意力模型,也是國際上首次實現(xiàn)在線語音大規(guī)模使用注意力模型。
SMLTA在大幅提升識別速度的同時,也提高了識別準確率。在輸入法有效產(chǎn)品相對準確率提升15%,音箱有效產(chǎn)品相對準確率提升20%。
合成方面,針對現(xiàn)階段面臨風(fēng)格遷移、音色模擬和情感擬人的三大挑戰(zhàn),百度推出語音合成技術(shù)Meitron,可以將語音中的音色、風(fēng)格、情感等要素映射到不同的子空間,在使用時,不同要素可以任意組合,靈活的控制合成語音的風(fēng)格。同時降低語言合成門檻,僅需20句話就可以制作一個人的專屬聲音。
發(fā)布針對遠場語音交互打造的芯片——百度鴻鵠芯片
對于落地應(yīng)用正在端側(cè)呈現(xiàn)出巨大需求,百度大腦語音團隊研發(fā)出一款針對遠場語音交互打造的芯片——百度鴻鵠芯片。
鴻鵠芯片的設(shè)計遵循“軟件定義芯片”的全新設(shè)計思路。該芯片采用雙核HiFi4架構(gòu),2.8M大內(nèi)存,臺積電40nm工藝,在此硬件規(guī)格上,100mw左右平均工作功耗,即可支持遠場語音交互核心的陣列信號處理和語音喚醒能力。同時,按照車規(guī)級標準打造使鴻鵠芯片可滿足極嚴格的需求,將為車載語音交互,以及智能家居等場景帶來更大想象力。鴻鵠芯片流片的同時,即實現(xiàn)了量產(chǎn)。
交互升級包含一體化人機交互系統(tǒng)和大場景物理世界交互系統(tǒng)。簡單而言,一體化人機交互系統(tǒng)是人與機器、虛擬環(huán)境的自然交互與融合,該系統(tǒng)適用于實現(xiàn)AR特效的直播、小視頻、特效小程序等場景,已應(yīng)用于百度多款視頻App。
大場景物理世界交互系統(tǒng)是將視覺定位與AR技術(shù)突破性結(jié)合,實現(xiàn)大范圍的虛擬信息與物理世界的精準疊加,從而建立起AI時代全新的交互系統(tǒng)。目前,軟硬件結(jié)合可以滿足應(yīng)用場景更高效的視覺計算,以及更低延時的體驗,同時能保護數(shù)據(jù)隱私。百度視覺方面的軟硬件結(jié)合主要聚焦于模型壓縮平臺PaddleSlim、多模態(tài)FaceID開發(fā)組件以及軟硬件一體解決方案AI相機三部分。FaceID覆蓋設(shè)備量已超1200萬臺。
視覺語義化平臺更新至2.0
視覺語義化平臺2.0更新了許多先進的感知技術(shù),也讓機器人技術(shù)實現(xiàn)新突破。
百度三維視覺首席科學(xué)家楊睿剛介紹,機器人就是一個智能體,除了感知技術(shù),智能體需要決策和動作相關(guān)的技術(shù),實現(xiàn)從環(huán)境感知到主動感知。目前,百度研究的智能體技術(shù)主要集中在自動駕駛Apollo、工程機械和服務(wù)機器人三大方面。
上午主論壇中王海峰現(xiàn)場與一只機械臂“茶博士”進行了互動對話,還完成了傳統(tǒng)的長嘴壺倒茶工作,其背后依靠的正是服務(wù)機器人方案。
基于百度3D視覺,機器人可以對茶杯的位置進行檢測和追蹤。通過機器人運動規(guī)劃和控制,機械臂可以對工作空間進行碰撞檢測,避開障礙物;實時規(guī)劃運動后,可自動生成倒茶軌跡;隨后,感知水流變化,,王海峰在演示過程中故意改變了茶杯位置,茶博士也準確識別出了相關(guān)位置并成功續(xù)茶。
迎接5G時代,發(fā)布新一代AI計算架構(gòu)
百度大腦5.0不僅包含算法層面創(chuàng)新,在算力方面也實現(xiàn)重大突破。近年來,算法對算力需求增長近300,000倍,而芯片的計算性能僅提升30倍,兩者之間存在巨大鴻溝。
百度副總裁侯震宇為現(xiàn)場觀眾分享了百度新一代AI計算架構(gòu)。面對AI計算的挑戰(zhàn),需要能夠從端到端來提供AI計算能力,這要求計算系統(tǒng)從舊有的對海量數(shù)據(jù)處理能力、對IO高峰值的追求,轉(zhuǎn)變?yōu)闈M足AI訓(xùn)練功能方面IO密集、計算密集、通信密集的需求,和AI推理功能方面大吞吐和低延遲的需求。
侯震宇認為,面對即將到來的AI+5G時代,計算將無處不在。真正的計算會發(fā)生在設(shè)備(Device)、邊緣(Edge)和云(Cloud)中,因而D-E-C場景將會是接下來需要重點研究的問題;與此同時,包括芯片之間、系統(tǒng)之間、設(shè)備之間的互相連接,將幫助不同場景中的計算連接在一起,產(chǎn)生更大的計算力。
-
芯片
+關(guān)注
關(guān)注
457文章
51285瀏覽量
427852 -
百度
+關(guān)注
關(guān)注
9文章
2286瀏覽量
90818 -
人工智能
+關(guān)注
關(guān)注
1796文章
47811瀏覽量
240593 -
智能語音
+關(guān)注
關(guān)注
10文章
789瀏覽量
48927
原文標題:百度大腦5.0實現(xiàn)史上最大升級,發(fā)布遠場語音交互芯片“鴻鵠”
文章出處:【微信號:BigDataDigest,微信公眾號:大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
百度進軍短劇領(lǐng)域,計劃全面升級平臺
百度Apollo開放平臺10.0正式發(fā)布
百度小度將發(fā)布AI智能眼鏡
百度智能云發(fā)布千帆大模型平臺3.0
百度百舸AI計算平臺4.0震撼發(fā)布
百度文心一言APP升級為文小言
百度智能云升級3款大模型應(yīng)用:面向三類場景打造企業(yè)“超級員工”
2024百度移動生態(tài)萬象大會:百度新搜索11%內(nèi)容已AI生成
百度大腦EdgeBoard介紹
![<b class='flag-5'>百度</b><b class='flag-5'>大腦</b>EdgeBoard介紹](https://file1.elecfans.com/web2/M00/E5/B6/wKgZomZEHLuAZ0EXAAtSp5E5sVk310.png)
百度地圖發(fā)布2024五一出行大數(shù)據(jù),守護14億人假期平安出行
![<b class='flag-5'>百度</b>地圖<b class='flag-5'>發(fā)布</b>2024五一出行大數(shù)據(jù),守護14億人假期平安出行](https://file1.elecfans.com/web2/M00/E3/20/wKgZomY8KROACsyXAAAb9wF-zpw949.jpg)
百度智能云正式發(fā)布了《百度智能云水業(yè)大模型白皮書》
![<b class='flag-5'>百度</b>智能云正式<b class='flag-5'>發(fā)布</b>了《<b class='flag-5'>百度</b>智能云水業(yè)大模型白皮書》](https://file1.elecfans.com/web2/M00/C7/10/wKgaomYGGCWAfCHKAAAgH1pKxgI163.jpg)
評論