日前,加州大學(xué)的研究人員攜手英偉達(dá),共同推出了一款創(chuàng)新的視覺(jué)語(yǔ)言模型——NaVILA。該模型在機(jī)器人導(dǎo)航領(lǐng)域展現(xiàn)出了獨(dú)特的應(yīng)用潛力,為智能機(jī)器人的自主導(dǎo)航提供了一種全新的解決方案。
視覺(jué)語(yǔ)言模型(VLM)是一種具備多模態(tài)生成能力的先進(jìn)AI模型。它能夠智能地處理文本、圖像以及視頻等多種提示,并通過(guò)復(fù)雜的推理過(guò)程,實(shí)現(xiàn)對(duì)這些信息的準(zhǔn)確理解和應(yīng)用。NaVILA正是基于這一原理,通過(guò)將大型語(yǔ)言模型(LLM)與視覺(jué)編碼器進(jìn)行巧妙的結(jié)合,從而賦予了LLM“視覺(jué)感知”的神奇能力。
這一創(chuàng)新性的結(jié)合,使得NaVILA在機(jī)器人導(dǎo)航領(lǐng)域展現(xiàn)出了卓越的性能。它能夠根據(jù)環(huán)境中的視覺(jué)信息,結(jié)合文本指令或描述,為機(jī)器人提供精確的定位和導(dǎo)航服務(wù)。這一特性不僅提高了機(jī)器人的自主性和智能化水平,還為機(jī)器人在復(fù)雜環(huán)境中的應(yīng)用提供了更加廣闊的空間。
NaVILA的發(fā)布,標(biāo)志著視覺(jué)語(yǔ)言模型在機(jī)器人導(dǎo)航領(lǐng)域取得了重要的突破。未來(lái),隨著技術(shù)的不斷發(fā)展和完善,相信NaVILA將在更多領(lǐng)域展現(xiàn)出其獨(dú)特的價(jià)值和潛力,為人工智能技術(shù)的發(fā)展和應(yīng)用貢獻(xiàn)更多的力量。
-
機(jī)器人
+關(guān)注
關(guān)注
211文章
28704瀏覽量
208683 -
語(yǔ)言模型
+關(guān)注
關(guān)注
0文章
542瀏覽量
10344 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3854瀏覽量
92076
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
英偉達(dá)發(fā)布Nemotron-CC大型AI訓(xùn)練數(shù)據(jù)庫(kù)
![](https://file1.elecfans.com/web2/M00/0D/02/wKgaomc-_buARYR2AAhbUXNDvI4536.png)
加速拋棄英偉達(dá),微軟又發(fā)布一顆芯片 #微軟 #英偉達(dá) #半導(dǎo)體 #芯片 #電路知識(shí)
英偉達(dá)Blackwell可支持10萬(wàn)億參數(shù)模型AI訓(xùn)練,實(shí)時(shí)大語(yǔ)言模型推理
英偉達(dá)推出Eagle系列模型
英偉達(dá)推出Flextron AI框架:賦能靈活高效的AI模型部署
商湯科技與泰國(guó)DTGO集團(tuán)聯(lián)合發(fā)布泰語(yǔ)大模型
![商湯科技與泰國(guó)DTGO集團(tuán)<b class='flag-5'>聯(lián)合發(fā)布</b>泰語(yǔ)大<b class='flag-5'>模型</b>](https://file1.elecfans.com/web2/M00/FB/37/wKgZomaPyROAGWE1AAAXGOA2rIs380.jpg)
谷歌發(fā)布新型大語(yǔ)言模型Gemma 2
英偉達(dá)開(kāi)源Nemotron-4 340B系列模型,助力大型語(yǔ)言模型訓(xùn)練
中山大學(xué)中山眼科中心與華為聯(lián)合發(fā)布ChatZOC眼科大模型
英偉達(dá)推出AI模型推理服務(wù)NVIDIA NIM
奧比中光英偉達(dá)聯(lián)辦3D視覺(jué)創(chuàng)新應(yīng)用競(jìng)賽圓滿收官
![奧比中光<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>聯(lián)辦3D<b class='flag-5'>視覺(jué)</b>創(chuàng)新應(yīng)用競(jìng)賽圓滿收官](https://file1.elecfans.com/web2/M00/EA/53/wKgZomZX2LCAf1bTAAA3Vw7LSc0414.png)
評(píng)論