編者按:智能汽車正在從傳統(tǒng)的“制造”到“制造+服務(wù)”模式轉(zhuǎn)變。它將連接城市和個人,在個人消費、城市管理和企業(yè)服務(wù)方面,都有著非常大的想象空間。
近日,在2021世界智能汽車大會上,商湯科技聯(lián)合創(chuàng)始人、移動智能事業(yè)群總裁王曉剛教授發(fā)表主題演講《通用智能拓展智能汽車邊界》。
他指出,通用智能不僅可以解決大量的長尾問題,還能夠不斷豐富智能汽車的應(yīng)用場景。商湯致力打造的SenseCore商湯AI大裝置,正通過超級算力和超大模型,為智能汽車構(gòu)建通用智能的能力,推動智能汽車與各個產(chǎn)業(yè)相互融合,不斷創(chuàng)新駕乘體驗。
以下為王曉剛教授演講內(nèi)容,商湯君整理分享給大家: 非常榮幸今天能有機會與大家分享未來人工智能發(fā)展的一個重要趨勢——通用智能如何打破智能汽車的邊界。 智能汽車正在從傳統(tǒng)的“制造”到“制造+服務(wù)”模式轉(zhuǎn)變。它將連接城市和個人,因此在個人消費、城市管理和企業(yè)服務(wù)方面,都有著非常大的想象空間。
我們知道,人工智能有三大要素:算力、算法和數(shù)據(jù)。 從算力的角度看,智能汽車的算力是智慧城市視覺感知終端算力的百倍,是智能手機的幾十倍。
由于汽車處于移動狀態(tài),其產(chǎn)生的感知數(shù)據(jù)無論在數(shù)據(jù)體量還是數(shù)據(jù)質(zhì)量方面,都遠高于其他領(lǐng)域。智能汽車就是一個巨大的、移動的數(shù)據(jù)生產(chǎn)源,關(guān)鍵是如何通過人工智能算法去挖掘這些數(shù)據(jù)背后的價值,我們認為有四類人工智能的模型: 第一類是智能感知模型。車載會產(chǎn)生大量的視頻、圖像,還有3D的非結(jié)構(gòu)化數(shù)據(jù),需要通過智能的感知將這些數(shù)據(jù)高效地進行結(jié)構(gòu)化。 第二類是決策智能。數(shù)據(jù)結(jié)構(gòu)化之后,需要更好地去做決策,包括更好地完成人機交互。 第三類是智能內(nèi)容生成。人工智能、增強現(xiàn)實、混合現(xiàn)實技術(shù)的發(fā)展為我們的物理世界打造了一個平行的虛擬世界。智能內(nèi)容生成能夠為虛擬世界高效地生成大量內(nèi)容,讓虛擬世界更加精彩。
第四類是智能內(nèi)容增強。在高速運動、極暗等各種極端情況下,仍能得到高質(zhì)量的圖像和視頻,也是人工智能模型能給數(shù)據(jù)帶來的價值。
通用智能拓展智能汽車邊界
通過人工智能拓展智能汽車的邊界,需要解決兩方面的問題:
第一,需要解決大量的長尾問題。比如在智能駕駛的過程中,有很多場景出現(xiàn)的頻次很低,也沒有大數(shù)據(jù)的支撐去做訓(xùn)練,但是一旦出現(xiàn)其產(chǎn)生的后果會非常嚴重。未來,不同汽車智能駕駛功能的差異化,就在于誰能夠去解決更多的長尾問題,滿足消費者更好的體驗。
第二,要不斷豐富智能汽車的應(yīng)用場景。比如智能駕駛中,從高速路自動巡航,到普通城區(qū)中的自動駕駛,從有高精地圖到?jīng)]有高精地圖覆蓋的廣大區(qū)域;在智能車艙中,從駕駛員感知到對老人、兒童、寵物的關(guān)愛,再到智慧健康功能的應(yīng)用;又如智能汽車和城市的元宇宙、增強現(xiàn)實、混合現(xiàn)實應(yīng)用的融合;再如多模交互,通過基于視覺的姿態(tài)、表情、唇語的識別和語音以及自然語言理解相結(jié)合,帶來更好的人機交互新體驗。
隨著智能汽車對人工智能的功能和需求不斷提高,場景不斷豐富,也就對通用人工智能提出了要求。 不同于以往的單一智能,單個AI模型輸入的數(shù)據(jù)類型是單一的,只能完成單一任務(wù)、適應(yīng)單一場景,利用通用人工智能技術(shù),一個模型能夠輸入語音、圖像、文字,還有激光雷達的3D點云等多種類型的數(shù)據(jù),并完成各種各樣的任務(wù)。
通用模型的出現(xiàn),能夠幫助我們實現(xiàn)不同行業(yè)之間的融合,實現(xiàn)產(chǎn)品和場景應(yīng)用的創(chuàng)新。
商湯致力于打造的人工智能基礎(chǔ)設(shè)施SenseCore AI大裝置,同時支撐四個領(lǐng)域的眾多行業(yè),包括智慧商業(yè)、智慧城市、智慧生活和智能汽車。在這些領(lǐng)域中,結(jié)合數(shù)據(jù)和大量行業(yè)反饋,又能夠助推我們打造通用智能的研發(fā)平臺和模型。
當AI大裝置不斷迭代,探索下一代研發(fā)體系時,就能夠同時推動各行業(yè)研發(fā)體系的升級和飛躍,這將成為推動社會生產(chǎn)力發(fā)展非常有效的迭代方式。
基于AI大裝置,商湯以“一橫一縱”的方式打造了智能汽車的創(chuàng)新底座,推出了智能汽車解決方案的獨立品牌——SenseAuto商湯絕影智能汽車平臺。
“一縱”是指能夠提供智能駕駛和智能車艙的全棧解決方案,“一橫”是指將基礎(chǔ)的軟硬件設(shè)施提供給車廠和合作伙伴,賦能不同的主機廠。商湯也建立起路云感知平臺,將車載數(shù)據(jù)、路端感知數(shù)據(jù)和其他行業(yè)的數(shù)據(jù)匯集起來,不斷拓展智能汽車的應(yīng)用場景。
商湯絕影的戰(zhàn)略定位有三個: 第一,幫助商湯的生態(tài)合作伙伴和客戶深度挖掘汽車感知數(shù)據(jù)的價值。 第二,連接智能汽車和商湯智慧產(chǎn)業(yè)生態(tài),實現(xiàn)服務(wù)輸出。
第三,實現(xiàn)商湯與汽車產(chǎn)業(yè)和生態(tài)的共生共贏。 從2016年開始商湯進入智能汽車行業(yè),截至今年上半年已有30+車企客戶、50+個合作伙伴,覆蓋50+種車型,在未來數(shù)年內(nèi)將向2000多萬輛汽車提供絕影產(chǎn)品。
新一代通用視覺技術(shù)體系“書生” 不久前,我們聯(lián)合上海人工智能實驗室、香港中文大學(xué)、上海交通大學(xué),共同發(fā)布新一代通用視覺技術(shù)體系“書生”(INTERN)。 書生訓(xùn)練一個通用視覺模型分幾個階段:首先匯集行業(yè)中的數(shù)據(jù),共同打造一個通用的“通才模型”,不單會寫文章,還琴棋書畫樣樣精通,實現(xiàn)更強的適應(yīng)性。
在此基礎(chǔ)上,結(jié)合各個專業(yè)領(lǐng)域,各個場景中少量的數(shù)據(jù),打造某個專業(yè)的“專才模型”,如針對智慧城市、自動駕駛、文化旅游等不同領(lǐng)域的專才模型。經(jīng)過這幾個階段,可以讓模型的通用性變得非常強。 我們也和世界上最頂級的研究成果進行了對比,相較于OpenAI的CLIP,“書生”在只有10%的數(shù)據(jù)的情況下,就能實現(xiàn)超過CLIP基于完整下游數(shù)據(jù)的準確度。
在商湯兩個階段的模型生產(chǎn)方法中,首先是訓(xùn)練世界目前最大的300億參數(shù)的視覺模型。基于這一超大模型,可以衍生出超過2萬多個商用模型。
這一過程需要非常強的算力支持。我們在臨港新建的商湯智算中心AIDC,擁有每秒3.74百億億次浮點運算的總算力、全套的自動數(shù)據(jù)標注、隱私保護和數(shù)據(jù)安全能力,同時還能夠形成數(shù)據(jù)閉環(huán)。并可選擇需要哪些數(shù)據(jù)進行回流,回流之后進行自動標注和模型更新。所有這些都基于AIDC和超大模型。 商湯也把智能汽車和多個行業(yè)緊密地結(jié)合在一起。舉一些例子: 在今年世界人工智能大會上,商湯發(fā)布世界上第一款自動駕駛AR小巴。
我們將上海的一個城區(qū)進行了三維數(shù)字化,借助車載大屏和車外視覺感知設(shè)備,就可以形成虛擬世界和物理世界的融合。乘客坐在車里可以體驗到城市的發(fā)展、經(jīng)濟文化的創(chuàng)新,就像坐在穿梭的博物館中。
此外,數(shù)字人已經(jīng)應(yīng)用于各行各業(yè),商湯也把它引入到了智能車艙中,根據(jù)消費者的喜好,實現(xiàn)千人千面。 商湯還把智慧健康引入到車艙當中,讓乘員在車艙中即可檢測心率、呼吸頻率、血壓等情況,通過視覺手段,給消費者帶來關(guān)愛和長期關(guān)懷。
人工智能正在快速從單一智能向通用智能發(fā)展。商湯也致力于打造人工智能基礎(chǔ)設(shè)施,促進產(chǎn)業(yè)融合,不斷拓展智能汽車的應(yīng)用邊界和場景,與合作伙伴一起迎接智能汽車的新未來。
相關(guān)閱讀,戳這里
《車艙里就能健康檢測,商湯絕影:謝邀!》 《商湯絕影智能汽車平臺將賦能一汽南京,加速新一代智能汽車量產(chǎn)》
原文標題:商湯科技聯(lián)合創(chuàng)始人王曉剛教授:通用智能拓展智能汽車邊界
文章出處:【微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
審核編輯:湯梓紅
-
智能手機
+關(guān)注
關(guān)注
66文章
18556瀏覽量
181186 -
人工智能
+關(guān)注
關(guān)注
1796文章
47791瀏覽量
240579 -
智能汽車
+關(guān)注
關(guān)注
30文章
2899瀏覽量
107607
原文標題:商湯科技聯(lián)合創(chuàng)始人王曉剛教授:通用智能拓展智能汽車邊界
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
嵌入式和人工智能究竟是什么關(guān)系?
《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感
AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感
《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得
risc-v在人工智能圖像處理應(yīng)用前景分析
人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析
人工智能ai4s試讀申請
名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新
報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI
FPGA在人工智能中的應(yīng)用有哪些?
致力于為汽車人工智能硬件提供未來保障
5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V2)
5G智能物聯(lián)網(wǎng)課程之Aidlux下人工智能開發(fā)(SC171開發(fā)套件V1)
如何通過人工智能(AI)克服汽車軟件開發(fā)挑戰(zhàn)?
![如何<b class='flag-5'>通過人工智能</b>(AI)克服<b class='flag-5'>汽車</b>軟件開發(fā)挑戰(zhàn)?](https://file1.elecfans.com/web2/M00/C2/C1/wKgaomXe2tKABsM0AAAm8TUHkB0469.png)
評論