商湯科技及聯(lián)合實驗室共49篇論文入選,涵蓋文生圖、3D數(shù)字人、自動駕駛、目標檢測、視頻分割等多個與大模型和生成式AI相關的熱點方向。
基于商湯AI大裝置SenseCore和“日日新SenseNova”大模型體系。在生成式AI和視覺大模型等領域,商湯提出多項極具價值的技術突破和研究范式創(chuàng)新。“商湯科技聯(lián)合創(chuàng)始人、首席科學家王曉剛表示:持續(xù)深耕AI基礎設施建設、堅持做注重產業(yè)實踐的學術研究、深耕人才階梯式培養(yǎng),是商湯多年來在全球學術舞臺上不斷產出創(chuàng)新成果的基石。商湯將積極擁抱大模型帶來的全新研究范式,不斷提升研發(fā)體系,堅持將基礎研究與業(yè)務發(fā)展緊密融合,為行業(yè)貢獻更具價值的技術成果。”
多項技術突破和范式創(chuàng)新
大模型及生成式AI成焦點
大模型和生成式AI在全球范圍內備受矚目,也為學術研究提出了諸多具有挑戰(zhàn)性的全新課題。生成式AI方向的文生圖領域,如何讓模型更容易生成與人類偏好相符的圖像?在論文《Human Preference Score: Better Aligning Text-to-Image Models with Human Preference》中,商湯研究團隊將人類偏好引入Stable Diffusion的模型訓練中,證明了人類偏好信息可以提升Stable Diffusion生成的圖像質量,尤其在人體、四肢等經典的failure case中更是展示了優(yōu)異的效果。
![wKgaomUtDvCAEpKfAAC5LWRQ3q4619.jpg](https://file1.elecfans.com//web2/M00/A8/6C/wKgaomUtDvCAEpKfAAC5LWRQ3q4619.jpg)
數(shù)字人是生成式AI的重要領域,但其制作依然需要一定門檻。商湯研究團隊在論文《SHERF: Generalizable Human NeRF from a Single Image》中提出一種基于單張圖片的可泛化、可驅動人體神經輻射場方法,僅需一張任意角度的3D人體圖片,結合必要的參數(shù),就能實現(xiàn)3D數(shù)字人重建和驅動,有望簡化3D數(shù)字人的創(chuàng)作流程。
基于單張圖片的人體神經輻射場重建和驅動
高質量的3D人體數(shù)據(jù)集是研究眾多人體相關的感知模型、重建模型和生成式AI的基礎。商湯研究團隊在論文《SynBody: Synthetic Dataset with Layered Human Models for 3D Human Perception and Modeling》中提出一個合成數(shù)據(jù)集SynBody,其構建了穿著衣物的參數(shù)化人體模型,并生成了海量的人體虛擬數(shù)據(jù),有助于3D人體感知和重建的模型訓練。此外,團隊公布了開源代碼庫XRFeitoria,一個合成數(shù)據(jù)渲染工具箱,通過提供方便的Python API與CLI工具,極大簡化了制作虛擬數(shù)據(jù)集的流程。
SynBody是基于分層人體模型的大規(guī)模合成
數(shù)據(jù)集,可用于人體感知與建模等任務
在自動駕駛場景的3D目標檢測領域,商湯團隊還在論文《Temporal Enhanced Training of Multi-view 3D Object Detector via Historical Object Prediction》中提出一種新的用于多視角3D檢測的時序增強訓練方式——歷史幀物體預測(HoP),不僅在nuScenes測試集上使用ViT-L得到了68.5%NDS和62.4%mAP,超過了排行榜上所有3D物體檢測器,還可以即插即用,無縫集成到最先進的 BEV 檢測框架中,重塑3D檢測時序利用的新范式。
HoP算法框架圖
此外,本屆ICCV,商湯科技還在目標檢測、視頻分割、3D感知與重建、半監(jiān)督學習、NeRF等領域取得諸多技術創(chuàng)新突破。
開源開放
構建大模型時代
產學研協(xié)同新生態(tài)
產學研協(xié)同是實現(xiàn)學術研究成果到行業(yè)應用轉化的高效路徑。商湯不斷夯實技術研究的同時,也積極參與和舉辦各類學術交流和競賽活動,促進創(chuàng)新成果產出,探索大模型時代產學研協(xié)作模式的構建。
同時,商湯長期致力于推動AI基礎設施和開源生態(tài)的建設,與開發(fā)者共創(chuàng)共建,共同推動AI社區(qū)的繁榮發(fā)展。
商湯早在2018年開源的計算機視覺框架OpenMMLab已在GitHub上收獲超過8.7萬個星標。
今天,商湯的開源項目已拓展到決策智能、大語言模型、拓展現(xiàn)實、數(shù)據(jù)平臺、高性能訓練和推理框架、AI智能體框架等領域,為學術界的科研突破和工業(yè)界的產業(yè)落地提供全方位的算法與平臺支撐。
其中,在大語言模型領域,商湯與上海AI實驗室等聯(lián)合推出的書生·浦語大模型(InternLM)在開源社區(qū)和產業(yè)界產生廣泛影響。
最新的InternLM-20B模型性能先進且應用便捷,以不足三分之一的參數(shù)量,達到當前被視為開源模型標桿的Llama2-70B的能力水平。
秉承開源、開放的發(fā)展理念,商湯愿與行業(yè)伙伴共同迎接大模型的新一輪科技革命,讓AI技術釋放更廣泛的產業(yè)價值。
相關閱讀,戳這里
《商湯聯(lián)合團隊斬獲CVPR最佳論文,推出首個“感知決策一體化”自動駕駛通用大模型》
原文標題:ICCV 2023生成式AI引人矚目,商湯多項技術突破展現(xiàn)中國“創(chuàng)新力”
文章出處:【微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。
-
商湯科技
+關注
關注
8文章
520瀏覽量
36186
原文標題:ICCV 2023生成式AI引人矚目,商湯多項技術突破展現(xiàn)中國“創(chuàng)新力”
文章出處:【微信號:SenseTime2017,微信公眾號:商湯科技SenseTime】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
國內生成式AI備案數(shù)量突破300款
美洽榮登2024中國生成式AI 創(chuàng)新企業(yè)系列榜單-智能客服創(chuàng)新企業(yè)榜
![美洽榮登2024<b class='flag-5'>中國</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b> <b class='flag-5'>創(chuàng)新</b>企業(yè)系列榜單-智能客服<b class='flag-5'>創(chuàng)新</b>企業(yè)榜](https://file1.elecfans.com//web3/M00/04/69/wKgZPGdzmW6Afyf3ABCsbF0KKzA065.jpg)
商湯科技領跑2024年中國GenAI技術棧市場
Imagination 系列研討會 |中國生成式 AI 的發(fā)展
![Imagination 系列研討會 |<b class='flag-5'>中國</b><b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 的發(fā)展](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
天璣9400生成式AI技術太牛了!打造最強AI體驗
![天璣9400<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b><b class='flag-5'>技術</b>太牛了!打造最強<b class='flag-5'>AI</b>體驗](https://file1.elecfans.com//web2/M00/09/6B/wKgZomcMtPeAR57GAAEWNe0dLjM71.jpeg)
商湯發(fā)布《2024生成式AI賦能教育未來》白皮書
摩爾線程與億景智聯(lián)達成戰(zhàn)略共同,推動生成式AI在高等教育中的應用
商湯集團發(fā)布2023全年業(yè)績,全年營收34.05億
商湯科技2023年生成式AI收入增至12億元
商湯集團2023全年業(yè)績亮眼,生成式AI業(yè)務爆發(fā)式增長
奧拓電子榮登“2023粵港澳大灣區(qū)企業(yè)創(chuàng)新力榜單—創(chuàng)新成就榜”
![奧拓電子榮登“<b class='flag-5'>2023</b>粵港澳大灣區(qū)企業(yè)<b class='flag-5'>創(chuàng)新力</b>榜單—<b class='flag-5'>創(chuàng)新</b>成就榜”](https://file1.elecfans.com/web2/M00/C4/C2/wKgZomX31vaAGa0QAABZHgl9Yto588.png)
評論