10月2日至6日，全球AI頂級國際會議ICCV（International Conference on Computer Vision）在法國巴黎舉行。本屆ICCV投稿總數(shù)達8068篇，其中2160篇被接收，錄用率為26.8%，略高于上屆ICCV 2021錄用率25.9%。

商湯科技及聯(lián)合實驗室共49篇論文入選，涵蓋文生圖、3D數(shù)字人、自動駕駛、目標檢測、視頻分割等多個與大模型和生成式AI相關的熱點方向。

基于商湯AI大裝置SenseCore和“日日新SenseNova”大模型體系。在生成式AI和視覺大模型等領域，商湯提出多項極具價值的技術突破和研究范式創(chuàng)新。

“商湯科技聯(lián)合創(chuàng)始人、首席科學家王曉剛表示：持續(xù)深耕AI基礎設施建設、堅持做注重產業(yè)實踐的學術研究、深耕人才階梯式培養(yǎng)，是商湯多年來在全球學術舞臺上不斷產出創(chuàng)新成果的基石。商湯將積極擁抱大模型帶來的全新研究范式，不斷提升研發(fā)體系，堅持將基礎研究與業(yè)務發(fā)展緊密融合，為行業(yè)貢獻更具價值的技術成果。”

多項技術突破和范式創(chuàng)新

大模型及生成式AI成焦點

大模型和生成式AI在全球范圍內備受矚目，也為學術研究提出了諸多具有挑戰(zhàn)性的全新課題。

生成式AI方向的文生圖領域，如何讓模型更容易生成與人類偏好相符的圖像？在論文《Human Preference Score: Better Aligning Text-to-Image Models with Human Preference》中，商湯研究團隊將人類偏好引入Stable Diffusion的模型訓練中，證明了人類偏好信息可以提升Stable Diffusion生成的圖像質量，尤其在人體、四肢等經典的failure case中更是展示了優(yōu)異的效果。

將人類偏好引入StableDiffusion的模型訓練過程

數(shù)字人是生成式AI的重要領域，但其制作依然需要一定門檻。商湯研究團隊在論文《SHERF: Generalizable Human NeRF from a Single Image》中提出一種基于單張圖片的可泛化、可驅動人體神經輻射場方法，僅需一張任意角度的3D人體圖片，結合必要的參數(shù)，就能實現(xiàn)3D數(shù)字人重建和驅動，有望簡化3D數(shù)字人的創(chuàng)作流程。

基于單張圖片的人體神經輻射場重建和驅動

高質量的3D人體數(shù)據(jù)集是研究眾多人體相關的感知模型、重建模型和生成式AI的基礎。商湯研究團隊在論文《SynBody: Synthetic Dataset with Layered Human Models for 3D Human Perception and Modeling》中提出一個合成數(shù)據(jù)集SynBody，其構建了穿著衣物的參數(shù)化人體模型，并生成了海量的人體虛擬數(shù)據(jù)，有助于3D人體感知和重建的模型訓練。此外，團隊公布了開源代碼庫XRFeitoria，一個合成數(shù)據(jù)渲染工具箱，通過提供方便的Python API與CLI工具，極大簡化了制作虛擬數(shù)據(jù)集的流程。

SynBody是基于分層人體模型的大規(guī)模合成

數(shù)據(jù)集，可用于人體感知與建模等任務

在自動駕駛場景的3D目標檢測領域，商湯團隊還在論文《Temporal Enhanced Training of Multi-view 3D Object Detector via Historical Object Prediction》中提出一種新的用于多視角3D檢測的時序增強訓練方式——歷史幀物體預測（HoP），不僅在nuScenes測試集上使用ViT-L得到了68.5%NDS和62.4%mAP，超過了排行榜上所有3D物體檢測器，還可以即插即用，無縫集成到最先進的 BEV 檢測框架中，重塑3D檢測時序利用的新范式。

HoP算法框架圖

此外，本屆ICCV，商湯科技還在目標檢測、視頻分割、3D感知與重建、半監(jiān)督學習、NeRF等領域取得諸多技術創(chuàng)新突破。

開源開放

構建大模型時代

產學研協(xié)同新生態(tài)

產學研協(xié)同是實現(xiàn)學術研究成果到行業(yè)應用轉化的高效路徑。

商湯不斷夯實技術研究的同時，也積極參與和舉辦各類學術交流和競賽活動，促進創(chuàng)新成果產出，探索大模型時代產學研協(xié)作模式的構建。

同時，商湯長期致力于推動AI基礎設施和開源生態(tài)的建設，與開發(fā)者共創(chuàng)共建，共同推動AI社區(qū)的繁榮發(fā)展。

商湯早在2018年開源的計算機視覺框架OpenMMLab已在GitHub上收獲超過8.7萬個星標。

今天，商湯的開源項目已拓展到決策智能、大語言模型、拓展現(xiàn)實、數(shù)據(jù)平臺、高性能訓練和推理框架、AI智能體框架等領域，為學術界的科研突破和工業(yè)界的產業(yè)落地提供全方位的算法與平臺支撐。

其中，在大語言模型領域，商湯與上海AI實驗室等聯(lián)合推出的書生·浦語大模型（InternLM）在開源社區(qū)和產業(yè)界產生廣泛影響。

最新的InternLM-20B模型性能先進且應用便捷，以不足三分之一的參數(shù)量，達到當前被視為開源模型標桿的Llama2-70B的能力水平。

秉承開源、開放的發(fā)展理念，商湯愿與行業(yè)伙伴共同迎接大模型的新一輪科技革命，讓AI技術釋放更廣泛的產業(yè)價值。

相關閱讀，戳這里

《商湯聯(lián)合團隊斬獲CVPR最佳論文，推出首個“感知決策一體化”自動駕駛通用大模型》

原文標題：ICCV 2023生成式AI引人矚目，商湯多項技術突破展現(xiàn)中國“創(chuàng)新力”

文章出處：【微信公眾號：商湯科技SenseTime】歡迎添加關注！文章轉載請注明出處。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

商湯科技

商湯科技

+關注

關注
8

文章
520

瀏覽量
36186

原文標題：ICCV 2023生成式AI引人矚目，商湯多項技術突破展現(xiàn)中國“創(chuàng)新力”

文章出處：【微信號：SenseTime2017，微信公眾號：商湯科技SenseTime】歡迎添加關注！文章轉載請注明出處。

國內生成式AI備案數(shù)量突破300款

服務數(shù)量高達238款，占據(jù)了總備案數(shù)量的絕大部分，充分展示了該領域技術創(chuàng)新和市場需求的強勁動力。這一快速增長不僅反映了國內企業(yè)在生成式AI技術

發(fā)表于 01-09 11:14 ?431次閱讀

美洽榮登2024中國生成式AI 創(chuàng)新企業(yè)系列榜單-智能客服創(chuàng)新企業(yè)榜

近日，由第一新聲聯(lián)合天眼查發(fā)起的“2024中國生成式AI創(chuàng)新企業(yè)系列榜單”正式發(fā)布，美洽憑借在智能客服領域

發(fā)表于 12-31 15:12 ?208次閱讀

商湯科技領跑2024年中國GenAI技術棧市場

創(chuàng)新實力強、應用落地廣，GenAI（生成式AI）技術棧領域，商湯科技位居國內榜首！

發(fā)表于 12-27 16:07 ?321次閱讀

Imagination 系列研討會｜中國生成式 AI 的發(fā)展

近期，Imagination將陸續(xù)推出全新系列研討會，涵蓋邊緣AI如何推動工業(yè)物聯(lián)網的發(fā)展，生成式AI，智能汽車未來發(fā)展趨勢等等多個熱門話題。本期研討會中，Imagination

發(fā)表于 12-09 16:57 ?378次閱讀

天璣9400生成式AI技術太牛了！打造最強AI體驗

聯(lián)發(fā)科技再度突破技術前沿，推出全新天璣9400旗艦芯片，這是業(yè)界首款集成智能體AI的5G SoC。繼天璣9300首次將生成式

發(fā)表于 10-14 14:06 ?367次閱讀

商湯發(fā)布《2024生成式AI賦能教育未來》白皮書

生成式AI正在各個行業(yè)中展現(xiàn)出巨大的應用前景。在關系國計民生的教育行業(yè)，生成式

發(fā)表于 06-29 09:48 ?923次閱讀

摩爾線程與億景智聯(lián)達成戰(zhàn)略共同，推動生成式AI在高等教育中的應用

得益于大模型技術的不斷突破，生成式AI逐漸成為驅動教育乃至各行各業(yè)創(chuàng)新發(fā)展的新動力。

發(fā)表于 05-13 11:35 ?549次閱讀

商湯集團發(fā)布2023全年業(yè)績，全年營收34.05億

商湯集團近日發(fā)布了2023年經審核全年業(yè)績報告，詳細披露了公司在過去一年的業(yè)務表現(xiàn)和發(fā)展戰(zhàn)略。報告指出，商湯集團已經明確了新的三大業(yè)務板塊：生成式

發(fā)表于 03-29 10:29 ?735次閱讀

商湯科技2023年生成式AI收入增至12億元

商湯科技近日發(fā)布的2023年年報顯示，公司在人工智能領域取得顯著進展，特別是其“日日新”大模型與大裝置的組合，驅動生成式AI業(yè)務實現(xiàn)了爆發(fā)式

發(fā)表于 03-27 13:51 ?630次閱讀

商湯集團2023全年業(yè)績亮眼，生成式AI業(yè)務爆發(fā)式增長

商湯集團近日發(fā)布了截至2023年12月31日的經審核全年業(yè)績報告，展現(xiàn)了集團在AI領域的強勁增長勢頭。在全新的戰(zhàn)略布局下，商湯明確了三大業(yè)務

發(fā)表于 03-27 09:14 ?671次閱讀

奧拓電子榮登“2023粵港澳大灣區(qū)企業(yè)創(chuàng)新力榜單—創(chuàng)新成就榜”

在近日召開的第四屆深圳企業(yè)創(chuàng)新促進大會暨深圳工業(yè)總會2023年度年會上，“2023粵港澳大灣區(qū)企業(yè)創(chuàng)新力榜單”重磅發(fā)布，奧拓電子憑借“創(chuàng)新成

發(fā)表于 03-18 13:52 ?455次閱讀

生成式 AI 制作動畫：周期短、成本低！

? 電子發(fā)燒友網報道（文/李彎彎）生成式AI在動畫市場中的應用正在迅速崛起。根據(jù)市場機構數(shù)據(jù)，預計到2023年生成

發(fā)表于 03-18 08:19 ?3827次閱讀

聯(lián)發(fā)科天璣又領先一步！強悍AI手機芯片就看天璣！

近期，2024 世界移動通信大會（MWC 2024）展出的一系列先進通信技術引人矚目，炙手可熱的生成式AI

發(fā)表于 02-27 13:46 ?588次閱讀

MediaTek將在MWC 2024展示創(chuàng)新生成式AI技術和應用

MediaTek將亮相2024年世界移動通信大會（MWC 2024），此次大會上，MediaTek將基于其天璣9300集成的新一代AI處理器，展示一系列前沿的生成式

發(fā)表于 02-26 10:50 ?907次閱讀

MediaTek將于MWC 2024展示多項率先亮相的智能手機生成式AI應用

，MediaTek將展示一系列創(chuàng)新的生成式AI技術和應用，其中包括多項業(yè)界率先亮相的端側

發(fā)表于 02-21 17:35 ?356次閱讀