在人工智能發(fā)展浪潮中,大模型的開源與閉源之爭一直是業(yè)內(nèi)的熱點(diǎn)話題。隨著技術(shù)的不斷進(jìn)步和應(yīng)用場(chǎng)景的日益豐富,如何降低大模型的使用門檻,讓更多人能夠便捷地應(yīng)用于實(shí)際業(yè)務(wù)場(chǎng)景,成為了推動(dòng)行業(yè)發(fā)展的關(guān)鍵所在。而開源大模型,無疑是這一進(jìn)程中具有里程碑意義的重要一步。
近日,2024開放原子開發(fā)者大會(huì)暨首屆開源技術(shù)學(xué)術(shù)大會(huì)——開源大模型落地實(shí)踐分論壇上,武漢人工智能研究院院長、中國科學(xué)院自動(dòng)化研究所副總工程師王金橋,武漢大學(xué)教授葉茫,騰訊機(jī)器學(xué)習(xí)平臺(tái)專家、混元大模型預(yù)訓(xùn)練負(fù)責(zé)人孫興武,北京智源人工智能研究院數(shù)據(jù)研究組負(fù)責(zé)人劉廣,小米AI技術(shù)專家張俊博,阿里云智能集團(tuán)技術(shù)專家馬騰,中國科學(xué)院自動(dòng)化研究所副研究員、武漢人工智能研究院算法架構(gòu)師易東,Monkey大模型一作、華中科技大學(xué)碩士生楊彪等多位深耕開源大模型的技術(shù)專家,深入探討了開源大模型的前沿技術(shù)進(jìn)展、應(yīng)用創(chuàng)新及行業(yè)落地實(shí)踐。本論壇由開放原子開源基金會(huì)、中國通信學(xué)會(huì)主辦,CSDN、武漢人工智能研究院協(xié)辦。
王金橋在致辭中強(qiáng)調(diào)了開源對(duì)大模型生態(tài)發(fā)展的推動(dòng)作用,以及它在降低技術(shù)門檻、促進(jìn)技術(shù)創(chuàng)新方面的價(jià)值。他提到,盡管開源大型模型已取得顯著成就,但還需面對(duì)數(shù)據(jù)質(zhì)量、隱私保護(hù)、模型解釋性以及安全可靠性等挑戰(zhàn)。他期望通過不懈努力,進(jìn)一步促進(jìn)開源社區(qū)的繁榮發(fā)展,推動(dòng)技術(shù)共享的進(jìn)程。
在主題內(nèi)容分享環(huán)節(jié),葉茫分享了團(tuán)隊(duì)在多模態(tài)大模型微調(diào)、持續(xù)學(xué)習(xí)和輕量化等方面的研究,特別是跨模態(tài)目標(biāo)檢索系統(tǒng)的開發(fā),以及無人機(jī)場(chǎng)景下的工業(yè)檢索和夜間場(chǎng)景下可見光與紅外圖像的跨模態(tài)匹配等工作。
孫興武介紹了騰訊混元大模型在技術(shù)和應(yīng)用上的最新成果,包括自研星脈高性能計(jì)算網(wǎng)絡(luò)及其Angel訓(xùn)練框架,以及廣告推薦、代碼生成、AI客服等多個(gè)業(yè)務(wù)場(chǎng)景的應(yīng)用案例。
劉廣聚焦于高質(zhì)量數(shù)據(jù)集的構(gòu)建及其對(duì)模型性能的重要性,介紹了BGE向量模型及Aquila語言模型,并強(qiáng)調(diào)了中文互聯(lián)網(wǎng)最大規(guī)模的數(shù)據(jù)集CCL3.0的價(jià)值。他指出,通過定義高質(zhì)量數(shù)據(jù)的標(biāo)準(zhǔn)并結(jié)合小模型驗(yàn)證效果的方法,可以有效提高模型的表現(xiàn)力。
張俊博介紹了XIAOMI DASHENG聲音預(yù)訓(xùn)練模型。該模型具有優(yōu)秀的場(chǎng)景區(qū)分能力和環(huán)境音識(shí)別能力,只需簡單幾行代碼就能達(dá)到SOTA級(jí)別的性能,不僅適用于音頻表征任務(wù),還可以作為多模態(tài)大模型的一部分,提供穩(wěn)定的音頻編碼服務(wù)。
馬騰分享的Mooncake項(xiàng)目,是一個(gè)用于優(yōu)化大模型推理服務(wù)的開源項(xiàng)目。采用P/D分離架構(gòu)和KVCache緩存池提升吞吐量,減少算力開銷,支持多種通訊協(xié)議和存儲(chǔ)方式,適配多種推理框架,增強(qiáng)了分布式部署能力。
易東講解了“紫東太初”多模態(tài)大模型的研發(fā)歷程和發(fā)展方向,展示了在醫(yī)療、教育、政務(wù)等多個(gè)領(lǐng)域的應(yīng)用實(shí)例,并公布了FAST SAM、FLAP等多個(gè)開源項(xiàng)目,這些項(xiàng)目進(jìn)一步豐富了多模態(tài)大模型的應(yīng)用生態(tài)。
最后,楊彪介紹了Monkey多模態(tài)大模型及其在文檔智能中的應(yīng)用,通過切塊處理提高圖片分辨率和更詳細(xì)的標(biāo)注數(shù)據(jù)進(jìn)行微調(diào),提出了TEXTMonkey,針對(duì)文檔領(lǐng)域進(jìn)行優(yōu)化,實(shí)現(xiàn)了更高的精度和更好的可解釋性。
如今,各行各業(yè)都已進(jìn)入智能化升級(jí)關(guān)鍵階段,開源大模型的創(chuàng)新已無處不在。通過服裝模特AI生成技術(shù),企業(yè)可以降低拍攝海報(bào)的人力成本;通過跨領(lǐng)域合作,實(shí)現(xiàn)了文本指令區(qū)域編輯和動(dòng)圖生成,為智能電視提供了更豐富的用戶體驗(yàn);通過多模態(tài)情感語義理解基礎(chǔ)模型,不僅有助于提升情感意圖識(shí)別的準(zhǔn)確性,還為精神疾病診斷提供了新的思路,類似的案例不勝枚舉。
總體而言,在開源生態(tài)中,大模型在眾多應(yīng)用場(chǎng)景中均展現(xiàn)出良好的性能表現(xiàn)。眾多企業(yè)不僅在大模型的微調(diào)、持續(xù)學(xué)習(xí)和輕量化等領(lǐng)域進(jìn)行了深入研究,而且正積極推動(dòng)這些技術(shù)在具體業(yè)務(wù)場(chǎng)景中的廣泛應(yīng)用和落地實(shí)施。
-
人工智能
+關(guān)注
關(guān)注
1796文章
47791瀏覽量
240569 -
開源
+關(guān)注
關(guān)注
3文章
3412瀏覽量
42743 -
大模型
+關(guān)注
關(guān)注
2文章
2603瀏覽量
3215
原文標(biāo)題:從理論到實(shí)踐,開源大模型在多領(lǐng)域的應(yīng)用探索
文章出處:【微信號(hào):開放原子,微信公眾號(hào):開放原子】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論