欧美精品欧美一区二区三区,亚洲2卡3卡4卡5卡乱码入口

8月28日，山海大模型迎來又一次迭代升級，當前版本參數規(guī)模達到千億，實現(xiàn)了多學科能力、醫(yī)療能力雙提升，實測性能在C-Eval全球大模型綜合性評測中超越GPT-4，以平均分70分的成績進入前三甲。

能力突破，持續(xù)領跑行業(yè)

多學科能力增強

本次山海大模型2.0版參數規(guī)模達到千億，增加了更多的學科類的預訓練語料，訓練數據（Tokens）達到兩萬億（2.0T）。

在本次模型升級過程中，山海團隊充分利用了教材、文獻、百科類語料的價值，這些語料包含了人類對客觀世界知識的豐富理解、詳盡解釋以及在各個領域的深入研究所得到的科學結論。不同的學科領域的數據涵蓋了各自學科的專業(yè)知識，這在一定程度上彌補了第一版山海大模型在某些專業(yè)領域的知識盲區(qū)。

為了使模型能更科學合理地汲取這些不同領域和來源的數據中的知識，山海大模型團隊使用了DoReMi方法對數據進行了優(yōu)化權重采樣。通過這種策略，可以在較大范圍內均勻并深入地提取各類信息。這一策略使得山海團隊在本次模型升級過程中，能更有效地吸取和運用各種知識，使模型的知識庫更加全面。

醫(yī)療能力再升級

云知聲深耕醫(yī)學領域多年，山海大模型2.0在預訓練階段使用了海量的醫(yī)學病歷、醫(yī)學教材、臨床指南和醫(yī)學文獻等數據，并在對齊階段使用了人機結合方法構建的近百萬級的病歷理解、醫(yī)學考試和醫(yī)學知識問答等指令學習數據。C-Eval中醫(yī)療學科的結果表明，山海大模型2.0在基礎醫(yī)學、臨床醫(yī)學和醫(yī)師資格數據集上都能獲得接近90分的水平，為業(yè)內最高。

云知聲山海大模型團隊參加了剛剛在沈陽結束的CCKS2023-PromptCBLUE評測，該評測是當前最權威的中文醫(yī)療大模型的評測榜單，我們同樣也取得了第一名的成績，再次證明了山海大模型專業(yè)的醫(yī)學能力。

技術升級，性能加速提升

窗口長度大幅度擴展

山海團隊發(fā)現(xiàn)，在運用位置插值（PositionInterpolation）方法進行大幅度擴展時——比如將窗口從4k擴展到32k——其性能會顯著受到影響。這種影響主要體現(xiàn)在短距離情況下的使用。為了更好地解釋這一點，假設原始數據中距離為1的兩個token，當我們將數據從4k擴展到32k時，這兩個token之間的距離實際上變成了1/8。這就意味著，在進行位置插值的過程中，原本距離很近的兩個token之間的距離被大比例地拉遠了。這種場景下，衰減規(guī)律在短距離的使用會受到較大的影響，這是因為衰減規(guī)律在短距離時可能具有非常突出的變化率，意味著原本應該很近的兩個token在大規(guī)模擴展之后，它們之間的關聯(lián)性會大幅度減小。因此，直接進行位置插值的方法會使得窗口大幅度擴展后的性能較大程度地降低。發(fā)現(xiàn)RoPE位置編碼短距離之間的差異，主要體現(xiàn)在高頻分量上，長距離之間的差異，主要體現(xiàn)在低頻分量上。山海大模型2.0版根據神經正切核的思想，采用Neural Tangent Kernel (NTK)的非線性差值方法，實現(xiàn)高頻外推、低頻內插的大規(guī)模長度擴展。采用NTK擴展后模型能夠更好的支持文本窗口擴展，當前山海大模型2.0版本已經支持32K的窗口長度。

受限解碼支持業(yè)務落地

在大多數行業(yè)中，對大模型的并發(fā)使用和響應時間有很高的要求。這要求我們在保證大模型算法效果的基礎上，更需要深思其推理速度。本次山海大模型2.0基于落地場景需要，設計了受限解碼方法，在解碼過程中不需要計算整個詞表的概率，只需關注落地場景下關注的token，極大地提高了解碼效率。如圖所示，利用受限解碼方法，生成token“今”后面只需考慮token“夕”和“天”的概率，而不需要完成整個詞表概率分布的計算。

作為中國AGI技術產業(yè)化的先驅之一，云知聲于2016年開始打造Atlas人工智能基礎設施，并以此為基礎，構建云知大腦(UniBrain)技術中臺——以山海（UniGPT）通用認知大模型為核心，結合多模態(tài)感知與生成、知識圖譜、物聯(lián)平臺等智能組件，為云知聲智慧物聯(lián)、智慧醫(yī)療等業(yè)務提供高效的產品化支撐，持續(xù)推動“U(云知大腦)+X(應用場景)”戰(zhàn)略布局，踐行“通過通用人工智能(AGI)創(chuàng)建互聯(lián)直覺的世界”的公司使命。

云知聲：通過通用人工智能(AGI)創(chuàng)建互聯(lián)直覺的世界

云知聲AI技術體系及U+X戰(zhàn)略

山海大模型作為云知大腦的核心，能力體系涵蓋語言生成、語言理解、知識問答、邏輯推理、代碼能力、數學能力等。此外，為提高大模型在具體場景的應用落地水平，山海大模型在通用能力基礎上，增強物聯(lián)、醫(yī)療等行業(yè)能力，致力為客戶提供更智能、更靈活的解決方案，加速千行百業(yè)的智慧化升級。

自5月24日發(fā)布以來，山海大模型始終保持高速演進，不斷拓展大模型場景應用邊界——

6月25日

山海大模型通過迭代實現(xiàn)了在特定領域內的專業(yè)知識積累，詩詞創(chuàng)作能力、數學計算能力實現(xiàn)突破。其中，醫(yī)療能力在6月的MedQA任務上提升到了87.1%，超越Med-PaLM 2，臨床執(zhí)業(yè)醫(yī)師資格考試提升至523（總分600分），超過了99%的考生水平。

6月27日

北京市首批10個人工智能行業(yè)大模型應用案例公布，由云知聲和北京友誼醫(yī)院共同開發(fā)的基于山海大模型的門診病歷生成系統(tǒng)示范應用成功入選。

7月2日

憑借山海大模型卓越的研發(fā)和應用成果，云知聲同時入選2023北京人工智能行業(yè)賦能典型案例、“北京市通用人工智能產業(yè)創(chuàng)新伙伴計劃”第二批成員名單。

7月6日-8日

云知聲攜山海大模型及最新場景應用——基于山海大模型打造的智慧車載解決方案、智慧交通解決方案亮相2023 WAIC。

7月28日

山海大模型迎來新一輪迭代升級，并在本月的C-Eval全球大模型綜合性考試評測中取得了60分以上的優(yōu)異成績，成功躋身榜單前十。

8月27日

CCKS 2023現(xiàn)場公布系列評測任務結果，云知聲憑借基于山海大模型孵化的UNIGPT-MED 模型，在PromptCBLUE醫(yī)療大模型評測中奪得A、B榜雙榜冠軍。

云知聲希望，通過山海大模型的持續(xù)升級，不僅打造基礎能力更加強大的通用大模型，也進一步融合不同垂直領域的專業(yè)知識，讓大模型更懂行業(yè)、更具專長，實現(xiàn)大模型應用場景的加速拓展，讓大模型的產業(yè)價值在千行百業(yè)中綻放。

此次云知聲躋身C-Eval全球大模型綜合性考試評測前三甲，再一次印證了山海大模型的突出實力，也將持續(xù)推動云知聲AGI基礎設施能力的躍進提升，加速人工智能技術的創(chuàng)新與應用。未來，云知聲將以其強大的技術實力、不斷創(chuàng)新的科研能力以及對人工智能發(fā)展的深刻理解，不斷構建長期競爭力和創(chuàng)新基石，持續(xù)探索AGI的無限可能。

附：C-Eval是由清華大學、上海交通大學和愛丁堡大學合作構建的面向中文語言模型的綜合性考試評測集,包含13948道多項選擇題,涵蓋數學、物理、化學、生物、歷史、政治、計算機等52個不同學科和四個難度級別，是全球最具影響力的綜合性考試評測集之一。作為第三方發(fā)起的測試基準， C-Eval以其客觀性、公正性備受業(yè)內關注，也吸引了多家企業(yè)、機構和高校的參與。

審核編輯：湯梓紅

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴