欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Hugging Face科技公司推出SmolLM系列語言模型

要長高 ? 2024-07-23 16:35 ? 次閱讀

7月22日最新資訊,Hugging Face科技公司在語言模型領(lǐng)域再創(chuàng)新高,正式推出了SmolLM系列——一款專為適應(yīng)多樣計(jì)算資源而設(shè)計(jì)的緊湊型語言模型家族。該系列包含三個(gè)版本,分別搭載了1.35億、3.6億及17億參數(shù),旨在以高效能應(yīng)對(duì)不同應(yīng)用場景。

據(jù)Hugging Face SmolLM項(xiàng)目的首席機(jī)器學(xué)習(xí)工程師Loubna Ben Allal介紹:“我們認(rèn)識(shí)到,并非每項(xiàng)任務(wù)都需要龐大的模型來支撐,正如鉆孔無需重型破碎球一樣。專為特定任務(wù)定制的小型模型,同樣能夠勝任繁重的工作?!?/p>

尤為引人注目的是,即便是家族中最小的成員SmolLM-135M,在訓(xùn)練數(shù)據(jù)相對(duì)有限的情況下,其性能仍超越了Meta的MobileLM-125M模型,展現(xiàn)出非凡的潛力。而SmolLM-360M則自豪地宣稱,在性能上已凌駕于所有參數(shù)少于5億的模型之上。至于旗艦產(chǎn)品SmolLM-1.7B,更是在一系列基準(zhǔn)測試中力壓群雄,包括微軟的Phi-1.5和Meta的MobileLM-1.5B等強(qiáng)勁對(duì)手。

Hugging Face不僅在技術(shù)上追求卓越,更在開放共享上樹立了典范。公司決定將SmolLM的整個(gè)開發(fā)流程,從數(shù)據(jù)管理到訓(xùn)練步驟,全部對(duì)外開源。這一舉措不僅彰顯了公司對(duì)開源文化的堅(jiān)定支持,也體現(xiàn)了對(duì)可重復(fù)研究的高度重視,為行業(yè)內(nèi)的科研人員提供了寶貴的資源。

SmolLM系列的卓越表現(xiàn),離不開其背后精心策劃的高質(zhì)量訓(xùn)練數(shù)據(jù)。這些模型依托于Cosmo語料庫構(gòu)建,該語料庫融合了Cosmopedia v2(包含合成教科書與故事)、Python Edu(教育導(dǎo)向的Python示例)以及FineWeb Edu(精選教育網(wǎng)絡(luò)內(nèi)容)等多維度資源,確保了模型學(xué)習(xí)內(nèi)容的豐富性與準(zhǔn)確性。

Loubna Ben Allal強(qiáng)調(diào):“SmolLM系列的成功,是對(duì)數(shù)據(jù)質(zhì)量重要性的有力證明。我們創(chuàng)新性地結(jié)合了網(wǎng)絡(luò)數(shù)據(jù)與合成數(shù)據(jù),通過精心策劃,打造出了這些性能卓越的小型模型?!边@一成就不僅為語言模型領(lǐng)域注入了新的活力,也為未來智能應(yīng)用的發(fā)展開辟了更加廣闊的道路。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)管理
    +關(guān)注

    關(guān)注

    1

    文章

    300

    瀏覽量

    19665
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    538

    瀏覽量

    10339
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    Hugging Face推出最小AI視覺語言模型

    Hugging Face平臺(tái)于1月23日發(fā)布博文,推出了兩款令人矚目的輕量級(jí)AI模型——SmolVLM-256M-Instruct和SmolVLM-500M-Instruct。 其中
    的頭像 發(fā)表于 01-24 14:15 ?311次閱讀

    谷歌推出效率與性能躍階的全新開放模型標(biāo)準(zhǔn)

    AI 有可能解決人類面臨的一些最緊迫的問題,但前提是每個(gè)人都擁有構(gòu)建 AI 的工具。這就是我們?cè)诮衲暝缧r(shí)候推出 Gemma 的原因,Gemma 是一系列輕量級(jí)開放模型系列,采用了與創(chuàng)
    的頭像 發(fā)表于 09-09 15:43 ?428次閱讀
    谷歌<b class='flag-5'>推出</b>效率與性能躍階的全新開放<b class='flag-5'>模型</b>標(biāo)準(zhǔn)

    阿里通義千問Qwen2大模型發(fā)布

    阿里巴巴最近發(fā)布了其通義千問系列的新成員——Qwen2大模型,并在Hugging Face和ModelScope兩大平臺(tái)上實(shí)現(xiàn)了同步開源。這一舉措無疑為人工智能領(lǐng)域的研究者和開發(fā)者們提
    的頭像 發(fā)表于 06-07 15:59 ?807次閱讀

    亞馬遜云攜手AI新創(chuàng)企業(yè)Hugging Face,提升AI模型在定制芯片計(jì)算性能

    Hugging Face作為一家估值為45億美元的公司現(xiàn)已成為了眾多AI研究員和開發(fā)者分享Chatbot和相關(guān)軟件的核心平臺(tái),受到亞馬遜、谷歌、英偉達(dá)等巨頭的青睞。
    的頭像 發(fā)表于 05-23 14:24 ?446次閱讀

    Hugging Face提供1000萬美元免費(fèi)共享GPU

    全球最大的開源AI社區(qū)Hugging Face近日宣布,將提供價(jià)值1000萬美元的免費(fèi)共享GPU資源,以支持開發(fā)者創(chuàng)造新的AI技術(shù)。這一舉措旨在幫助小型開發(fā)者、研究人員和初創(chuàng)公司,對(duì)抗大型AI
    的頭像 發(fā)表于 05-20 09:40 ?709次閱讀

    語言模型:原理與工程時(shí)間+小白初識(shí)大語言模型

    解鎖 我理解的是基于深度學(xué)習(xí),需要訓(xùn)練各種數(shù)據(jù)知識(shí)最后生成自己的的語言理解和能力的交互模型。 對(duì)于常說的RNN是處理短序列的數(shù)據(jù)時(shí)表現(xiàn)出色,耳真正厲害的是Transformer,此框架被推出后直接
    發(fā)表于 05-12 23:57

    Hugging Face推出開源機(jī)器人代碼庫LeRobot

    AI領(lǐng)域的佼佼者Hugging Face近日宣布重磅推出并全面開源其機(jī)器人工具包——LeRobot。這一創(chuàng)新工具包基于史上最大規(guī)模的眾包機(jī)器人數(shù)據(jù)集,為開發(fā)者提供了一個(gè)前所未有的平臺(tái)。
    的頭像 發(fā)表于 05-09 10:32 ?627次閱讀

    【大語言模型:原理與工程實(shí)踐】大語言模型的應(yīng)用

    ,它通過抽象思考和邏輯推理,協(xié)助我們應(yīng)對(duì)復(fù)雜的決策。 相應(yīng)地,我們?cè)O(shè)計(jì)了兩類任務(wù)來檢驗(yàn)大語言模型的能力。一類是感性的、無需理性能力的任務(wù),類似于人類的系統(tǒng)1,如情感分析和抽取式問答等。大語言
    發(fā)表于 05-07 17:21

    【大語言模型:原理與工程實(shí)踐】大語言模型的評(píng)測

    語言模型的評(píng)測是確保模型性能和應(yīng)用適應(yīng)性的關(guān)鍵環(huán)節(jié)。從基座模型到微調(diào)模型,再到行業(yè)模型和整體能
    發(fā)表于 05-07 17:12

    Snowflake推出面向企業(yè)AI的大語言模型

    Snowflake公司近日推出了企業(yè)級(jí)AI模型——Snowflake Arctic,這是一款大型語言模型(LLM),專為滿足企業(yè)復(fù)雜工作負(fù)載
    的頭像 發(fā)表于 05-07 10:03 ?506次閱讀

    【大語言模型:原理與工程實(shí)踐】大語言模型的基礎(chǔ)技術(shù)

    下游任務(wù)提供豐富的文本表示,如谷歌公司推出的BERT。(2) Decoder-Only 預(yù)訓(xùn)練語言模型:這類模型一般使用單向的 Decode
    發(fā)表于 05-05 12:17

    【大語言模型:原理與工程實(shí)踐】揭開大語言模型的面紗

    關(guān)系,從而在各種任務(wù)中表現(xiàn)出色。Transformer架構(gòu)的推出,標(biāo)志著語言模型技術(shù)的重大突破。它摒棄了傳統(tǒng)的遞歸方式,利用自注意力機(jī)制捕捉序列中的依賴關(guān)系。這一創(chuàng)新極大地提高了模型
    發(fā)表于 05-04 23:55

    Stability AI發(fā)布Stable Code Instruct 3B大語言模型,可編譯多種編程語言

    據(jù)報(bào)道,Stability AI公司近期推出了適配程序員使用的Stable Code Instruct 3B大語言模型,此款模型的顯著特點(diǎn)是
    的頭像 發(fā)表于 03-27 10:04 ?564次閱讀

    Anthropic發(fā)布Claude 3系列語言模型,挑戰(zhàn)OpenAI領(lǐng)先地位

    人工智能領(lǐng)域的創(chuàng)業(yè)公司Anthropic推出了其備受矚目的Claude 3系列大型語言模型。該系列
    的頭像 發(fā)表于 03-06 18:11 ?1333次閱讀

    ServiceNow、Hugging Face 和 NVIDIA 發(fā)布全新開放獲取 LLM,助力開發(fā)者運(yùn)用生成式 AI 構(gòu)建企業(yè)應(yīng)用

    2024 年 2 月 28 日 - ServiceNow(NYSE:NOW)、Hugging Face 和 NVIDIA 于今日發(fā)布 StarCoder2,其為一系列用于代碼生成的開放獲取大
    發(fā)表于 02-29 11:12 ?266次閱讀
    ServiceNow、<b class='flag-5'>Hugging</b> <b class='flag-5'>Face</b> 和 NVIDIA 發(fā)布全新開放獲取 LLM,助力開發(fā)者運(yùn)用生成式 AI 構(gòu)建企業(yè)應(yīng)用