欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基因組學(xué)大型語(yǔ)言模型在多項(xiàng)任務(wù)中均展現(xiàn)出卓越的性能和應(yīng)用擴(kuò)展空間

NVIDIA英偉達(dá) ? 來(lái)源:未知 ? 2023-01-17 01:05 ? 次閱讀

InstaDeep、慕尼黑工業(yè)大學(xué)(TUM)和 NVIDIA 之間的合作推動(dòng)了面向基因組學(xué)的多超級(jí)計(jì)算規(guī)模的基礎(chǔ)模型開(kāi)發(fā)進(jìn)程。這些模型在大量預(yù)測(cè)任務(wù)(例如啟動(dòng)子和增強(qiáng)子位點(diǎn)預(yù)測(cè))中展示了最先進(jìn)的性能。

f0209c2e-95bd-11ed-bfe3-dac502259ad0.jpg

這一聯(lián)合團(tuán)隊(duì)的研究指出,經(jīng)過(guò)基因組學(xué)訓(xùn)練的大型語(yǔ)言模型(LLM)可將應(yīng)用擴(kuò)展到大量基因組學(xué)任務(wù)。

該團(tuán)隊(duì)使用 NVIDIA 的超級(jí)計(jì)算機(jī) Cambridge-1 來(lái)訓(xùn)練參數(shù)規(guī)模從 500M 到 2.5B 不等的各種大型語(yǔ)言模型(LLM)。這些模型在各種基因組數(shù)據(jù)集上進(jìn)行了訓(xùn)練,以探索模型規(guī)模和數(shù)據(jù)多樣性對(duì)下游任務(wù)性能的影響。

分類(lèi)任務(wù)包括預(yù)測(cè)增強(qiáng)子和啟動(dòng)子序列以及轉(zhuǎn)錄因子結(jié)合位點(diǎn)。這些任務(wù)有助于了解 DNA 如何轉(zhuǎn)錄生成 RNA 和蛋白質(zhì),從而開(kāi)啟新的臨床應(yīng)用。

研究中明確了 20 項(xiàng)任務(wù)。對(duì)于每一項(xiàng)任務(wù),性能都隨著模型規(guī)模和數(shù)據(jù)集多樣性的增加而單調(diào)遞增。參照專(zhuān)門(mén)的最新模型基線,在多物種數(shù)據(jù)集上訓(xùn)練的具有最大參數(shù)規(guī)模(2.5B 參數(shù))的大型語(yǔ)言模型在 19 項(xiàng)任務(wù)中的 15 項(xiàng)中取得了同等或更高的性能。

這些結(jié)果是通過(guò)利用參數(shù)輕量化微調(diào)實(shí)現(xiàn)的。然而,即使依靠從 Transformer 模型各層提取的預(yù)訓(xùn)練嵌入以及簡(jiǎn)單的淺層感知器(MLP)或邏輯回歸,也足以在 11 個(gè)任務(wù)中實(shí)現(xiàn)同等乃至更高的性能。

在每個(gè)模型檢查點(diǎn)和每個(gè)任務(wù)的所有層上應(yīng)用這種探測(cè)策略,訓(xùn)練出了 120 萬(wàn)個(gè) MLP 模型。該研究對(duì)大型語(yǔ)言模型的訓(xùn)練和使用等各方面進(jìn)行了詳細(xì)分析,例如不同層對(duì)下游任務(wù)性能的影響。

在固定模型規(guī)模下直接比較序列多樣性,顯示出具有重要意義的性能提升,增加模型規(guī)模也是如此。例如,對(duì)于一個(gè) 500M 參數(shù)模型,僅在人類(lèi)參考基因組上訓(xùn)練的性能不如在 1000 基因組數(shù)據(jù)集上訓(xùn)練的性能。

同樣,在 1000 基因組數(shù)據(jù)集上訓(xùn)練的 2.5B 參數(shù)模型的性能優(yōu)于任何 500M 參數(shù)模型。而對(duì)于相同的模型,性能會(huì)遜于在自定義多物種數(shù)據(jù)集上訓(xùn)練的結(jié)果,即使下游性能是在僅涉及人類(lèi)基因組的任務(wù)上測(cè)量的。

研究人員觀察到,并非所有嵌入都是平等創(chuàng)建的。雖然通常的做法建議使用大型語(yǔ)言模型的最后一層進(jìn)行下游預(yù)測(cè)。但耐人尋味的是,中間層產(chǎn)生的表征在下游任務(wù)中顯示出明顯更高的性能。研究人員發(fā)現(xiàn),最佳層的選擇取決于任務(wù),表明不同類(lèi)型的 DNA 特征被不同層的模型所捕獲。

InstaDeep 首席執(zhí)行官 Karim Beguir 表示:“我們相信這些結(jié)果首次清楚地證明了基因組學(xué)基礎(chǔ)模型的可行性,這些模型能夠真正地推廣到多項(xiàng)任務(wù)中。這些結(jié)果從很多方面反映出了過(guò)去幾年內(nèi)適應(yīng)性基礎(chǔ)模型在自然語(yǔ)言處理方面的發(fā)展進(jìn)程。如今,其應(yīng)用于藥物研發(fā)和人類(lèi)健康等如此具有挑戰(zhàn)性的問(wèn)題,著實(shí)令人難以置信的興奮?!?/p>

NVIDIA 的 Cambridge-1 對(duì)該項(xiàng)目的成功至關(guān)重要。該項(xiàng)目需要高性能計(jì)算基礎(chǔ)設(shè)施來(lái)訓(xùn)練具有捕獲基因組中遠(yuǎn)程相互作用所需感受域的大型模型。

研究人員嘗試了多種方法、數(shù)據(jù)集大小、模型規(guī)模和分詞器方案,最終使用在 16 個(gè) NVIDIA DGX A100 節(jié)點(diǎn)(128 個(gè) A100 80GB GPU)上訓(xùn)練的 2.5B 參數(shù)稀疏注意力模型,在多任務(wù)上實(shí)現(xiàn)了迄今公開(kāi)發(fā)表的最佳性能。

在未來(lái)的研究工作中,該團(tuán)隊(duì)計(jì)劃通過(guò)直接微調(diào)模型,探索進(jìn)一步的下游任務(wù)性能改進(jìn),并將繼續(xù)在應(yīng)用于基因組學(xué)的大型語(yǔ)言模型的架構(gòu)創(chuàng)新方面展開(kāi)合作。InstaDeep 是首批使用 Cambridge-1 的 NVIDIA 初創(chuàng)加速計(jì)劃成員之一。

掃描下方海報(bào)二維碼,即可免費(fèi)注冊(cè) GTC 23,切莫錯(cuò)過(guò)這場(chǎng) AI 和元宇宙時(shí)代的技術(shù)大會(huì)!


原文標(biāo)題:基因組學(xué)大型語(yǔ)言模型在多項(xiàng)任務(wù)中均展現(xiàn)出卓越的性能和應(yīng)用擴(kuò)展空間

文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3851

    瀏覽量

    92055

原文標(biāo)題:基因組學(xué)大型語(yǔ)言模型在多項(xiàng)任務(wù)中均展現(xiàn)出卓越的性能和應(yīng)用擴(kuò)展空間

文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    【「基于大模型的RAG應(yīng)用開(kāi)發(fā)與優(yōu)化」閱讀體驗(yàn)】+大模型微調(diào)技術(shù)解讀

    。通過(guò)微調(diào),模型可以學(xué)習(xí)特定領(lǐng)域的專(zhuān)業(yè)知識(shí)和語(yǔ)言特征,從而在高度專(zhuān)業(yè)化的領(lǐng)域中展現(xiàn)出卓越的表現(xiàn)。微調(diào)過(guò)程主要有這幾項(xiàng)內(nèi)容:數(shù)據(jù)清洗:消除噪聲、提高數(shù)據(jù)質(zhì)量。包括處理缺失值(如用特殊符號(hào)
    發(fā)表于 01-14 16:51

    NVIDIA 攜手行業(yè)領(lǐng)先機(jī)構(gòu)推動(dòng)基因組學(xué)、藥物發(fā)現(xiàn)及醫(yī)療健康行業(yè)發(fā)展

    ——NVIDIA 今日宣布新的合作伙伴關(guān)系,旨在通過(guò)加速藥物發(fā)現(xiàn)、提升基因組研究,以及利用代理式和生成式 AI 開(kāi)創(chuàng)先進(jìn)醫(yī)療服務(wù),推動(dòng)規(guī)模達(dá) 10 萬(wàn)億美元的醫(yī)療健康與生命科學(xué)產(chǎn)業(yè)的變革。 ? AI、加速計(jì)算與生物數(shù)據(jù)的融合,正將醫(yī)療健康產(chǎn)業(yè)轉(zhuǎn)變?yōu)榇笠?guī)模的技術(shù)產(chǎn)業(yè)。醫(yī)療健康領(lǐng)域的領(lǐng)先機(jī)構(gòu)
    發(fā)表于 01-14 13:39 ?109次閱讀
    NVIDIA 攜手行業(yè)領(lǐng)先機(jī)構(gòu)推動(dòng)<b class='flag-5'>基因組學(xué)</b>、藥物發(fā)現(xiàn)及醫(yī)療健康行業(yè)發(fā)展

    Kimi發(fā)布視覺(jué)思考模型k1,展現(xiàn)卓越基礎(chǔ)科學(xué)能力

    色,其能力還成功擴(kuò)展到了物理、化學(xué)等基礎(chǔ)科學(xué)領(lǐng)域。這標(biāo)志著Kimi視覺(jué)思考模型的技術(shù)研發(fā)上取得了重大突破,為用戶多個(gè)學(xué)科領(lǐng)域提供了強(qiáng)大的支持。
    的頭像 發(fā)表于 12-17 09:59 ?372次閱讀

    NVIDIA AI助力日本制藥公司推進(jìn)藥物研發(fā)

    制藥公司、醫(yī)療技術(shù)公司和學(xué)術(shù)研究人員正在開(kāi)發(fā)主權(quán) AI 能力,以驅(qū)動(dòng)藥物發(fā)現(xiàn)、加速基因組學(xué)和醫(yī)療設(shè)備。
    的頭像 發(fā)表于 11-19 15:40 ?404次閱讀

    騰訊發(fā)布開(kāi)源MoE大語(yǔ)言模型Hunyuan-Large

    性能,標(biāo)志著騰訊自然語(yǔ)言處理領(lǐng)域邁出了重要的一步。 據(jù)了解,Hunyuan-Large的總參數(shù)量高達(dá)389B(即3890億),這一數(shù)字遠(yuǎn)超當(dāng)前許多主流的大語(yǔ)言
    的頭像 發(fā)表于 11-06 10:57 ?376次閱讀

    AI大模型自然語(yǔ)言處理的應(yīng)用

    海量的文本數(shù)據(jù),能夠生成結(jié)構(gòu)化、連貫的文本段落。 新聞寫(xiě)作、創(chuàng)意內(nèi)容生成等場(chǎng)景,AI大模型展現(xiàn)出卓越的效果。例如,GPT系列
    的頭像 發(fā)表于 10-23 14:38 ?662次閱讀

    NVIDIA Parabricks v4.3.1版本的新功能

    NVIDIA Parabricks 擴(kuò)大了 NVIDIA 利用深度學(xué)習(xí)解決基因組學(xué)挑戰(zhàn)的范圍,持續(xù)推動(dòng)基因組學(xué)儀器的發(fā)展。NVIDIA Parabricks v4.3.1 歐洲人類(lèi)遺傳學(xué)
    的頭像 發(fā)表于 09-10 10:22 ?456次閱讀
    NVIDIA Parabricks v4.3.1版本的新功能

    Transformer語(yǔ)言模型簡(jiǎn)介與實(shí)現(xiàn)過(guò)程

    自然語(yǔ)言處理(NLP)領(lǐng)域,Transformer模型以其卓越性能和廣泛的應(yīng)用前景,成為了近年來(lái)最引人注目的技術(shù)之一。Transform
    的頭像 發(fā)表于 07-10 11:48 ?2107次閱讀

    Meta AI主管楊立昆:大語(yǔ)言模型尚未到達(dá)人類(lèi)智能水平

    他明確提出,雖然此類(lèi)模型特定任務(wù)展現(xiàn)出優(yōu)越性能,但其內(nèi)在局限性使其難以媲美人類(lèi)的智慧,如推理
    的頭像 發(fā)表于 05-23 17:18 ?778次閱讀

    【大語(yǔ)言模型:原理與工程實(shí)踐】大語(yǔ)言模型的應(yīng)用

    類(lèi)任務(wù)上表現(xiàn)出色,甚至零樣本條件下也能取得良好效果。另一類(lèi)則需要逐步推理才能完成的任務(wù),類(lèi)似于人類(lèi)的系統(tǒng)2,如數(shù)字推理等。然而,隨著參數(shù)量的增加,大
    發(fā)表于 05-07 17:21

    【大語(yǔ)言模型:原理與工程實(shí)踐】大語(yǔ)言模型的評(píng)測(cè)

    知識(shí)獲取、邏輯推理、代碼生成等方面的能力。這些評(píng)測(cè)基準(zhǔn)包括語(yǔ)言建模能力、綜合知識(shí)能力、數(shù)學(xué)計(jì)算能力、代碼能力和垂直領(lǐng)域等多個(gè)維度。對(duì)于微調(diào)模型,對(duì)話能力的評(píng)測(cè)關(guān)注模型在對(duì)話
    發(fā)表于 05-07 17:12

    【大語(yǔ)言模型:原理與工程實(shí)踐】大語(yǔ)言模型的預(yù)訓(xùn)練

    如此卓越性能,就是通過(guò)其核心能力對(duì)海量數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,再進(jìn)行微調(diào)或?qū)ζ涫裁葱透玫母鶕?jù)人類(lèi)的指令和偏好,發(fā)揮這些性能。隨著語(yǔ)言模型參數(shù)的不
    發(fā)表于 05-07 17:10

    Snowflake推出面向企業(yè)AI的大語(yǔ)言模型

    Snowflake公司近日推出了企業(yè)級(jí)AI模型——Snowflake Arctic,這是一款大型語(yǔ)言模型(LLM),專(zhuān)為滿足企業(yè)復(fù)雜工作負(fù)載的需求而設(shè)計(jì)。Snowflake Arcti
    的頭像 發(fā)表于 05-07 10:03 ?516次閱讀

    【大語(yǔ)言模型:原理與工程實(shí)踐】大語(yǔ)言模型的基礎(chǔ)技術(shù)

    之后,成為文本建模領(lǐng)域的熱門(mén)架構(gòu)。不僅如此,它還對(duì)自然語(yǔ)言處理領(lǐng)域產(chǎn)生了深遠(yuǎn)的影響?;赥ransformer的預(yù)訓(xùn)練模型,如GPT系列和BERT系列,已在多種任務(wù)上取得了卓越的成績(jī)。
    發(fā)表于 05-05 12:17

    【大語(yǔ)言模型:原理與工程實(shí)踐】揭開(kāi)大語(yǔ)言模型的面紗

    化能力和適應(yīng)性。自然語(yǔ)言處理任務(wù),大語(yǔ)言模型展現(xiàn)出
    發(fā)表于 05-04 23:55