水木分子聯(lián)合清華大學(xué)智能產(chǎn)業(yè)研究院(AIR)宣布開源全球首個可商用多模態(tài)生物醫(yī)藥百億參數(shù)大模型 BioMedGPT-10B,可用于提升藥物研發(fā)各個環(huán)節(jié)的效率,包括新藥立項評估、藥物設(shè)計和優(yōu)化、臨床試驗設(shè)計、適應(yīng)癥拓展等。 此外,該模型在生物醫(yī)藥專業(yè)領(lǐng)域問答能力比肩人類專家水平,在自然語言、分子、蛋白質(zhì)跨模態(tài)問答任務(wù)上達(dá)到 SOTA,已成功通過了美國醫(yī)師資格考試。 開源地址:
https://github.com/PharMolix/OpenBioMed
https://huggingface.co/PharMolix/BioMedGPT-LM-7B
BioMedGPT 是全新的多模態(tài)語義理解框架,它運用了生物醫(yī)學(xué)領(lǐng)域中的預(yù)訓(xùn)練大語言模型 —BioMedGPT-LM 作為橋梁,將自然語言、生物編碼語言以及化學(xué)分子語言等連接起來。 BioMedGPT 架構(gòu)::
BioMedGPT-LM 通過充分利用海量生物醫(yī)學(xué)相關(guān)數(shù)據(jù),對通用的基于 GPT 架構(gòu)的大型語言模型進(jìn)行微調(diào),在生物醫(yī)學(xué)領(lǐng)域發(fā)揮更出色的性能。 作為連接橋梁,BioMedGPT-LM 能夠連接各種生物模態(tài)的編碼,包括分子、蛋白質(zhì)、細(xì)胞和基因表達(dá)數(shù)據(jù),同時還能夠整合知識圖譜、文檔、數(shù)值實驗結(jié)果以及其他格式所體現(xiàn)的專業(yè)知識。通過跨模態(tài)特征融合模塊集成,不同模態(tài)的生物編碼語言、化學(xué)分子語言與自然語言能夠在同一個特征空間中實現(xiàn)統(tǒng)一融合。
同時,水木分子、AIR 聯(lián)合開源了全球首個免費可商用、生物醫(yī)藥專用 Llama 2 大語言模型BioMedGPT-LM-7B?!癆IR - 智源健康計算聯(lián)合研究中心” 合作開源了小分子藥物基礎(chǔ)模型 DrugFM。此次開源的生物醫(yī)藥基礎(chǔ)模型重科研、可商用,為生物醫(yī)藥研究與應(yīng)用提供大模型底座。
-
開源
+關(guān)注
關(guān)注
3文章
3412瀏覽量
42743 -
自然語言
+關(guān)注
關(guān)注
1文章
291瀏覽量
13407 -
大模型
+關(guān)注
關(guān)注
2文章
2603瀏覽量
3215
原文標(biāo)題:全球首個可商用生物醫(yī)藥大模型BioMedGPT-10B開源
文章出處:【微信號:OSC開源社區(qū),微信公眾號:OSC開源社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論