據(jù)外媒,知名機器學(xué)習(xí)公司OpenAI近日推出兩套多模態(tài)人工智能系統(tǒng)模型DALL-E和CLIP,DALL-E可以基于文本直接生成圖像,CLIP能夠完成圖像與文本類別的匹配。DALL-E可以將以自然語言形式表達的大量概念轉(zhuǎn)換為恰當(dāng)?shù)膱D像,并使用了GPT-3 同樣的方法,只不過DALL-E將其應(yīng)用于文本-圖像對。
另一個神經(jīng)網(wǎng)絡(luò)CLIP能夠執(zhí)行一系列視覺識別任務(wù)。給出一組以語言形式表述的類別,CLIP能夠立即將一張圖像與其中某個類別進行匹配,而且它不像標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)那樣需要針對這些類別的特定數(shù)據(jù)進行微調(diào)。在ImageNet基準(zhǔn)上,CLIP的性能超過ResNet-50,在識別不常見圖像任務(wù)中的性能遠超ResNet。
雖然CLIP在識別常見對象時往往表現(xiàn)良好,但在計算圖像中對象數(shù)量等更抽象或更系統(tǒng)的任務(wù),以及預(yù)測照片中最靠近車輛間的距離等更復(fù)雜任務(wù)上的表現(xiàn)不佳。在這兩項任務(wù)上,zero-shot CLIP的效果也只比隨機猜測好一點。
責(zé)任編輯:YYX
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
相關(guān)推薦
的新模型研發(fā)、拓展新的應(yīng)用場景有關(guān)。 回顧 OpenAI 的發(fā)展歷程,從最初發(fā)布 OpenAI gym,到后來推出 ChatGPT,再到不斷迭代 GPT 系列
發(fā)表于 02-05 16:38
?363次閱讀
當(dāng)下,人工智能(AI)正以不可阻擋之勢滲透到各行各業(yè),包括醫(yī)療行業(yè)。12月14日,2024中國醫(yī)學(xué)人工智能大會的召開。會上,一款名為“亥步”的多模態(tài)醫(yī)療大
發(fā)表于 12-19 17:56
?249次閱讀
給大家?guī)硪恍┳钚碌?b class='flag-5'>人工智能信息,希望對大家有用。 OpenAI發(fā)布滿血版ChatGPT Pro OpenAI隆重推出了備受期待的“滿血版”ChatGPT Pro。這一新版本基于全新的
發(fā)表于 12-06 11:23
?915次閱讀
近日,多模態(tài)人工智能模型基準(zhǔn)評測集MMMU更新榜單,云知聲山海多模態(tài)大
發(fā)表于 10-12 14:09
?348次閱讀
Meta Platforms近日宣布了一項重要技術(shù)突破,成功推出了多模態(tài)LLAMA 3.2人工智能模型。這一創(chuàng)新
發(fā)表于 09-27 11:44
?456次閱讀
在人工智能技術(shù)的浩瀚星海中,多模態(tài)交互技術(shù)正成為引領(lǐng)未來的新航標(biāo)。繼OpenAI的GPT-4o掀起滔天巨浪后,云知聲以創(chuàng)新之姿,推出了其匠心
發(fā)表于 08-27 15:20
?442次閱讀
在人工智能領(lǐng)域持續(xù)創(chuàng)新的OpenAI,近日推出了其最新力作——“GPT-4o mini”,一款旨在以親民價格提供強大功能的小型聊天機器人。這款產(chǎn)品的問世,標(biāo)志著OpenAI在推動
發(fā)表于 07-19 15:27
?737次閱讀
近日,智譜AI在人工智能領(lǐng)域取得重大突破,成功推出全新開源模型GLM-4-9B。這款模型以其卓越的多模態(tài)
發(fā)表于 06-07 09:17
?832次閱讀
當(dāng)?shù)貢r間5月13日OpenAI推出ChatGPT-4o,代表了人工智能向前邁出的一大步。在GPT-4turbo的強大基礎(chǔ)上,這種迭代擁有顯著的改進。在發(fā)布會的演示中,OpenAI展示
發(fā)表于 05-27 15:43
美國人工智能公司OpenAI于14日凌晨正式推出了一個更快、更便宜的人工智能模型來支持其聊天機器人ChatGPT。
發(fā)表于 05-15 15:12
?663次閱讀
人工智能領(lǐng)域的領(lǐng)軍者OpenAI在最近的春季更新活動中,重磅推出了全新升級的ChatGPT版本,它支持了GPT-4o這一強大的人工智能模型。
發(fā)表于 05-14 10:52
?600次閱讀
近日,科技巨頭蘋果公司在一篇由多位專家共同撰寫的論文中,正式公布了其最新的多模態(tài)大模型研究成果——MM1。這款具有高達300億參數(shù)的多模態(tài)
發(fā)表于 03-19 11:19
?961次閱讀
OpenAI迎戰(zhàn)紐約時報指控 《紐約時報》提起版權(quán)訴訟指控OpenAI非法使用其內(nèi)容訓(xùn)練人工智能模型,OpenAI積極迎戰(zhàn),
發(fā)表于 02-28 15:05
?585次閱讀
近日,人工智能領(lǐng)域的領(lǐng)軍企業(yè)OpenAI宣布推出其最新的人工智能文生視頻大模型——Sora。這款模型
發(fā)表于 02-20 13:54
?925次閱讀
全球人工智能領(lǐng)域的佼佼者OpenAI近日發(fā)布了一款名為Sora的短視頻生成模型,該模型能夠根據(jù)文字指令即時生成高質(zhì)量短視頻,引起了業(yè)界的廣泛關(guān)注。
發(fā)表于 02-18 10:16
?1420次閱讀
評論