如今人工智能越來(lái)越強(qiáng)大,比如可以實(shí)現(xiàn)生成音樂(lè)、改變圖片藝術(shù)風(fēng)格等等。最近,人工智能非營(yíng)利組織OpenAI發(fā)布了一個(gè)名為DALL-E的神經(jīng)網(wǎng)絡(luò),可以將文本轉(zhuǎn)換成與內(nèi)容相關(guān)的圖像。
比如生成下面這些穿著芭蕾舞裙揮舞著光劍的熊貓寶寶:
OpenAI在一篇博文中表示,該系統(tǒng)是具有里程碑意義的GPT-3語(yǔ)言模型的120億參數(shù)版本。
DALL-E模型具有多種功能,包括創(chuàng)建動(dòng)物和物體的擬物化版本,以合理的方式展示相關(guān)的概念,渲染文本,以及對(duì)現(xiàn)有圖像進(jìn)行轉(zhuǎn)換。
比如在該模型中選定“與貓有關(guān)的文本關(guān)鍵詞”,同時(shí)選擇給定的其中一種貓類(lèi)型,最終系統(tǒng)會(huì)自動(dòng)生成一系列與貓主題有關(guān)的圖像,并且風(fēng)格呈現(xiàn)多樣化。
訓(xùn)練該模型的數(shù)據(jù)集主要基于互聯(lián)網(wǎng)大量文本-圖像。這使得它能夠通過(guò)探索提示的結(jié)構(gòu)來(lái)創(chuàng)造出全新的圖片。比如生成一些令人印象深刻的地標(biāo)、位置、雜交動(dòng)物和不同年代設(shè)計(jì)的圖像。但是OpenAI承認(rèn)并不是所有的結(jié)果都是成功的。
不過(guò),OpenAI承認(rèn)并不是所有生成的結(jié)果都是成功的。該公司表示,DALL-E系統(tǒng)有時(shí)無(wú)法繪制出某些特定的項(xiàng)目,混淆了對(duì)象與其特定屬性之間的關(guān)系。
通常,提示DALL-E寫(xiě)的字符串越長(zhǎng),成功率越低。測(cè)試中發(fā)現(xiàn),重復(fù)部分文本內(nèi)容,準(zhǔn)確率有所提高。
當(dāng)回答有關(guān)地理方面的問(wèn)題時(shí),比如旗幟、菜肴和當(dāng)?shù)匾吧鷦?dòng)物,DALL-E也經(jīng)常反映出膚淺的刻板印象??紤]到人們?cè)絹?lái)越關(guān)注人工智能算法偏見(jiàn)的問(wèn)題,這個(gè)缺點(diǎn)尤為明顯。
OpenAI表示,它計(jì)劃分析DALL-E等模特的社會(huì)影響,但該公司認(rèn)為,該系統(tǒng)表明“通過(guò)語(yǔ)言操縱視覺(jué)概念現(xiàn)在已經(jīng)觸手可及?!?/p>
感興趣的小伙伴可以在OpenAI網(wǎng)站上查看更多DALL-E模型生成的圖像。
責(zé)編AJX
-
圖像處理
+關(guān)注
關(guān)注
27文章
1304瀏覽量
56911 -
AI
+關(guān)注
關(guān)注
87文章
31711瀏覽量
270511 -
模型
+關(guān)注
關(guān)注
1文章
3342瀏覽量
49272
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
廣和通發(fā)布AI玩具大模型解決方案
【「基于大模型的RAG應(yīng)用開(kāi)發(fā)與優(yōu)化」閱讀體驗(yàn)】+Embedding技術(shù)解讀
OpenAI推出AI視頻生成模型Sora
AI模型部署邊緣設(shè)備的奇妙之旅:如何實(shí)現(xiàn)手寫(xiě)數(shù)字識(shí)別
NVIDIA推出全新生成式AI模型Fugatto
AI大模型的訓(xùn)練數(shù)據(jù)來(lái)源分析
AI大模型的最新研究進(jìn)展
未來(lái)AI大模型的發(fā)展趨勢(shì)
AI大模型在圖像識(shí)別中的優(yōu)勢(shì)
AI大模型在自然語(yǔ)言處理中的應(yīng)用
微軟Azure AI語(yǔ)音服務(wù)革新:引入虛擬人形象,文本一鍵轉(zhuǎn)生動(dòng)視頻
李未可科技正式推出WAKE-AI多模態(tài)AI大模型
![李未可科技正式推出WAKE-<b class='flag-5'>AI</b>多模態(tài)<b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>](https://file1.elecfans.com/web2/M00/CD/4D/wKgZomYg4ZyAbfOHAFDzaCuLdZ8032.png)
阿里巴巴推出全新AI圖生視頻模型EMO
英偉達(dá)如何應(yīng)對(duì)AI芯片市場(chǎng)需求的轉(zhuǎn)變
Stability AI試圖通過(guò)新的圖像生成人工智能模型保持領(lǐng)先地位
![Stability <b class='flag-5'>AI</b>試圖通過(guò)新的<b class='flag-5'>圖像</b>生成人工智能<b class='flag-5'>模型</b>保持領(lǐng)先地位](https://file1.elecfans.com/web2/M00/C0/2D/wKgZomXTC6yAF6b2AAAZGR4nIDs515.png)
評(píng)論