欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

麻省大學(xué)研發(fā)MakeItTalk:如何讓圖片開(kāi)口“說(shuō)話”

如意 ? 來(lái)源:新智元 ? 作者:佚名 ? 2020-10-20 16:21 ? 次閱讀

最近,麻省大學(xué)Amherst分校的Yang Zhou博士和他的團(tuán)隊(duì)提出了一種具有深度結(jié)構(gòu)的新方法「MakeItTalk」。給定一個(gè)音頻語(yǔ)音信號(hào)和一個(gè)人像圖像作為輸入,模型便會(huì)生成說(shuō)話人感知的有聲動(dòng)畫(huà)圖。

富有表現(xiàn)力的動(dòng)畫(huà)誰(shuí)都想要!

面部動(dòng)畫(huà)在很多領(lǐng)域都是一項(xiàng)關(guān)鍵技術(shù),比如制作電影、視頻流、電腦游戲、虛擬化身等等。

盡管在技術(shù)上取得了無(wú)數(shù)的成就,但是創(chuàng)造逼真的面部動(dòng)畫(huà)仍然是計(jì)算機(jī)圖形學(xué)的挑戰(zhàn)。

一是整個(gè)面部表情包含了完整面部各部分之間的相互關(guān)系,面部運(yùn)動(dòng)和語(yǔ)音之間的協(xié)同是一項(xiàng)艱巨的任務(wù),因?yàn)槊娌縿?dòng)態(tài)在高維多重影像中占主導(dǎo)地位,其中頭部姿勢(shì)最為關(guān)鍵。

二是多個(gè)說(shuō)話人會(huì)有不同的說(shuō)話方式,控制嘴唇一致,不足以了解說(shuō)話的人的性格,還要表達(dá)不同的個(gè)性。

針對(duì)上述問(wèn)題,Yang Zhou博士和他的團(tuán)隊(duì)提出了一種具有深度結(jié)構(gòu)的新方法「 MakeItTalk」。

這是一種具有深度架構(gòu)的新方法,只需要一個(gè)音頻和一個(gè)面部圖像作為輸入,程序就會(huì)輸出一個(gè)逼真的「說(shuō)話的頭部動(dòng)畫(huà)」。

下面,我們就來(lái)看看,MakeItTalk的是如何讓圖片「說(shuō)話」的。

都給我開(kāi)口說(shuō)話!神奇的 MakeItTalk 是什么?

MakeItTalk是一個(gè)新的深度學(xué)習(xí)為基礎(chǔ)的架構(gòu),能夠識(shí)別面部標(biāo)志、下巴、頭部姿勢(shì)、眉毛、鼻子,并切能夠通過(guò)聲音的刺激使嘴唇發(fā)生變化。

模型以LSTM 和 CNN 為基礎(chǔ),可以根據(jù)說(shuō)話人的音調(diào)和內(nèi)容,讓面部表情和頭部產(chǎn)生隨動(dòng)。

本質(zhì)上, MakeItTalk將輸入音頻信號(hào)中的內(nèi)容和說(shuō)話人分離出來(lái),從產(chǎn)生的抽象表示中提取出對(duì)應(yīng)的動(dòng)畫(huà)。

而嘴唇和相鄰面部的協(xié)同也尤為重要。說(shuō)話者的信息被用來(lái)獲取其他面部表情和頭部動(dòng)作,而這些對(duì)于生成富有表現(xiàn)力的頭部動(dòng)畫(huà)是必需的。

MakeItTalk模型既可以生成逼真的人臉說(shuō)話圖像,也可以生成非逼真的卡通說(shuō)話圖像。

聲音+圖像=「開(kāi)口說(shuō)話」?MakeItTalk是如何做到的?

下面的圖表顯示了生成逼真的說(shuō)話頭像的完整方法和途徑:

(1)一個(gè)音頻剪輯和一個(gè)單一的面部圖像可以制作一個(gè)與音頻協(xié)調(diào)的,能感知說(shuō)話者的頭部動(dòng)畫(huà)。

(2)在訓(xùn)練階段,使用現(xiàn)成的人臉檢測(cè)器對(duì)輸入的視頻進(jìn)行預(yù)處理,提取標(biāo)記,從輸入的音頻中訓(xùn)練基礎(chǔ)模型,實(shí)現(xiàn)語(yǔ)音內(nèi)容轉(zhuǎn)動(dòng)畫(huà)和標(biāo)記的精確提取。

(3)為了獲得高精度的運(yùn)動(dòng),通過(guò)對(duì)輸入音頻信號(hào)的分離內(nèi)容和說(shuō)話人嵌入來(lái)檢測(cè)標(biāo)記點(diǎn)的估計(jì)。為此,采用語(yǔ)音轉(zhuǎn)換神經(jīng)網(wǎng)絡(luò)對(duì)語(yǔ)音內(nèi)容進(jìn)行提取,發(fā)現(xiàn)語(yǔ)音內(nèi)容。

(4)內(nèi)容與說(shuō)話者無(wú)關(guān),并且捕獲了嘴唇和相鄰部位的常見(jiàn)運(yùn)動(dòng),其中說(shuō)話內(nèi)容調(diào)節(jié)了動(dòng)作的特征和說(shuō)話者頭部動(dòng)作的剩余部分。

(5)嘴唇的大小和形狀隨著眼睛、鼻子和頭部的運(yùn)動(dòng)而擴(kuò)大,這取決于誰(shuí)說(shuō)了這個(gè)詞,也就是說(shuō)話人身份。

(6)最后,為了生成轉(zhuǎn)換后的圖像,MakeItTalk采用了兩種算法進(jìn)行標(biāo)記到圖像的合成:

對(duì)于非真實(shí)感的圖像,如畫(huà)布藝術(shù)或矢量藝術(shù),一個(gè)特定的畸變方法是在 Delaunay triangulation 的基礎(chǔ)上部署;

對(duì)于真實(shí)感圖像,構(gòu)建一個(gè)圖像到圖像的轉(zhuǎn)換網(wǎng)絡(luò)(與 pix2pix 相同) ,直接轉(zhuǎn)換自然人臉。

最后,混合所有的圖像幀和音頻共同生成頭部動(dòng)畫(huà)。

作者簡(jiǎn)介

該項(xiàng)目的作者本科畢業(yè)于上海交通大學(xué)電子工程系,然后在喬治亞理工學(xué)院獲得了碩士學(xué)位,現(xiàn)在是馬薩諸塞大學(xué)阿默斯特分校計(jì)算機(jī)圖形學(xué)科學(xué)研究小組的一名計(jì)算機(jī)科學(xué)博士生。

Yang Zhou在計(jì)算機(jī)圖形學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域工作。主要致力于用深度學(xué)習(xí)技術(shù)來(lái)幫助藝術(shù)家、造型師和動(dòng)畫(huà)師做出更好的設(shè)計(jì)。

如果也想給你的設(shè)計(jì)加點(diǎn)AI的基因,Yang Zhou的論文列表絕對(duì)是個(gè)不錯(cuò)的選擇,有很多關(guān)于動(dòng)畫(huà)生成和多模態(tài)深度學(xué)習(xí)的研究。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 音頻
    +關(guān)注

    關(guān)注

    29

    文章

    2909

    瀏覽量

    82001
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3346

    瀏覽量

    49274
  • 圖片
    +關(guān)注

    關(guān)注

    0

    文章

    203

    瀏覽量

    15978
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    中國(guó)移動(dòng)與南京大學(xué)合作研發(fā)高保真2D數(shù)字人說(shuō)話系統(tǒng)

    近日,中國(guó)移動(dòng)宣布了一項(xiàng)重要合作成果——聯(lián)合南京大學(xué)團(tuán)隊(duì)成功研發(fā)出高保真2D數(shù)字人說(shuō)話驅(qū)動(dòng)系統(tǒng)。 作為全球用戶規(guī)模最大的通信運(yùn)營(yíng)商,中國(guó)移動(dòng)每年的客戶服務(wù)運(yùn)營(yíng)成本居高不下。盡管智能語(yǔ)音客服已得到
    的頭像 發(fā)表于 12-13 11:32 ?449次閱讀

    開(kāi)口式電流互感器功能及使用場(chǎng)景

    開(kāi)口式互感器是一種特殊類型的電流互感器,其主要特點(diǎn)是可以在不切斷電纜或母線的情況下進(jìn)行安裝,這對(duì)于正在運(yùn)行的電力系統(tǒng)改造項(xiàng)目尤為重要。開(kāi)口式互感器的設(shè)計(jì)允許它直接穿過(guò)電力系統(tǒng)的導(dǎo)線,無(wú)需斷電操作
    的頭像 發(fā)表于 12-05 10:28 ?465次閱讀
    <b class='flag-5'>開(kāi)口</b>式電流互感器功能及使用場(chǎng)景

    兆元光電與廈門(mén)大學(xué)攜手,Mini/Micro LED技術(shù)將迎新突破

    進(jìn)行深入合作,推動(dòng)Mini/Micro LED技術(shù)的研發(fā)和應(yīng)用。 圖片來(lái)源:兆元光電 此次合作將充分利用廈門(mén)大學(xué)在電子技術(shù)領(lǐng)域的科研優(yōu)勢(shì)和兆元光電在技術(shù)應(yīng)用方面的行業(yè)經(jīng)驗(yàn),計(jì)劃通過(guò)聯(lián)合研發(fā)
    的頭像 發(fā)表于 11-29 09:40 ?259次閱讀
    兆元光電與廈門(mén)<b class='flag-5'>大學(xué)</b>攜手,Mini/Micro LED技術(shù)將迎新突破

    現(xiàn)代起亞聯(lián)合大學(xué)設(shè)立機(jī)器人研發(fā)實(shí)驗(yàn)室

    據(jù)外媒報(bào)道,現(xiàn)代汽車集團(tuán)旗下的現(xiàn)代汽車和起亞汽車于當(dāng)?shù)貢r(shí)間周三共同宣布,他們已經(jīng)攜手首爾大學(xué)、浦項(xiàng)科技大學(xué)以及韓國(guó)科學(xué)技術(shù)研究院,共同創(chuàng)立了一個(gè)專注于機(jī)器人技術(shù)研發(fā)的實(shí)驗(yàn)室。
    的頭像 發(fā)表于 10-25 16:00 ?430次閱讀

    開(kāi)口式互感器好不好 開(kāi)口電流互感器有什么缺點(diǎn)

    安科瑞徐赟杰18706165067 開(kāi)口式互感器是一種常用于測(cè)量電流的傳感器。它通過(guò)將導(dǎo)線穿過(guò)一個(gè)開(kāi)口,利用線圈中的磁場(chǎng)感應(yīng)原理來(lái)測(cè)量電流的強(qiáng)度。本文將以“開(kāi)口式互感器好不好”和“開(kāi)口
    的頭像 發(fā)表于 09-27 09:22 ?616次閱讀
    <b class='flag-5'>開(kāi)口</b>式互感器好不好 <b class='flag-5'>開(kāi)口</b>電流互感器有什么缺點(diǎn)

    安科瑞AKH-0.66系列開(kāi)口式電流互感器

    概述:?[AKH開(kāi)口式電流互感器]?是一種專門(mén)設(shè)計(jì)用于低壓電力測(cè)量的設(shè)備,它屬于[開(kāi)口式電流互感器]的一種,具有高安全性和方便的安裝特性。這種互感器由一個(gè)閉合的璧式鐵芯組成,中間開(kāi)有一個(gè)口,用于容納
    發(fā)表于 09-26 10:37

    基于ArkTS語(yǔ)言的OpenHarmony APP應(yīng)用開(kāi)發(fā):圖片處理

    1、程序介紹本案例使用TextArea實(shí)現(xiàn)多文本輸入,使用mediaLibrary實(shí)現(xiàn)在相冊(cè)中獲取圖片,使用image生成pixelMap,使用pixelMap的scale(),crop
    的頭像 發(fā)表于 09-20 08:07 ?723次閱讀
    基于ArkTS語(yǔ)言的OpenHarmony APP應(yīng)用開(kāi)發(fā):<b class='flag-5'>圖片</b>處理

    2024年芯片行業(yè)有多難?用數(shù)據(jù)說(shuō)話

    2024年芯片行業(yè)有多難?用數(shù)據(jù)說(shuō)話
    的頭像 發(fā)表于 08-10 18:20 ?4784次閱讀

    日本大學(xué)研發(fā)出新極紫外(EUV)光刻技術(shù)

    近日,日本沖繩科學(xué)技術(shù)大學(xué)大學(xué)(OIST)發(fā)布了一項(xiàng)重大研究報(bào)告,宣布該校成功研發(fā)出一種突破性的極紫外(EUV)光刻技術(shù)。這一創(chuàng)新技術(shù)超越了當(dāng)前半導(dǎo)體制造業(yè)的標(biāo)準(zhǔn)界限,其設(shè)計(jì)的光刻設(shè)備能夠采用更小巧的EUV光源,并且功耗僅為傳
    的頭像 發(fā)表于 08-03 12:45 ?1185次閱讀

    未來(lái)的眼睛: 南京大學(xué)團(tuán)隊(duì)研發(fā)出眼動(dòng)追蹤隱形眼鏡

    近日,中國(guó)南京大學(xué)聯(lián)合江蘇省人民醫(yī)院、南京航空航天大學(xué)的研究團(tuán)隊(duì)研發(fā)出 一種具有眼動(dòng)追蹤功能的隱形眼鏡,外觀和普通隱形眼鏡無(wú)異
    的頭像 發(fā)表于 05-20 10:18 ?586次閱讀

    智慧場(chǎng)館解決方案,場(chǎng)館“會(huì)說(shuō)話”!

    在十四五規(guī)劃文件和數(shù)字經(jīng)濟(jì)發(fā)展報(bào)告中,都有明確指出加快建設(shè)數(shù)字城市,數(shù)字中國(guó),旨在深化改革,持續(xù)推進(jìn)我國(guó)場(chǎng)館事業(yè)高質(zhì)量發(fā)展。從傳統(tǒng)場(chǎng)館管理到智慧場(chǎng)館,數(shù)字化的發(fā)展讓我們實(shí)現(xiàn)了場(chǎng)館“會(huì)說(shuō)話”的完美轉(zhuǎn)型
    的頭像 發(fā)表于 04-25 15:34 ?418次閱讀

    HarmonyOS開(kāi)發(fā)案例:【圖片編輯】

    基于canvas組件、圖片編解碼,介紹了圖片編輯實(shí)現(xiàn)過(guò)程。
    的頭像 發(fā)表于 04-22 16:42 ?996次閱讀
    HarmonyOS開(kāi)發(fā)案例:【<b class='flag-5'>圖片</b>編輯】

    未來(lái)之聲 | 人形機(jī)器人說(shuō)話篇:無(wú)聲!

    隨著一個(gè)個(gè)有關(guān)人形機(jī)器人的“核彈式”新聞的出現(xiàn),機(jī)器人技術(shù)肉眼可見(jiàn)地快速發(fā)展。或許,與人們預(yù)想的“像人一樣說(shuō)話”不同,未來(lái)人形機(jī)器人說(shuō)話方式是:無(wú)聲!
    的頭像 發(fā)表于 04-13 08:00 ?375次閱讀
    未來(lái)之聲 | 人形機(jī)器人<b class='flag-5'>說(shuō)話</b>篇:無(wú)聲!

    清華大學(xué)研發(fā)成功大規(guī)模干涉-衍射異構(gòu)集成芯片——太極

    4月12日公布,清華大學(xué)研發(fā)出太極芯片,實(shí)現(xiàn)了每瓦160TOPS的高性能通用智能計(jì)算,這是該校電子工程系與自動(dòng)化系共同攻克的難題。
    的頭像 發(fā)表于 04-12 15:50 ?509次閱讀

    薩里大學(xué)與布里斯托大學(xué)聯(lián)手研發(fā)親水聚合物超級(jí)電容器應(yīng)對(duì)氣候變化

    薩里大學(xué)化學(xué)系的研究團(tuán)隊(duì)與Superielectrics有限公司共同合作,將原本用于隱形眼鏡的親水聚合物改造為具備電活性的材料,以研發(fā)新型超級(jí)電容器。
    的頭像 發(fā)表于 04-12 11:46 ?471次閱讀