欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能閱讀的突破唇語

我快閉嘴 ? 來源: 智東西 ? 作者: 智東西 ? 2020-01-29 16:28 ? 次閱讀

12月5日消息,據(jù)外媒報道,阿里巴巴浙江大學研究中心和史蒂文斯理工學院(Stevens Institute of Technology)的研究人員近日推出了一種提升AI閱讀唇語準確率的方法——“Lip by Speech(LIBS)”。該方法利用視頻中的語音信息作為輔助線索,減少了AI對視頻中無關幀的關注,使其注意力更加集中。據(jù)研究人員稱,使用該方法的AI在兩個唇語閱讀基準測試中,字符錯誤率分別降低了7.66%和2.75%。

一、圖像語音相結(jié)合解讀唇語

▲面部圖像識別的過程示例

實際上,能夠從視頻中讀唇語的AI和機器學習算法并不是什么新鮮事物。早在2016年,谷歌和牛津大學的研究人員就詳細介紹了一種系統(tǒng),該系統(tǒng)可以以46.8%的精度注釋視頻素材,優(yōu)于專業(yè)讀唇語人員12.4%的精度。但是,即使是最先進的系統(tǒng)也難以解決唇部運動的“一語多義”問題,從而使唇語識別的準確率一直無法超越語音識別。

為了追求唇語閱讀性能更加強大的系統(tǒng),阿里巴巴浙江大學研究中心和史蒂文斯理工學院的研究人員設計了一種方法,稱為“Lip by Speech(LIBS)”。該方法利用從語音識別器中提取的特征信息作為補充線索。他們說,利用該方法的系統(tǒng)在兩個基準測試中都達到了業(yè)界領先的準確性,在字符錯誤率方面分別降低了7.66%和2.75%。

LIBS和其他類似的解決方案可以幫助那些聽障人士觀看缺少字幕的視頻。據(jù)估計,全世界有4.66億人患有失能性聽力障礙(disabling hearing loss),約占世界人口的5%。根據(jù)世界衛(wèi)生組織的數(shù)據(jù),到2050年,這一數(shù)字可能會超過9億。

二、LIBS方法是怎樣應用的?

▲WAS與LIBS方法唇語解讀標記范圍的對比

LIBS會以多種規(guī)模等級,從有聲視頻中提取有用的音頻數(shù)據(jù),包括序列級(sequence level)、文本級(context level)和幀級(frame level)。然后,將這些提取的數(shù)據(jù)與視頻數(shù)據(jù)通過他們之間的對應關系對齊,最后利用一種篩選(filtering)技術來優(yōu)化(refine)提取的數(shù)據(jù)。

LIBS的語音識別器和唇語閱讀器這兩部分均為一種“基于注意力的序列到序列的(attention-based sequence-to-sequence)”體系結(jié)構,這種體系結(jié)構可將一段音頻或視頻序列的輸入信息轉(zhuǎn)化為帶有標簽和注意價值(attention value)的輸出信息。

研究人員通過上述方法在LRS2數(shù)據(jù)集上對系統(tǒng)進行訓練,LRS2包含來自BBC的45,000多個口頭句子,同時也在CMLR上訓練,CMLR是現(xiàn)有的最大中文普通話口語語料庫,具有來自中國網(wǎng)絡電視臺的10萬多個自然句子(包括3,000多個中文字符和20,000個詞組)。

三、“幀級知識提取”是關鍵

該團隊指出,由于LRS2數(shù)據(jù)集中的某些句子過短,該系統(tǒng)難以在LRS2數(shù)據(jù)集上實現(xiàn)“合理的”結(jié)果。但是,一旦對最大長度為16個單詞的句子進行了預訓練,解碼器就可以利用文本級的知識,提高LRS2數(shù)據(jù)集中句子結(jié)尾部分的質(zhì)量。

研究人員在論文中寫道:“LIBS減少了對無關幀的關注”,“幀級知識的提?。╢rame-level knowledge distillation)進一步提高了視頻幀特征的可分辨性,使注意力更加集中。”

結(jié)語:AI唇語識別市場仍具有較高增長潛力

目前AI唇語識別在基準測試中的準確率仍然在50%左右,現(xiàn)實應用價值還有待于準確率的進一步提升。此次新提出的LIBS方法為這一領域的研究提供了更好的思路,一種視頻語音相結(jié)合的研究思路。金融身份識別、嘈雜環(huán)境下的語音識別輔助、聽障人士的輔助交流等領域均為AI唇語識別的重要應用場景。期待國內(nèi)外科技巨頭在該領域有更多新的突破。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1796

    文章

    47794

    瀏覽量

    240587
  • 阿里巴巴
    +關注

    關注

    7

    文章

    1623

    瀏覽量

    47572
  • 唇語識別
    +關注

    關注

    0

    文章

    4

    瀏覽量

    2016
收藏 人收藏

    評論

    相關推薦

    人工智能是什么?

    ` 人工智能是什么?什么是人工智能?人工智能是未來發(fā)展的必然趨勢嗎?以后人工智能技術真的能達到電影里機器人的智能水平嗎?如果技術成熟的那一天
    發(fā)表于 09-16 15:40

    百度總裁:百度在人工智能領域已有重大突破

      隨著阿法狗大戰(zhàn)李世石,人工智能引發(fā)越來越多的關注。百度總裁張亞勤28日表示,百度長期堅持技術創(chuàng)新,2015年研發(fā)投入超過100億元,目前在人工智能領域已有重大突破。  張亞勤在天津夏季達沃斯論壇
    發(fā)表于 07-01 15:22

    百度人工智能大神離職,人工智能的出路在哪?

    `今天,吳恩達確認離職百度的消息迅速在業(yè)界刷屏。吳恩達曾不止一次感慨,現(xiàn)在人工智能最大的問題就是“機會太多,但人才太少”。AI,人工智能,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理
    發(fā)表于 03-23 17:00

    人工智能就業(yè)前景

    據(jù)相關招聘機構數(shù)據(jù)顯示,2018年AI領域仍然是大部分資深技術人才轉(zhuǎn)崗的首選目標,在人才最緊缺的前十大職位中,時下最火的大數(shù)據(jù)、人工智能、算法類崗位占據(jù)半壁江山。據(jù)調(diào)查指出,2017年技術研發(fā)類崗位
    發(fā)表于 03-29 15:46

    解讀人工智能的未來

    `已歷經(jīng)60多年的人工智能在物聯(lián)網(wǎng)以及大數(shù)據(jù)的推動下,實現(xiàn)飛躍式的發(fā)展,并且迎來了第三個黃金周期。必優(yōu)傳感今天和大家解讀一下關于人工智能的未來。自從有了人工智能,引發(fā)了人類的各種“未來論”。有人說
    發(fā)表于 11-14 10:43

    【2019人工智能大會】大咖齊聚,共同探討加速人工智能技術落地

    金額就突破了 1500 億元。2017 年,全球人工智能芯片市場規(guī)模是 44.7 億美元,2018 年達到 57 億美元,預計 2020 年有望突破百億大關,而到 2025 年人工智能
    發(fā)表于 01-21 17:20

    人工智能醫(yī)生未來或上線,人工智能醫(yī)療市場規(guī)模持續(xù)增長

      導讀:機構預測,中國醫(yī)療人工智能的市場需求已達數(shù)百億元。專家認為,“人工智能醫(yī)生”的應用,有利于緩解社會老齡化帶來的醫(yī)療資源供需失衡以及地域分配不均等問題。那么,“人工智能醫(yī)生”何時能真正
    發(fā)表于 02-24 09:29

    人工智能:超越炒作

    開車或飛行,您可以相信會涉及一些嚴重的AI功能。閱讀,說話或翻譯語言,預測物體的質(zhì)量和速度,代表你購買股票,識別面部或診斷乳腺癌,都是通過算法完成的人工智能特征。現(xiàn)在,想象一下整個AI事物的連接世界
    發(fā)表于 05-29 10:46

    什么是基于云計算的人工智能服務?

    如今,采用人工智能的企業(yè)遇到了一個主要障礙,那就是在內(nèi)部開發(fā)人工智能產(chǎn)品成本高昂,因此有了外包人工智能產(chǎn)品的需求。而對于從中小企業(yè)到預算受限的大型企業(yè)來說,通過云計算來采用人工智能的成
    發(fā)表于 09-11 11:51

    人工智能未來的突破點究竟在哪里?是電子硬件還是軟件呢?

    在給定的硅片上能裝多少個晶體管?人工智能未來的突破點究竟在哪里?是電子硬件還是軟件呢?
    發(fā)表于 06-17 06:13

    人工智能芯片是人工智能發(fā)展的

    人工智能芯片是人工智能發(fā)展的 | 特倫斯謝諾夫斯基責編 | 屠敏本文內(nèi)容經(jīng)授權摘自《深度學習 智能時代的核心驅(qū)動力量》從AlphaGo的人機對戰(zhàn),到無人駕駛汽車的上路,再到AI合成主播上崗
    發(fā)表于 07-27 07:02

    物聯(lián)網(wǎng)人工智能是什么?

    一、人工智能介紹工作以后想要拿高薪的話,人工智能是你的不二之選,那么問題來了,究竟什么是人工智能呢?又需要了解哪些才能去開發(fā)人工智能產(chǎn)品呢?接下來小編帶領大家進入
    發(fā)表于 09-09 14:12

    嵌入式與人工智能關系是什么

    嵌入式與人工智能關系_嵌入式人工智能的發(fā)展趨勢  所謂嵌入式人工智能,就是設備無須聯(lián)網(wǎng)通過云端數(shù)據(jù)中心進行大規(guī)模計算去實現(xiàn)人工智能,而是在本地計算,在不聯(lián)網(wǎng)的情況下就可以做實時的環(huán)境感
    發(fā)表于 10-27 07:41

    《移動終端人工智能技術與應用開發(fā)》人工智能的發(fā)展與AI技術的進步

    人工智能的發(fā)展是隨著人類生活需要,產(chǎn)業(yè)需求不斷提升的,其中人工智能的發(fā)展很大程度上受到了計算機算力的影響,隨著數(shù)據(jù)處理量的增大,人工智能算法對算力的要求逐年增加,而且沒過兩年算力上升一倍,因此往往
    發(fā)表于 02-17 11:00

    谷歌人工智能小組DeepMind研發(fā)“讀”軟件 毫不遜色于人類

    谷歌(微博)人工智能部門DeepMind正與牛津大學研究人員合作,希望開發(fā)出全球最先進的“讀”軟件,可能比人類的“讀”能力還要出色。
    發(fā)表于 11-25 10:00 ?671次閱讀