欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

實(shí)時通信中的AI降噪技術(shù)分析

jf_uPRfTJDa ? 來源:5G通信 ? 2023-01-15 10:37 ? 次閱讀

Part 01●概述●

在實(shí)時音視頻通信場景,麥克風(fēng)采集用戶語音的同時會采集大量環(huán)境噪聲,傳統(tǒng)降噪算法僅對平穩(wěn)噪聲(如電扇風(fēng)聲、白噪聲、電路底噪等)有一定效果,對非平穩(wěn)的瞬態(tài)噪聲(如餐廳嘈雜噪聲、地鐵環(huán)境噪聲、家庭廚房噪聲等)降噪效果較差,嚴(yán)重影響用戶的通話體驗(yàn)。針對泛家庭、辦公等復(fù)雜場景中的上百種非平穩(wěn)噪聲問題,融合通信系統(tǒng)部生態(tài)賦能團(tuán)隊(duì)自主研發(fā)基于GRU模型的AI音頻降噪技術(shù),并通過算法和工程優(yōu)化,將降噪模型尺寸從2.4MB壓縮至82KB,運(yùn)行內(nèi)存降低約65%;計(jì)算復(fù)雜度從約186Mflops優(yōu)化至42Mflops,運(yùn)行效率提升77%;在現(xiàn)有的測試數(shù)據(jù)集中(實(shí)驗(yàn)環(huán)境下),可有效分離人聲和噪聲,將通話語音質(zhì)量Mos分(平均意見值)提升至4.25。

Part 02●噪聲分類和降噪算法選擇●

實(shí)時音視頻的應(yīng)用場景中,設(shè)備處于復(fù)雜的聲學(xué)環(huán)境,麥克風(fēng)采集語音信號的同時還會采集大量噪聲,對實(shí)時音視頻質(zhì)量來說是一個非常大的挑戰(zhàn)。噪聲的種類是多種多樣的。根據(jù)噪聲的數(shù)學(xué)統(tǒng)計(jì)特性可以將噪聲分為兩類:

平穩(wěn)噪聲:噪聲的統(tǒng)計(jì)特性在比較長的時間里不會隨時間而變化,比如白噪聲、電風(fēng)扇、空調(diào)、車內(nèi)噪聲等;

非平穩(wěn)噪聲:噪聲的統(tǒng)計(jì)特性隨時間在變化,如餐廳嘈雜噪聲、地鐵站、辦公室、家庭廚房等。

在實(shí)時音視頻應(yīng)用中,通話易受到各類噪聲干擾從而影響體驗(yàn),因此實(shí)時音頻降噪已經(jīng)成為實(shí)時音視頻中的一個重要功能。對于平穩(wěn)的噪聲,比如空調(diào)出風(fēng)口呼呼聲或者錄制設(shè)備的底噪,它不會隨著時間變化而產(chǎn)生較大變化,可以將其估計(jì)預(yù)測出來,通過簡單的減法的方式把它去掉,常見的有譜減法、維納濾波以及小波變換。對于非平穩(wěn)噪聲,例如馬路上車子呼嘯而過的聲音、餐廳內(nèi)餐盤的撞擊聲、家庭廚房內(nèi)的鍋具的敲擊聲,都是隨機(jī)突發(fā)出現(xiàn),是不可能通過估計(jì)預(yù)測的方式去解決的。傳統(tǒng)算法對于非平穩(wěn)噪聲難以估計(jì)和消除,這也是我們采用深度學(xué)習(xí)算法的原因。

Part 03●深度學(xué)習(xí)降噪算法設(shè)計(jì)●

29899ec2-940e-11ed-bfe3-dac502259ad0.png

為了提高音頻SDK對于各種噪聲場景的降噪能力,彌補(bǔ)傳統(tǒng)降噪算法的不足,我們研發(fā)了基于RNN的AI降噪模塊,結(jié)合傳統(tǒng)降噪技術(shù)和深度學(xué)習(xí)技術(shù)。重點(diǎn)針對家庭和辦公室使用場景的降噪處理,在噪聲數(shù)據(jù)集中加入大量的室內(nèi)噪聲類型,諸如辦公室內(nèi)的鍵盤敲擊、辦公桌與辦公用品拖拉的摩擦聲、座椅拖動、家庭中的廚房嘈雜聲、地板撞擊聲等等。

與此同時,為了在移動端的實(shí)時語音處理落地,該AI音頻降噪算法將計(jì)算開銷和庫的尺寸控制在一個非常低的量級。在計(jì)算開銷上,以48KHz為例,每幀語音的RNN網(wǎng)絡(luò)處理處理僅需約17.5Mflops,F(xiàn)FT和IFFT每幀語音需要約7.5Mflops,特征提取需要約12Mflops,總計(jì)約42Mflops,計(jì)算復(fù)雜度約和48KHz的Opus編解碼相當(dāng),在某品牌中端手機(jī)型號,統(tǒng)計(jì)RNN降噪模塊CPU占用約為4%。在音頻庫的尺寸上,開啟RNN降噪編譯后,音頻引擎庫的體積僅僅增加約108kB。

Part 04●網(wǎng)絡(luò)模型及處理流程●

該模塊采用RNN 模型,原因是 RNN 相比其他學(xué)習(xí)模型(例如 CNN)攜帶時間信息,可以對時序信號進(jìn)行建模,而不僅僅是單獨(dú)的音頻輸入和輸出幀。同時,模型采用門控循環(huán)單元(GRU,如圖1所示),實(shí)驗(yàn)表明,GRU在語音降噪任務(wù)上的性能略好于LSTM,并且由于GRU的權(quán)值參數(shù)更少,可以節(jié)省計(jì)算資源。與簡單的循環(huán)單元相比,GRU有兩個額外的門。重置門控制狀態(tài)是否用于計(jì)算新狀態(tài),而更新門控制狀態(tài)將根據(jù)新輸入改變的程度。這個更新門使GRU可以長時間記憶時序信息,這也是GRU比簡單的循環(huán)單元表現(xiàn)更好的原因。

29b6a818-940e-11ed-bfe3-dac502259ad0.png

圖1 左側(cè)為簡單循環(huán)單元,右側(cè)為GRU

模型的結(jié)構(gòu)如圖2所示。訓(xùn)練后的模型會被嵌入到音視頻通信 SDK 中,通過讀取硬件設(shè)備的音頻流,對音頻流進(jìn)行分幀處理并送入 AI 降噪預(yù)處理模塊中,預(yù)處理模塊會將對應(yīng)的特征(Feature)計(jì)算出來,并輸出到訓(xùn)練好的模型中,通過模型計(jì)算出對應(yīng)的增益(Gain)值,使用增益值對信號進(jìn)行調(diào)整,最終達(dá)到降噪的目的(如圖3所示)。

29cba42a-940e-11ed-bfe3-dac502259ad0.png

圖 2. 基于GRU的RNN網(wǎng)絡(luò)模型

29e5646e-940e-11ed-bfe3-dac502259ad0.png

圖3. 上方為模型訓(xùn)練流程,下方為實(shí)時降噪流程

Part 05●AI降噪處理效果和落地●

圖4為帶有鍵盤敲擊噪聲的降噪前后語音語譜圖的對比,上半部分為降噪前的帶噪語音信號,其中紅色矩形框內(nèi)為鍵盤敲擊噪聲。下半部分為降噪后的語音信號,通過觀測可以發(fā)現(xiàn),絕大部分鍵盤敲擊聲均可以被抑制,同時語音損傷控制在較低的程度。

29fafa4a-940e-11ed-bfe3-dac502259ad0.png

圖4. 帶噪語音(通話過程伴隨著鍵盤敲擊聲)降噪前后對比

目前的AI降噪模型,已經(jīng)在手機(jī)端和家親上線,改善手機(jī)端和家親APP通話降噪效果,對泛家庭、辦公室等100多種噪聲場景具備優(yōu)秀的抑制能力,同時保持語音不失真。下一階段,將將持續(xù)優(yōu)化AI降噪模型的計(jì)算復(fù)雜度,以在IoT低功耗設(shè)備上能夠推廣使用。

審核編輯:陳陳

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31613

    瀏覽量

    270422
  • 降噪技術(shù)
    +關(guān)注

    關(guān)注

    2

    文章

    46

    瀏覽量

    12809
  • 實(shí)時通信
    +關(guān)注

    關(guān)注

    0

    文章

    18

    瀏覽量

    9734

原文標(biāo)題:技術(shù)趣談 | 實(shí)時通信中的AI降噪技術(shù)

文章出處:【微信號:5G通信,微信公眾號:5G通信】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NanoEdge AI技術(shù)原理、應(yīng)用場景及優(yōu)勢

    NanoEdge AI 是一種基于邊緣計(jì)算的人工智能技術(shù),旨在將人工智能算法應(yīng)用于物聯(lián)網(wǎng)(IoT)設(shè)備和傳感器。這種技術(shù)的核心思想是將數(shù)據(jù)處理和分析從云端轉(zhuǎn)移到設(shè)備本身,從而減少數(shù)據(jù)傳
    發(fā)表于 03-12 08:09

    全國高技術(shù)重點(diǎn)圖書·通信技術(shù)領(lǐng)域_現(xiàn)代通信中的排隊(duì)論

    全國高技術(shù)重點(diǎn)圖書·通信技術(shù)領(lǐng)域_現(xiàn)代通信中的排隊(duì)論
    發(fā)表于 08-18 20:32

    labview通信中如果有通信協(xié)議,如何處理通信中傳輸?shù)膮f(xié)議數(shù)據(jù)?

    我要接受的數(shù)據(jù)在一個數(shù)據(jù)包中,通信中數(shù)據(jù)包一位一位的傳輸,我現(xiàn)在想將通信的過程中(實(shí)時)將數(shù)據(jù)包分別提取出來,該如何實(shí)現(xiàn)?
    發(fā)表于 04-11 15:31

    PROFINET及其同步實(shí)時通信分析

    PROFINET是一種新的實(shí)時以太網(wǎng)標(biāo)準(zhǔn),本文介紹了PROFINET兩類不同性能的實(shí)時通信技術(shù)特點(diǎn),并對等時同步實(shí)時
    發(fā)表于 02-21 15:24 ?12次下載

    PROFINET及其同步實(shí)時通信分析

    PROFINET是一種新的實(shí)時以太網(wǎng)標(biāo)準(zhǔn),本文介紹了PROFINET兩類不同性能的實(shí)時通信技術(shù)特點(diǎn),并對等時同步實(shí)時
    發(fā)表于 07-22 17:32 ?14次下載

    MIMO技術(shù)在對流層散射通信中的性能分析

    介紹了MIMO技術(shù)的基本原理,分析了MIMO系統(tǒng)的模型以及信道容量。運(yùn)用Matlab/Simulink對MIMO技術(shù)在散射通信中的性能進(jìn)行了仿真。仿真結(jié)果表明,應(yīng)用MIMO
    發(fā)表于 11-03 15:20 ?23次下載

    McWiLL系統(tǒng)在應(yīng)急通信中的應(yīng)用分析

    McWiLL系統(tǒng)在應(yīng)急通信中的應(yīng)用分析
    發(fā)表于 11-10 17:52 ?18次下載
    McWiLL系統(tǒng)在應(yīng)急<b class='flag-5'>通信中</b>的應(yīng)用<b class='flag-5'>分析</b>

    網(wǎng)絡(luò)通信中差錯控制技術(shù)的應(yīng)用與研究

    網(wǎng)絡(luò)通信中差錯控制技術(shù)的應(yīng)用與研究,網(wǎng)絡(luò)通信技術(shù)資料,很好很實(shí)用。
    發(fā)表于 03-28 10:11 ?18次下載

    藍(lán)牙技術(shù)在遠(yuǎn)程電力線通信中的應(yīng)用下載

    藍(lán)牙技術(shù)在遠(yuǎn)程電力線通信中的應(yīng)用下載
    發(fā)表于 09-01 11:02 ?3次下載
    藍(lán)牙<b class='flag-5'>技術(shù)</b>在遠(yuǎn)程電力線<b class='flag-5'>通信中</b>的應(yīng)用下載

    高速DSP技術(shù)及其在通信中的應(yīng)用

    高速DSP技術(shù)及其在通信中的應(yīng)用
    發(fā)表于 10-20 08:45 ?14次下載
    高速DSP<b class='flag-5'>技術(shù)</b>及其在<b class='flag-5'>通信中</b>的應(yīng)用

    基于DSP的語音降噪系統(tǒng)設(shè)計(jì)方案解析

    在現(xiàn)實(shí)的語音通信中會不可避免地受到來自環(huán)境中的背景噪聲影響,致使通信質(zhì)量嚴(yán)重下降,甚至聽不清楚對方講話的內(nèi)容,因此對帶噪語音信號進(jìn)行降噪已經(jīng)成為語音通信中的一個非常迫切的課題。近年來,
    發(fā)表于 10-31 11:52 ?15次下載
    基于DSP的語音<b class='flag-5'>降噪</b>系統(tǒng)設(shè)計(jì)方案解析

    無線通信中的MIMO技術(shù)

    無線通信中的MIMO技術(shù)免費(fèi)下載。
    發(fā)表于 06-15 17:00 ?16次下載

    光纖通信技術(shù)在電力通信中的應(yīng)用

    電力通信中的光纖通信技術(shù),光波效率高,傳輸?shù)娜萘糠浅4?,?b class='flag-5'>通信傳輸?shù)倪^程中,提升了運(yùn)行效率。光纖通信技術(shù)
    發(fā)表于 04-19 15:25 ?1680次閱讀

    通信及光纖通信中的光譜分析

    通信及光纖通信中的光譜分析? 光通信及光纖通信是一種用于傳輸數(shù)據(jù)的重要技術(shù)。在光
    的頭像 發(fā)表于 01-19 10:32 ?1710次閱讀

    RTC技術(shù)實(shí)時通信中的應(yīng)用 RTC與VoIP的區(qū)別

    在數(shù)字化時代,實(shí)時通信(RTC)技術(shù)已經(jīng)成為我們?nèi)粘I詈凸ぷ髦胁豢苫蛉钡囊徊糠?。從視頻會議到在線教育,從遠(yuǎn)程醫(yī)療到社交網(wǎng)絡(luò),RTC技術(shù)都在發(fā)揮著重要作用。 一、RTC
    的頭像 發(fā)表于 12-11 15:38 ?779次閱讀