想象一下,你正在機(jī)場(chǎng)和朋友通電話。你周?chē)泻芏嗳嗽诮徽?,飛機(jī)在起飛/降落,數(shù)十個(gè)行李箱的滾輪滾過(guò)瓷磚地板,可能還有幾個(gè)嬰兒在哭鬧。而電話那頭的朋友,在一家熱鬧的餐廳。你的朋友需要應(yīng)對(duì)自己的環(huán)境噪音:餐具和盤(pán)子叮當(dāng)作響,食客們聊得起勁,餐廳播放著背景音樂(lè),可能還有一些嬰兒在哭鬧。而在電話的兩端,你們聽(tīng)到的都是平靜而清晰的話語(yǔ),而不是含混不清的聲音。
這都得益于噪音抑制和主動(dòng)降噪 (ANC)。這兩項(xiàng)功能近來(lái)在音頻產(chǎn)品中很常見(jiàn),但它們不僅是流行詞而已。這兩項(xiàng)技術(shù)有助于以不同的重要方式減輕噪音的影響。本文將解釋二者的區(qū)別,同時(shí)更深入地探討其中的噪音抑制技術(shù)。
噪音抑制
來(lái)看看上述情景的第一部分:你在嘈雜的環(huán)境中對(duì)著麥克風(fēng)講話。
在此示例中,汽車(chē)在發(fā)出持續(xù)的背景噪音。這就是所謂的穩(wěn)態(tài)噪聲,它會(huì)呈現(xiàn)我們關(guān)注的語(yǔ)音信號(hào)里面并不存在的周期性特性??照{(diào)、飛機(jī)、汽車(chē)發(fā)動(dòng)機(jī)和風(fēng)扇的聲音都是穩(wěn)態(tài)噪聲的例子。但是,嬰兒的哭聲并不是持續(xù)的,這種聲音有一個(gè)很恰當(dāng)?shù)拿郑悍欠€(wěn)態(tài)噪聲。這類(lèi)噪聲的其他示例包括哈士奇的吠叫、電鉆或錘子工作的聲音、敲擊鍵盤(pán)的咔嗒聲或餐廳中銀制餐具碰撞的叮當(dāng)聲。這些噪音發(fā)生得很突然,同時(shí)存在的時(shí)間很短暫。
麥克風(fēng)會(huì)捕捉這兩種類(lèi)型的噪音;在不做任何處理的情況下,會(huì)產(chǎn)生同樣嘈雜的輸出,蓋過(guò)你期望傳遞的語(yǔ)音信息。圖的左半部分顯示了這種情況。但是,通過(guò)噪音抑制處理,可以消除背景噪音以便傳輸(而且僅傳輸)你的聲音。
主動(dòng)降噪
現(xiàn)在,你清晰的聲音已經(jīng)通過(guò)無(wú)線電傳輸給你的朋友,但這不代表對(duì)方就能清晰的接收你的信息。這時(shí)就需要主動(dòng)降噪。
像之前一樣,有穩(wěn)態(tài)和非穩(wěn)態(tài)噪聲會(huì)影響傳入耳塞的聲音。與之前處理掉噪音的情況不同,主動(dòng)降噪的目標(biāo)是完全抵消外部噪音。麥克風(fēng)捕捉傳入的聲音,生成外部噪音的反向信號(hào),并通過(guò)將反向信號(hào)疊加到入耳的聲波中盡可能的抵消外部噪聲。概括性地說(shuō),這在概念上類(lèi)似于將 +5 和 -5 這兩個(gè)數(shù)字相加得到 0。
在硬件中,基于上述的這種基本原則,可以通過(guò)兩種主要方式應(yīng)用主動(dòng)降噪。一種是前饋式 ANC,即在可聽(tīng)設(shè)備外使用麥克風(fēng);另一種是反饋式 ANC,即在更靠近耳朵的可聽(tīng)設(shè)備內(nèi)使用麥克風(fēng)。
前饋式 ANC 位于耳朵以外,所以對(duì)噪音更敏感。它可以在噪音傳向可聽(tīng)設(shè)備時(shí)清晰地捕捉到噪音。然后,它可以處理該噪音并輸出其相位抵消信號(hào)。這使其能夠隔離特定的聲音,尤其是中頻聲音。這包括我們?cè)诒咎懊娌糠痔岬降姆€(wěn)態(tài)聲音,但也包括語(yǔ)音。但是,前饋式 ANC 位于設(shè)備外部,因此更容易受到外部噪音的影響,例如風(fēng)聲或耳塞在兜帽內(nèi)側(cè)不斷摩擦的聲音(這絕對(duì)不是經(jīng)驗(yàn)之談)。
反饋式 ANC 不受亂動(dòng)的兜帽影響,因?yàn)樗诳陕?tīng)設(shè)備內(nèi)部,能抵抗其他各類(lèi)偶然干擾。這種隔音效果很好,但成功傳入耳塞的較高頻聲音則較難抵消。同樣,內(nèi)部反饋麥克風(fēng)需要區(qū)分播放的音樂(lè)和噪音。而且,因?yàn)槠浞答伕拷?,它還需要更快地處理此信息,才能保持與前饋設(shè)置相同的延遲。
最后,還有混合主動(dòng)降噪 - 你猜對(duì)了,這種方法就是結(jié)合前饋和反饋式 ANC,以功耗和硬件為代價(jià),實(shí)現(xiàn)兩方面的最佳效果。
深入了解噪音抑制
了解噪音抑制(抑制說(shuō)話人環(huán)境噪音以便遠(yuǎn)端聽(tīng)話人聽(tīng)清)與主動(dòng)降噪(抵消聽(tīng)話人自身的環(huán)境噪音)的基本區(qū)別后,讓我們重點(diǎn)關(guān)注如何實(shí)現(xiàn)噪音抑制。
一種方法是使用多個(gè)麥克風(fēng)抑制數(shù)據(jù)。從多個(gè)位置收集數(shù)據(jù),設(shè)備會(huì)獲得相似(但仍有區(qū)別)的信號(hào)??拷f(shuō)話人口部的麥克風(fēng)接收到的語(yǔ)音信號(hào)明顯比次要麥克風(fēng)強(qiáng)。兩個(gè)麥克風(fēng)會(huì)接收到相近信號(hào)強(qiáng)度的非語(yǔ)音背景音。將較強(qiáng)語(yǔ)音麥克風(fēng)和次要麥克風(fēng)收集到的聲音信息相減,剩下的大部分就是語(yǔ)音信息。麥克風(fēng)之間的距離越大,較近和較遠(yuǎn)的麥克風(fēng)之間的信號(hào)差就越大,也就越容易使用這種簡(jiǎn)單算法抑制噪音。但是,當(dāng)你不說(shuō)話時(shí),或預(yù)期語(yǔ)音數(shù)據(jù)隨時(shí)間變化時(shí)(例如當(dāng)你走路或跑步,手機(jī)不斷搖晃時(shí)),此方法的效果會(huì)下降。多麥克風(fēng)噪音抑制當(dāng)然是可靠的,但額外的硬件和處理存在缺點(diǎn)。
那么,如果只有一個(gè)麥克風(fēng),又會(huì)怎么樣呢?如果不使用額外聲源進(jìn)行驗(yàn)證/比較,單麥克風(fēng)解決方案將依賴(lài)于理解接收到的噪音特性并將其濾除。這又與此前提到的穩(wěn)態(tài)和非穩(wěn)態(tài)噪聲定義有關(guān)。穩(wěn)態(tài)噪聲可以通過(guò) DSP 算法有效濾除,非穩(wěn)態(tài)噪聲帶來(lái)了一個(gè)挑戰(zhàn),但深度神經(jīng)網(wǎng)絡(luò) (DNN) 可以幫助解決問(wèn)題。
此方法需要一個(gè)用于訓(xùn)練網(wǎng)絡(luò)的數(shù)據(jù)集。該數(shù)據(jù)集由不同的(穩(wěn)態(tài)和非穩(wěn)態(tài))噪聲以及清晰的語(yǔ)音組成,創(chuàng)造出合成的嘈雜語(yǔ)音模式。將該數(shù)據(jù)集作為輸入饋送給 DNN,并以清晰的語(yǔ)音作為輸出。這將創(chuàng)建一個(gè)神經(jīng)網(wǎng)絡(luò)模型,它會(huì)消除噪音,僅輸出清晰的語(yǔ)音。
即使使用經(jīng)訓(xùn)練的 DNN,仍有一些挑戰(zhàn)和指標(biāo)需要考慮。如果要以低延遲實(shí)時(shí)運(yùn)行,就需要很強(qiáng)的處理能力或較小的 DNN。DNN 中的參數(shù)越多,其運(yùn)行速度越慢。音頻采樣率對(duì)聲音抑制有類(lèi)似的影響。較高的采樣率意味著 DNN 需要處理更多參數(shù),但連帶地會(huì)獲得更優(yōu)質(zhì)的輸出。為實(shí)現(xiàn)實(shí)時(shí)噪音抑制,窄帶語(yǔ)音通信是理想之選。
這種處理全部都是密集型任務(wù),云計(jì)算非常擅長(zhǎng)完成這類(lèi)任務(wù),但這種方法會(huì)顯著增加延遲??紤]到人類(lèi)可以可靠地分辨大約 108 毫秒以上的延遲,云計(jì)算處理帶來(lái)的延額外遲顯然不是理想的結(jié)果。但是,在邊緣運(yùn)行 DNN 需要進(jìn)行一些巧妙的調(diào)整。CEVA 始終致力于完善我們的聲音和語(yǔ)音處理能力。這包括經(jīng)過(guò)實(shí)際驗(yàn)證的語(yǔ)音清晰度和命令識(shí)別算法 - 通過(guò)這些算法,即使在邊緣也能提供明確的通信和語(yǔ)音控制。歡迎聯(lián)系我們,親自聆聽(tīng)。
文章來(lái)源:CEVA
審核編輯 黃宇
-
ANC
+關(guān)注
關(guān)注
0文章
48瀏覽量
18713 -
主動(dòng)降噪
+關(guān)注
關(guān)注
10文章
52瀏覽量
18833 -
噪音抑制
+關(guān)注
關(guān)注
0文章
9瀏覽量
1652
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論