影響視頻會議系統(tǒng)音頻效果的主要因素分析
一、網(wǎng)絡的服務質量(QoS)
目前,視頻會議系統(tǒng)常用的網(wǎng)絡主要有E1專線和IP兩種。E1專線基于電路交換和時分復用技術,能夠提供端到端的獨享帶寬,因此網(wǎng)絡本身具有完善的傳輸質量保障機制。在絕大多數(shù)情況下,影響E1專線傳輸效果的主要因素就是傳輸設備和傳輸線路的質量。對于這類因素,我們往往可以通過更換傳輸設備和降低線路誤碼率進行改善。
而IP網(wǎng)基于統(tǒng)計復用和分組交換技術,在需要同時傳輸語音、數(shù)據(jù)以及視頻等多種業(yè)務時,其傳統(tǒng)的“盡力傳遞”機制暴露出很多問題,其中最重要的一點就是無法為每一種業(yè)務提供端到端的帶寬保證,會導致較大的傳輸延時和抖動。為此,我們必須通過技術手段對IP網(wǎng)進行優(yōu)化,以減少網(wǎng)絡本身對視頻會議系統(tǒng)效果的影響。這些技術手段目前已經(jīng)發(fā)展為IP體系中的一個重要分支,就是服務質量(QoS)。
所謂QoS,是指一個網(wǎng)絡通過多種技術為某一特定的網(wǎng)絡流量提供更好服務的能力,它的主要目的是實現(xiàn)優(yōu)先權控制,包括帶寬、延時、抖動以及丟包等多個方面。幾乎所有的網(wǎng)絡都可以利用QoS的優(yōu)勢來獲得最佳的效率。
QoS技術分為三類,包括盡力而為服務、集成服務、差分服務,其中差分服務應用最廣泛。在差分服務中,網(wǎng)絡根據(jù)每一個數(shù)據(jù)包的QoS標記對數(shù)據(jù)包進行分類、排隊和管理。這些標記可以是IP地址、TCP端口號或IP數(shù)據(jù)包中的特定字段。
在實際的網(wǎng)絡規(guī)劃中,就要求網(wǎng)絡設備(如路由器)能夠借助于復雜的流量管理系統(tǒng),通過多種技術提供QoS保證機制,根據(jù)業(yè)務類型劃分不同的優(yōu)先等級,比如語音最優(yōu)、視頻其次、數(shù)據(jù)最后,然后根據(jù)這些優(yōu)先級別分配網(wǎng)絡資源。
對于視頻會議而言,為了保證視頻業(yè)務的帶寬,路由器必須能夠在通過的IP數(shù)據(jù)流中識別出視頻業(yè)務數(shù)據(jù)包并對其分類,然后再通過擁塞管理機制提供帶寬保證和優(yōu)先傳遞服務。這樣,在網(wǎng)絡發(fā)生擁塞時,就可以保證語音和視頻業(yè)務的傳輸效果了。目前主流路由器廠商均可提供基于分類、標記與擁塞管理的QoS支持。
二、MCU和終端的性能
除了網(wǎng)絡應該提供良好的QoS保障機制外,視頻會議系統(tǒng)設備本身也應該具有良好的性能才能真正保證會議的效果。這些性能因素包括系統(tǒng)采用的視音頻編解碼技術、設備的設計結構、設備本身對惡劣網(wǎng)絡環(huán)境的適應能力以及其他方面。
1、視音頻編解碼技術
視音頻編碼技術是視頻會議系統(tǒng)的關鍵技術指標,是影響會議效果的重要因素。目前視頻會議系統(tǒng)中用到的視頻編碼技術主要有H.261、H.263、H.264、MPEG-2、MPEG-4等,音頻編碼技術主要有G.711、G.722、G.728、G.729、MP3等。
其中,H.264和MPEG-4這兩種視頻編碼技術能夠在低帶寬下實現(xiàn)高清晰的動態(tài)圖像效果,而且編碼延時小,作為新一代視頻編解碼標準,其優(yōu)勢非常明顯。
而在音頻編碼方面,MP3是一種高效的聲音壓縮算法,其頻響范圍在20Hz到20KHz之間,采樣頻率達到44.1KHz,而且支持雙聲道編碼,因此正在獲得越來越廣泛的應用。
2、設備的設計結構
早期有很多視頻會議系統(tǒng)中的MCU和終端均采用PC作為硬件結構,操作系統(tǒng)則基于Windows。這類設備在編解碼性能、包轉發(fā)效率以及穩(wěn)定性、安全性等方面均存在很大的局限性,導致會議視音頻質量不高、延時較大。
作為專業(yè)的會議室型應用,絕大多數(shù)視頻會議系統(tǒng)現(xiàn)在都選擇基于嵌入式設計結構的MCU和終端設備。這主要是因為嵌入式系統(tǒng)指令精簡、實時性高,結合專用的編解碼DSP,可實現(xiàn)高品質、低延時的視音頻信號處理,而且穩(wěn)定性、安全性也高。
3、設備對惡劣網(wǎng)絡環(huán)境的適應能力
網(wǎng)絡的QoS可以在一定程度上保證視頻會議的傳輸效果,但其作用是很有限的,尤其是在一些較為惡劣的網(wǎng)絡環(huán)境下。視頻會議系統(tǒng)設備本身對惡劣網(wǎng)絡環(huán)境的適應能力也將對會議效果產(chǎn)生較大的影響。這些適應能力包括IP優(yōu)先權設置、IP包排序、IP包重復控制、IP包抖動控制、丟包重傳以及速率自動調整等。
1)IP優(yōu)先權(IP Precedence)
在網(wǎng)絡規(guī)劃差分服務方式的QoS技術時,可通過多種匹配手段對進入數(shù)據(jù)網(wǎng)的業(yè)務包進行分類,包括IP地址、IP 優(yōu)先權(IP Precedence)等。
其中,利用IP包中的IP優(yōu)先權部分可以對音頻、視頻和RTCP(Multicast)數(shù)據(jù)流進行優(yōu)先級劃分。當網(wǎng)絡采用IP Precedence進行流量匹配時,可通過視頻設備發(fā)出的修改過IP Precedence字段信息的視音頻包進行入隊列處理,以保證視頻會議碼流的優(yōu)先傳送。
通常,網(wǎng)絡的盡力傳遞機制無法保證其轉發(fā)的數(shù)據(jù)包的正確次序。對于H.323視頻會議系統(tǒng),如果視頻設備按次序接收IP包,將帶來錯序問題,數(shù)據(jù)包的丟失或延遲將導致視頻圖像的凍結或聲音的中斷或抖動。
可通過視頻設備支持IP包排序功能解決該問題,當IP包到達時,視頻設備將對其次序進行驗證,無序的包被退回,以維護發(fā)送給終端用戶的音頻和視頻流的連續(xù)性。
一個IP包經(jīng)過承載網(wǎng)時可能會產(chǎn)生多個重復的副本,或為了適應惡劣網(wǎng)絡環(huán)境系統(tǒng)可能采用重傳機制時也會產(chǎn)生多個重復的副本,這樣將引起視頻圖像的凍結或聲音中斷。支持IP包重復控制的視頻設備可通過該功能來糾正該錯誤,以維護發(fā)送給終端用戶的音頻和視頻流的連續(xù)性。
當音頻和視頻IP包離開發(fā)送端時,按照規(guī)則的間隔均勻的排列。在通過網(wǎng)絡之后,這一均勻的間隔因不同的延時大小而遭到破壞,從而產(chǎn)生抖動。抖動會導致目標終端上音頻和視頻流的不連貫性。支持抖動控制的視頻設備可通過抖動緩存來實現(xiàn)抖動消除,以維護終端用戶接收到的音頻和視頻流的連貫性。
當網(wǎng)絡擁塞嚴重時,網(wǎng)絡設備(如路由器)會根據(jù)緩存大小并配合相關處理機制丟掉一些視頻包,視頻會議系統(tǒng)中視頻包是采用UDP協(xié)議進行傳輸?shù)模鳸DP本身沒有重傳機制,因此會導致接收端出現(xiàn)圖像丟幀或馬賽克現(xiàn)象。支持丟包重傳的視頻設備可通過添加丟包檢測和重傳的機制來保證會議圖像的連貫性。
在一些惡劣的網(wǎng)絡環(huán)境下,降低會議碼率將有助于提高視音頻的連貫性和實際效果。如果視頻設備支持動態(tài)速率調整技術,可以使終端和MCU能通過檢測網(wǎng)絡上有利和不利的因素來自動適應網(wǎng)絡的容量和性能,通過動態(tài)調整視頻會議的碼率,為終端用戶提供盡可能好的視頻質量。
視頻設備的自適應帶寬調整功能主要是通過檢測數(shù)據(jù)包丟失率來實現(xiàn)的。如果終端檢測到數(shù)據(jù)包丟失率超過了指定的閥值,它將自動降低視頻會議碼率,同時通知其它參會終端做相同的動作,從而提供一個具有最優(yōu)視音頻效果的會議碼率。
7)唇音同步技術
視頻會議系統(tǒng)中視頻信號和音頻信號是分別編碼、分別傳輸?shù)?,由于IP優(yōu)先級和視音頻包大小等因素的影響,會使視音頻的同步包到達順序不同,引起唇音不同步。
影響唇音不同步主要有兩種因素:網(wǎng)絡傳輸時延和視音頻處理時延不同。
當音頻和視頻包離開發(fā)送端時,音頻包與對應的視頻包保持同步。但是,在通過承載網(wǎng)時,各種隊列算法會對音頻資料包和視頻資料包進行不同的處理。這將打亂音頻資料包與相應的視頻資料包的同步關系。最終的結果導致聲音與口型失去同步。支持唇音同步的視頻設備可通過使用IP包中的RTP時間戳信息來糾正這一問題。利用RTP時間戳,設備能夠確定哪一音頻包與哪一視頻包對應。進一步重新調整相應的視音頻包,以保證聲音與口型的同步。
在發(fā)送端,處理音頻所花費的時間不同于處理視頻所花費的時間。影響這一問題的因素包括聲速與光速的不同、房間的大小和形狀、音頻和視頻編碼的算法的復雜性。為了避免時間差,支持唇音同步的設備可通過在音頻流的出發(fā)點增加一定的延遲,以獲得聲音與口型的同步;也可在接收端增加或減少音頻延遲,以糾正發(fā)送端不恰當?shù)难舆t設置。這樣就保證遠程會場在接收視頻會議聲音和圖像時,實現(xiàn)唇音同步。
4、音頻處理技術
1)自動回聲抑制
召開多點視頻會議時,每一個會場的聲音編碼器都將音頻包向MCU傳輸,而MCU將發(fā)言會場的音頻包向所有其他會場廣播,當視頻會議終端接收音頻包時,將解碼后的音頻流與本地輸入的音頻流進行電平比較,去掉相同的部分,這樣本地的聲音就不會在自己的會場揚聲器傳出,引起音頻的振蕩,從而避免回聲。
2)自動增益控制
由于優(yōu)先視頻會議使全向式麥克風,放置在會場的中心位置,這樣每一個發(fā)言人由于距離麥克風的位置不同,麥克風接受到的電平也不同。
為了保證傳向遠程的音頻電平的平穩(wěn),在進行編碼時要進行音頻的增益處理,以保證一定范圍內的發(fā)言人以同一個音調發(fā)言,這樣遠程會場的聲音就不會忽高忽低。
3)背景噪音消除
召開會議時不可避免地會有一些環(huán)境噪音,例如空調、風扇、交流電等電器設備持續(xù)發(fā)出的環(huán)境噪音,這些聲音嚴重的影響了會議的音頻質量。
自動噪聲抑制系統(tǒng)會根據(jù)音頻的高低、持續(xù)情況,判斷是否為環(huán)境噪音,并且進行處理,以達到良好的聲音會議效果。
會議室的設計也是影響視頻會議效果的重要因素之一,包括會場設備、會場布局、會場環(huán)境等。會議室的設計涉及的內容非常廣泛,限于篇幅,我們下面僅列出部分因素及建議。
會場設備包括攝像機、電視機、話筒以及音響系統(tǒng)等具體的視音頻信號輸入、輸出設備。結合不同的會場布局和裝修條件,這些設備在配置上都應該有所差異,才能真正保證會議效果。比如,會場的擴聲系統(tǒng)必須與會場布局進行很好的配合才能真正保證其效果,專業(yè)的擴聲系統(tǒng)設計依賴于復雜的聲場測試與反復調試過程。
會場布局包括總體設計、會場面積、會場裝修等:
1)會場的總體設計要能逼真地反映現(xiàn)場人物和景物,使與會者有臨場感,以達到視覺與語言信息交流的良好效果,會議室中傳送的圖像包括人物、景象、圖表、文字等,應當清晰可辨;
2)會場的面積建議按平均每人2.2平方米計算;
3)為了防止顏色對人物攝像產(chǎn)生的“奪光”及“反光”效應,故背景墻應具有均勻的淺顏色,通常多采用米色或灰色,以使攝像機鏡頭光圈設置合適,而房間的其他三面墻壁、地板、天花板等均忌用黑或鮮艷色彩的飽和色,通常采用淺藍色、淺灰色等,每面墻都不適宜用復雜的圖案話或掛復雜的畫幅,以免攝像機移動或變焦時圖像產(chǎn)生模糊現(xiàn)象,并增加編碼開銷;
4)會議桌布置采用排式。為減少面部陰影,要求采用淺色桌面或桌布,在麥克風和桌面之間最好加一層軟性材料,以免造成敲擊桌面時造成太大的響動;
5)盡量采用舒適的椅子,同時椅子不要裝小腳輪,限制移動,以防止離開鏡頭;
6)為了保證聲絕緣,地上應鋪上地毯,天花板應裝消音板,四周墻壁應裝隔音毯,窗子應安裝雙層玻璃,桌子鋪上桌布;
7)燈光照度是視頻會議會議室的一個基本的必要條件,由于電視會議召開時間具有隨機性,故室內應用人工冷光源避免自然光。會議室的門窗需用深色窗簾遮擋。光源對人眼視覺無不良影響。選擇三基色燈(色溫3500K)較為適宜。
會場環(huán)境包括室內環(huán)境和周圍環(huán)境:
1)會議室內應安裝空調,以創(chuàng)造穩(wěn)定的溫度、濕度環(huán)境,空調的噪聲應該比較低,如室內空調噪聲過大,就會大大影響該會場的音頻效果。會議室內空氣應流通;
2)會議室應設置在遠離外界嘈雜、喧嘩的位置。會議室的設置應符合防止泄密,便于使用和盡量減少外來噪聲干擾的要求。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
相關閱讀:
- [電子說] 串口屏解決方案:大彩串口屏會議系統(tǒng)上的應用 2021-04-23
- [電子說] 遠程視頻會議系統(tǒng)硬件設備主控芯片填充膠加固補強點膠應用 2023-04-28
- [電子說] 啟揚方案:視頻會議系統(tǒng)硬件終端解決方案 2023-01-07
- [音視頻及家電] 音視頻會議系統(tǒng)方案設計講解 2023-01-13
- [電子說] 云視頻會議系統(tǒng)私有化實踐 2023-01-06
- [電子說] 微軟亞洲研究院提出創(chuàng)新3D視頻會議系統(tǒng) 打開未來辦公更多可能 2022-06-13
- [電子說] 3D視頻會議系統(tǒng)VirtualCube打開未來辦公的更多可能 2022-06-13
- [電子說] 華為云WeLink為中國鐵建提供高質量協(xié)同的視頻會議系統(tǒng) 2022-03-28
( 發(fā)表人:admin )