小杜,在呢,播放音樂~
不知不覺,與智能助手的對話,成為了日常溝通的一部分。無論是在家里亦或是車?yán)?,總有一個(gè)助手與我作伴。這讓我想起了一個(gè)名字“鐵蛋”。
恰巧近期重溫了《小靈通漫游未來》,整個(gè)人不自覺就融化在小時(shí)候看這連環(huán)畫時(shí)那種驚奇的回憶中,再一次萌生了去書里找找那時(shí)候,是否有關(guān)于語音識(shí)別的暢想。
現(xiàn)實(shí)生活中的“鐵蛋”形態(tài)各異,有放在書桌上的臺(tái)燈,有放在客廳的音響,有業(yè)務(wù)大廳佇立的柜機(jī),有汽車大屏里的人機(jī),它們有一個(gè)共通點(diǎn),就是擁有強(qiáng)大的語音識(shí)別和交互能力,聽得懂人話,識(shí)別成功率高,反應(yīng)速度快,這些重要因素將成為你會(huì)不會(huì)和它們對話的前提。
今天為大家?guī)淼木褪顷P(guān)于語音識(shí)別****測試的方案,這套方案針對智能產(chǎn)品和車載交互系統(tǒng),提供一套語音識(shí)別的測評方法,從而為語音識(shí)別系統(tǒng)的質(zhì)量評估提供參考依據(jù)。
盡管現(xiàn)在的語音對話還不夠完美,總有不同程度的錯(cuò)誤,所以我們才會(huì)不斷去測試,模擬,優(yōu)化,調(diào)整,
即便「完美」是遙不可及的彼岸,對我們而言,也是心中仍時(shí)常凝望的那盞綠燈。
慣例,在看一個(gè)測試項(xiàng)目之前,先去看標(biāo)準(zhǔn)——
語音識(shí)別測試的參考標(biāo)準(zhǔn)主要有2個(gè),國標(biāo)GB/T 21023和電信終端產(chǎn)業(yè)協(xié)會(huì)的標(biāo)準(zhǔn) (起草單位: 中國信息通信研究院)。
初次閱讀時(shí)則被這個(gè)標(biāo)準(zhǔn)的時(shí)間所觸動(dòng),那是2007年,布局很早啊~
節(jié)省時(shí)間,我替粉絲們閱讀總結(jié),里面提到的測試項(xiàng)目包括下列:
? 喚醒率 / 識(shí)別成功率
? 誤喚醒率
? 響應(yīng)時(shí)間
? 測試環(huán)境
而且針對智能產(chǎn)品和車載交互系統(tǒng),不同的測試環(huán)境都有不同的具體要求。
眾所周知,這些年智能設(shè)備已經(jīng)進(jìn)入千家萬戶,已經(jīng)擺脫了傳統(tǒng)物理按鍵。記得測測有一次去閨蜜家,她家的馬桶都是需要語音交互才能發(fā)揮功能的。這真的有點(diǎn)讓我很“社死”。哎,這令人窒息的 設(shè)計(jì)感 。
言歸正傳,來看看智能設(shè)備語音識(shí)別測試的環(huán)境:
? 喚醒源和被測品距離: 1/3/5m
? 噪聲源距離和多個(gè)角度: 1.5m
? SNR >=15dB
信號(hào)源和環(huán)境噪聲聲壓的具體要求如下——
舉一反三的同學(xué)在這里就會(huì)舉起右手,準(zhǔn)備提問了。
像智能音箱這種,標(biāo)準(zhǔn)對測試環(huán)境有要求,被測品和播放喚醒詞的聲音源之間的距離, 和背景噪聲要達(dá)到指定的聲壓等等,非常明確。
但問題來了,我們?nèi)绾未_保環(huán)境能滿足標(biāo)準(zhǔn)里的聲壓要求呢?
很簡單,那我們就對環(huán)境做校準(zhǔn)啊~~~
測試前我們需要對環(huán)境進(jìn)行校準(zhǔn),大概流程如下:
1)在被測品位置放置標(biāo)準(zhǔn)麥克風(fēng)
2)調(diào)整播放喚醒詞的聲音源聲壓,直到滿足標(biāo)準(zhǔn)要求
3)調(diào)整背景噪聲的聲壓,直到滿足標(biāo)準(zhǔn)要求
4)最后保存校準(zhǔn)數(shù)據(jù)即可
當(dāng)被測品是車載交互系統(tǒng)時(shí),標(biāo)準(zhǔn)對測試環(huán)境也有明確要求,不過思路和智能產(chǎn)品一樣。比如被測品和播放喚醒詞的聲音源之間的距離, 和背景噪聲要達(dá)到指定的聲壓。
車載交互系統(tǒng)語音識(shí)別測試的環(huán)境:
? 人工嘴聲壓: -4.7dBPa
? 背景噪聲: 喇叭 x 4 + 低音喇叭 x 1
噪聲聲壓具體聲壓如下——
同樣,為了確保環(huán)境能滿足標(biāo)準(zhǔn)里的聲壓要求,我們在車載交互系統(tǒng)測試前也需要對環(huán)境做校準(zhǔn)。
大概流程如下:
1)在被測品位置放置標(biāo)準(zhǔn)麥克風(fēng)
2)調(diào)整播放喚醒詞的聲音源聲壓,直到滿足標(biāo)準(zhǔn)要求
3)調(diào)整背景噪聲的聲壓,直到滿足標(biāo)準(zhǔn)要求
4)最后保存校準(zhǔn)數(shù)據(jù)
看,和上面的流程一模一樣。
這時(shí)候,或許你會(huì)想,如果有一套軟件能hold住整場,是不是有這個(gè)可能?
作為ETS軟件部門,開發(fā)了一套又一套的好用、實(shí)用軟件。這次就讓我們透過軟件感受測試。此番帶來,想必會(huì)為語音識(shí)別測試體系增添新的主角。
****第一步 ,填寫喚醒詞 ***
填寫喚醒詞 (選擇男/女聲,語速, 高低音)或改用自己的語音庫。
*第二步 ,寫反饋?zhàn)?/strong>
填寫反饋關(guān)鍵字 (比如,在, 嗯,你好..)。
****第三步,選場景 ***
校準(zhǔn)不同噪聲的場景并選擇測試環(huán)境。
****第四步,參數(shù)設(shè)置 ***
設(shè)置循環(huán)次數(shù)和門限
****第五步,整起來 ***
最激動(dòng)人心的時(shí)刻---開始測試
審核編輯 黃宇
-
測試
+關(guān)注
關(guān)注
8文章
5404瀏覽量
127138 -
語音識(shí)別
+關(guān)注
關(guān)注
38文章
1745瀏覽量
112967 -
ets
+關(guān)注
關(guān)注
0文章
20瀏覽量
1645 -
汽車
+關(guān)注
關(guān)注
13文章
3623瀏覽量
37709
發(fā)布評論請先 登錄
相關(guān)推薦
2025年人工智能會(huì)發(fā)生哪些變化
人機(jī)環(huán)境系統(tǒng)智能化:人工智能的未來發(fā)展趨勢
嵌入式和人工智能究竟是什么關(guān)系?
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得
risc-v在人工智能圖像處理應(yīng)用前景分析
人工智能ai4s試讀申請
名單公布!【書籍評測活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新
報(bào)名開啟!深圳(國際)通用人工智能大會(huì)將啟幕,國內(nèi)外大咖齊聚話AI
FPGA在人工智能中的應(yīng)用有哪些?
AI人工智能機(jī)器人產(chǎn)業(yè)--政府真正應(yīng)承擔(dān)的責(zé)任與角色
![AI<b class='flag-5'>人工智能</b>機(jī)器<b class='flag-5'>人</b>產(chǎn)業(yè)--政府真正應(yīng)承擔(dān)的責(zé)任與角色](https://file.elecfans.com/web2/M00/30/4C/poYBAGIJsSmACi3tAAFuCnhoP8I446.png)
評論