日av在线播放中文字幕,亚洲色欲久久久久综合网小说专区

某些語音識別系統(tǒng)（ASR）的準(zhǔn)確性可能要比之前假定的差很多?！边@是最近約翰·霍普金斯大學(xué)、波蘭波茲南工業(yè)大學(xué)、弗羅茨瓦夫科技大學(xué)以及初創(chuàng)公司Avaya的研究人員一項正在進(jìn)行的研究主要發(fā)現(xiàn)。

這項研究對內(nèi)部創(chuàng)建的數(shù)據(jù)集上的商業(yè)語音識別模型進(jìn)行了基準(zhǔn)測試。共同作者聲稱，詞錯誤率（Word Error Rate， WER）（一種常見的語音識別性能指標(biāo)）要顯著高于最佳報告結(jié)果，這可能表明自然語言處理（NLP）領(lǐng)域存在更多待克服的問題。

據(jù)了解，目前ASR已廣泛應(yīng)用于諸多場景中，如電話會議、電子郵件、智能設(shè)備等。ASR模型的綜合基準(zhǔn)中，標(biāo)準(zhǔn)語料庫的WER僅有2%~3%，而正是這一統(tǒng)計數(shù)據(jù)遭到了上述作者的質(zhì)疑。他們聲稱，大多數(shù)ASR的交互場景都是在“類似于聊天機(jī)器人”的背景下進(jìn)行的，說話人往往因為意識到跟他們的交互對象是聊天機(jī)器人，因此通常會將命令簡化成結(jié)構(gòu)緊湊的簡短詞語，而非正常的自然對話。作者基于來自1595個供應(yīng)商和1261個客戶的50個呼叫中心對話數(shù)據(jù)集對幾套ASR系統(tǒng)進(jìn)行了評估。其通常時間長達(dá)8.5個小時，其中2.2個小時是對話。通過測試，作者發(fā)現(xiàn)ASR系統(tǒng)的錯誤率基本在15%以下，這與基準(zhǔn)測試中的2%相悖。

研究證明：商業(yè)語音識別系統(tǒng)的錯誤率非常高

而基于保險、通信、預(yù)定等金融行業(yè)的語料庫中，作者發(fā)現(xiàn)其WER的測試結(jié)果高達(dá)23.31%。其中，預(yù)定和通信的錯誤率最高，可能是因為對話涉及特定的日期、時間、訂單金額、地點、產(chǎn)品和公司名稱等。但在所有領(lǐng)域的測試中，其錯誤率均高于13.73%。

研究人員將這一問題歸結(jié)為領(lǐng)域適應(yīng)性問題——基準(zhǔn)測試使用了單一性語料，例如Librispeech（1000小時英語有聲讀物錄音）、WSJ（新聞口述的談話）和Switchboard（電話交談），這些都可能太過簡單而無法真正挑戰(zhàn)ASR系統(tǒng)的可靠性。

而且，盡管他們試圖刻意模仿真實、自發(fā)的對話，但本質(zhì)上還是受約束的，比如需要配音演員，就某一合適主題進(jìn)行腳本/半腳本對話，而且正是由于配音演員的存在，幾乎都不需要考慮因性別、母語因素而產(chǎn)生的發(fā)音問題。

作為一種補(bǔ)救措施，研究人員建議ASR和NLP社區(qū)收集和注釋音頻數(shù)據(jù)集，使其更好地與ASR系統(tǒng)的實際應(yīng)用場景保持一致，他們還呼吁建立更具包容性的聲學(xué)模型，更廣泛的方言語料庫，這些改變將會促進(jìn)音頻信號處理的技術(shù)改進(jìn)。

因此，這些問題并非無法克服?！皩W(xué)界和工業(yè)界應(yīng)該深思熟慮，考慮可以創(chuàng)建高質(zhì)量的測試數(shù)據(jù)集。我們認(rèn)為，對ASR準(zhǔn)確性的過于樂觀會損害NLP領(lǐng)域下游應(yīng)用程序的開發(fā)。”研究人員最后表示。
責(zé)編AJX

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

軟件

軟件

+關(guān)注

關(guān)注
69

文章
5028

瀏覽量
88142
語音識別

語音識別

+關(guān)注

關(guān)注
38

文章
1745

瀏覽量
112960
ASR

ASR

+關(guān)注

關(guān)注
2

文章
43

瀏覽量
18810

【「嵌入式系統(tǒng)設(shè)計與實現(xiàn)」閱讀體驗】+ 基于語音識別的智能杯墊

語音命令Q 識別，適用于智能家居控制、玩具、人機(jī)交互等多個領(lǐng)域。該模塊以其高識別率、低功耗和易于集成的特點受到廣大開發(fā)者的青睞。主要技術(shù)及功能有：磁力攪拌、重量采集、

發(fā)表于 01-02 18:15

OpenAI攻克Sora視頻創(chuàng)建錯誤率高難題

在人工智能與多媒體技術(shù)的交叉領(lǐng)域，OpenAI近期宣布了一項重要進(jìn)展：成功解決了Sora視頻創(chuàng)建過程中錯誤率高的問題。這一突破不僅標(biāo)志著OpenAI在視頻處理技術(shù)上取得了顯著進(jìn)步，也為廣大用戶帶來

發(fā)表于 12-31 10:37 ?188次閱讀

標(biāo)貝數(shù)據(jù)標(biāo)注案例分享：車載語音系統(tǒng)數(shù)據(jù)標(biāo)注

車載語音識別系統(tǒng)是指利用機(jī)器學(xué)習(xí)算法實現(xiàn)的一種自然語言處理技術(shù)，載語音識別系統(tǒng)通過辨別聲音的語調(diào)、語速和音量，將所聽到的語音轉(zhuǎn)化成可讀取的語

發(fā)表于 12-24 14:24 ?225次閱讀

標(biāo)貝數(shù)據(jù)標(biāo)注案例分享：車載<b class='flag-5'>語音</b><b class='flag-5'>系統(tǒng)</b>數(shù)據(jù)標(biāo)注

九芯電子熱水器語音識別芯片IC方案，解放雙手，高識別率

操作更加人性化，更憑借其高識別率技術(shù)，確保了用戶指令的準(zhǔn)確無誤執(zhí)行。九芯電子基于離線語音識別技術(shù)推出NRK3301芯片開發(fā)了新一代智能家居--熱水器聲控方案。NR

發(fā)表于 12-07 01:03 ?241次閱讀

九芯電子熱水器<b class='flag-5'>語音</b><b class='flag-5'>識別</b>芯片IC方案，解放雙手，<b class='flag-5'>高</b><b class='flag-5'>識別率</b>

RFID識別系統(tǒng)

隨著信息技術(shù)的快速發(fā)展，RFID（射頻識別）技術(shù)在各行各業(yè)的應(yīng)用日益廣泛，其中RFID識別系統(tǒng)作為核心應(yīng)用，已經(jīng)成為智能化管理不可或缺的基石。通過無線射頻信號的非接觸式識別與數(shù)據(jù)傳輸，RFID

發(fā)表于 12-06 17:57 ?356次閱讀

九芯電子熱水器語音識別芯片IC方案，解放雙手，高識別率

九芯電子推出NRK3301語音識別芯片，支持離線識別，精準(zhǔn)度高，可語音控制熱水器，多國語言支持，安全保護(hù)，已合作多家大廠，推動熱水器行業(yè)智能

發(fā)表于 12-06 13:44 ?179次閱讀

物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的語音識別方案_離線語音識別芯片分析

01 物聯(lián)網(wǎng)系統(tǒng)中為什么要使用離線語音識別芯片物聯(lián)網(wǎng)系統(tǒng)中使用離線語音識別芯片的原因主要基于以

發(fā)表于 09-26 17:56 ?819次閱讀

什么是離線語音識別芯片？與在線語音識別的區(qū)別

離線語音識別芯片適用于智能家電等，特點為小詞匯量、低成本、安全性高、響應(yīng)快，無需聯(lián)網(wǎng)。在線語音識別功能更廣泛、

發(fā)表于 07-22 11:33 ?500次閱讀

基于FPGA的指紋識別系統(tǒng)設(shè)計

隨著人們對安全問題的日益重視，指紋識別作為一種高效、可靠的生物識別技術(shù)，在多個領(lǐng)域得到了廣泛應(yīng)用。本文設(shè)計并實現(xiàn)了一種基于FPGA的嵌入式指紋識別系統(tǒng)，該系統(tǒng)利用FPGA的

發(fā)表于 07-17 16:33 ?1513次閱讀

多目標(biāo)智能識別系統(tǒng)

智慧華盛恒輝多目標(biāo)智能識別系統(tǒng)是一種利用現(xiàn)代計算機(jī)視覺技術(shù)和人工智能算法，從圖像或視頻中同時識別和分類多個目標(biāo)物體的系統(tǒng)。這種系統(tǒng)廣泛應(yīng)用于自動駕駛、智能監(jiān)控、人機(jī)交互、軍事偵察、災(zāi)害

發(fā)表于 07-16 10:42 ?1.7w次閱讀

基于OpenCV的人臉識別系統(tǒng)設(shè)計

基于OpenCV的人臉識別系統(tǒng)是一個復(fù)雜但功能強(qiáng)大的系統(tǒng)，廣泛應(yīng)用于安全監(jiān)控、人機(jī)交互、智能家居等多個領(lǐng)域。下面將詳細(xì)介紹基于OpenCV的人臉識別系統(tǒng)的基本原理、實現(xiàn)步驟，并附上具體的代碼示例。

發(fā)表于 07-11 15:37 ?1.6w次閱讀

基于GIS的SAR多目標(biāo)智能識別系統(tǒng)

智慧華盛恒輝基于GIS的SAR多目標(biāo)智能識別系統(tǒng)是一個集成了合成孔徑雷達(dá)(SAR)和地理信息系統(tǒng)(GIS)技術(shù)的先進(jìn)系統(tǒng)，旨在實現(xiàn)高分辨率雷達(dá)圖像中的多目標(biāo)智能

發(fā)表于 06-26 14:26 ?568次閱讀

車載語音識別系統(tǒng)語音數(shù)據(jù)采集標(biāo)注案例

車載語音識別系統(tǒng)是指利用機(jī)器學(xué)習(xí)算法實現(xiàn)的一種自然語言處理技術(shù)，載語音識別系統(tǒng)通過辨別聲音的語調(diào)、語速和音量，將所聽到的語音轉(zhuǎn)化成可讀取的語

發(fā)表于 06-19 15:52 ?418次閱讀

車載語音識別系統(tǒng)語音數(shù)據(jù)采集標(biāo)注案例

車載語音識別系統(tǒng)是指利用機(jī)器學(xué)習(xí)算法實現(xiàn)的一種自然語言處理技術(shù)，載語音識別系統(tǒng)通過辨別聲音的語調(diào)、語速和音量，將所聽到的語音轉(zhuǎn)化成可讀取的語

發(fā)表于 06-19 15:49 ?586次閱讀

基于深度學(xué)習(xí)的鳥類聲音識別系統(tǒng)

：與人聲識別不同，本文的鳥聲識別更多地關(guān)注鳥聲的特征，而不是鳥聲的內(nèi)容。為了簡化特征融合算法的復(fù)雜度，降低模型的計算量，選擇語音識別系統(tǒng)中廣泛使用的梅爾譜作為鳥類音頻信號的特征。提取

發(fā)表于 05-30 20:30

欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

搜索歷史

研究證明：商業(yè)語音識別系統(tǒng)的錯誤率非常高

評論

【「嵌入式系統(tǒng)設(shè)計與實現(xiàn)」閱讀體驗】+ 基于語音識別的智能杯墊

OpenAI攻克Sora視頻創(chuàng)建錯誤率高難題

標(biāo)貝數(shù)據(jù)標(biāo)注案例分享：車載語音系統(tǒng)數(shù)據(jù)標(biāo)注

九芯電子熱水器語音識別芯片IC方案，解放雙手，高識別率

RFID識別系統(tǒng)

九芯電子熱水器語音識別芯片IC方案，解放雙手，高識別率

物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的語音識別方案_離線語音識別芯片分析

什么是離線語音識別芯片？與在線語音識別的區(qū)別

基于FPGA的指紋識別系統(tǒng)設(shè)計

多目標(biāo)智能識別系統(tǒng)

基于OpenCV的人臉識別系統(tǒng)設(shè)計

基于GIS的SAR多目標(biāo)智能識別系統(tǒng)

車載語音識別系統(tǒng)語音數(shù)據(jù)采集標(biāo)注案例

車載語音識別系統(tǒng)語音數(shù)據(jù)采集標(biāo)注案例

基于深度學(xué)習(xí)的鳥類聲音識別系統(tǒng)