一個(gè)完整的對(duì)話交互是由“聽懂——理解——回答”三個(gè)步驟完成的閉環(huán),其中, “聽懂”需要語音識(shí)別(Automatic Speech Recognition, ASR)技術(shù);“理解”需要自然語 言處理(Natural Language Processing, NLP)技術(shù);“回答”需要語音合成(Text To Speech, TTS)技術(shù)。三個(gè)步驟環(huán)環(huán)相扣,相輔相成。語音識(shí)別技術(shù)是對(duì)話交互的開端,是保證對(duì)話 交互高效準(zhǔn)確進(jìn)行的基礎(chǔ)。
語音識(shí)別技術(shù)自 20 世紀(jì) 50 年代開始步入萌芽階段,發(fā)展至今,主流算法模型已經(jīng)經(jīng) 歷了四個(gè)階段:包括模板匹配階段、模式和特征分析階段、概率統(tǒng)計(jì)建模階段和現(xiàn)在主流的 深度神經(jīng)網(wǎng)絡(luò)階段。目前,語音識(shí)別主流廠商主要使用端到端算法,在理想實(shí)驗(yàn)環(huán)境下語音 識(shí)別準(zhǔn)確率可高達(dá) 98%以上。
中國(guó) AI 語音識(shí)別市場(chǎng)參與者眾多,主要分為上游、中游、下游。上游:底層技術(shù)提供強(qiáng)力支撐,云計(jì)算助推AI語音應(yīng)用普及。中游:語音技術(shù)持續(xù)升級(jí),生態(tài)圈建立賦能產(chǎn)業(yè)。下游分析:行業(yè)應(yīng)用多樣化,一站式服務(wù)需求廣
在過去五年間,中國(guó) AI 語音的需求最先在消費(fèi)級(jí)市場(chǎng)爆發(fā),主要得益于互聯(lián)網(wǎng)及智能 硬件設(shè)備廠商加大語音識(shí)別的投入經(jīng)費(fèi),以及廠商為提前占據(jù)市場(chǎng)推行的智能音箱硬件補(bǔ)貼。
目前,消費(fèi)級(jí)產(chǎn)品及服務(wù)主要包括智能音箱、智能車載和智能硬件及消費(fèi)級(jí)互聯(lián)網(wǎng)增值 服務(wù)。然而,目前包括直接面向消費(fèi)者的產(chǎn)品及服務(wù)在內(nèi),語音識(shí)別的相關(guān)應(yīng)用及使用場(chǎng)景 仍具有局限性。
未來,在消費(fèi)級(jí)產(chǎn)品供應(yīng)商和開發(fā)者共同構(gòu)建產(chǎn)業(yè)生態(tài)圈的過程中,語音識(shí) 別技術(shù)將更好地與其他語音交互技術(shù)及軟件功能融合,為消費(fèi)者提供更優(yōu)質(zhì)的體驗(yàn),未來 AI 語音識(shí)別市場(chǎng)將迎來廣闊的發(fā)展空間。
對(duì)于專業(yè)級(jí)市場(chǎng)而言,主要的產(chǎn)品形式包括智能語音開放平臺(tái)和行業(yè)解決方案,下游應(yīng) 用領(lǐng)域目前主要包括數(shù)字化水平相對(duì)較高的智慧醫(yī)療、智慧教育、企業(yè)客服、司法政務(wù)、金 融領(lǐng)域等。
AI 語音識(shí)別作為人機(jī)交互的重要入口之一,除了在語音識(shí)別的領(lǐng)域表現(xiàn)出色外, 也要能更好地與其他智能語音技術(shù)(包括語義理解、遠(yuǎn)場(chǎng)語音識(shí)別、喚醒目標(biāo)檢測(cè)、全雙工 交互、個(gè)性化識(shí)別技術(shù)等)進(jìn)行融合,從而綜合提升真實(shí)場(chǎng)景中的用戶體驗(yàn)。
近年來 AI 語音識(shí)別專業(yè)級(jí)市場(chǎng)的快速增長(zhǎng)主要原因除了深度神經(jīng)網(wǎng)絡(luò)算法為語音識(shí)別帶來的準(zhǔn)確率大 幅提升外,更重要的是其他智能語音和 AI 技術(shù)的發(fā)展帶來了更廣闊的應(yīng)用場(chǎng)景,預(yù)計(jì)未來 專業(yè)級(jí)市場(chǎng)的商業(yè)化需求將得到進(jìn)一步釋放。
以下是《中國(guó) AI 語音識(shí)別市場(chǎng)研究報(bào)告》部分內(nèi)容:
-
AI
+關(guān)注
關(guān)注
87文章
31750瀏覽量
270531 -
語音識(shí)別
+關(guān)注
關(guān)注
38文章
1745瀏覽量
112965
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
HarmonyOS NEXT 應(yīng)用開發(fā)練習(xí):AI智能語音播報(bào)
離線語音識(shí)別技術(shù)引領(lǐng)智能語音燈具市場(chǎng)——NRK3502
![離線<b class='flag-5'>語音</b><b class='flag-5'>識(shí)別</b>技術(shù)引領(lǐng)智能<b class='flag-5'>語音</b>燈具<b class='flag-5'>市場(chǎng)</b>——NRK3502](https://file1.elecfans.com/web1/M00/F4/3E/wKgZoWcoPRiAL3fxAAFKTGVqXnk994.png)
評(píng)論