微軟一直致力于開發(fā)一種新的語音輸入接口,允許用戶在沒有語音泄漏的情況下進(jìn)行說話和錄音。該研究由微軟研究院進(jìn)行,并在UIST 2018中進(jìn)行了介紹。該模塊名為SilentVoice,可以捕捉來自口腔的空氣并記錄聲音而不會打擾周圍的人。此外,該模塊還將過濾周圍的語音,因此即使有外界干擾,用戶也可以捕獲清晰的語音。
SilentVoice是一種新的語音輸入接口設(shè)備,所提出的“漸進(jìn)式語音”方法使得能夠?qū)Ⅺ溈孙L(fēng)放置在非??拷斓那安慷皇墉h(huán)境噪聲的影響,捕獲具有良好信噪比非常柔和的語音。它實(shí)現(xiàn)了超?。ǖ陀?9dB)的語音泄漏,允許用戶使用語音輸入,而不會在公共和移動情況下以及在辦公室和家庭中煩擾周圍的人。
通過測量氣流方向,SilentVoice可以很容易地與正常話語分離,準(zhǔn)確率為98.8%,它可以用于帶有經(jīng)過專門訓(xùn)練的語音識別器的語音激活系統(tǒng),微軟評估其單詞錯(cuò)誤率(WERs)為1.8%,(依賴說話者的條件),7.0%(和說話者無關(guān)的條件)。
該技術(shù)仍處于研究階段,但肯定會幫助人們在不打擾周圍人的情況下工作并且錄制語音。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報(bào)投訴
原文標(biāo)題:微軟正在研發(fā)新語音輸入技術(shù):用戶小聲說話也能輸入
文章出處:【微信號:robot-1hjqr,微信公眾號:1號機(jī)器人網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
相關(guān)推薦
智能語音識別和語音應(yīng)答,成為移動互聯(lián)網(wǎng)時(shí)代重要的技術(shù),蘋果、微軟、谷歌(微博)、亞馬遜等各大巨頭均有布局。在人類
發(fā)表于 10-19 09:57
?3572次閱讀
微軟語音識別系統(tǒng)如何可以在labview上應(yīng)用起來?貌似這兩個(gè)軟件不兼容,有什么好的處理方法
發(fā)表于 03-23 16:00
導(dǎo)讀:關(guān)于下一代 HoloLens,微軟終于透露了一些消息:正在研發(fā) AI 芯片,使其識別
發(fā)表于 07-31 21:17
導(dǎo)讀:微軟今天宣布,其會話語音識別系統(tǒng)的誤率達(dá)到了5.1%,是目前為止最低的。
[img][/img]
這一數(shù)據(jù)超過了微軟人工智
發(fā)表于 08-23 09:18
,通過語音命令進(jìn)行操作。語音技術(shù)的應(yīng)用已經(jīng)成為一個(gè)具有競爭性的新興高技術(shù)產(chǎn)業(yè)。
發(fā)表于 03-10 22:00
聲音波形的一個(gè)個(gè)點(diǎn)了。下圖是一個(gè)波形的示例。 在開始語音識別之前,有時(shí)需要把首尾端的靜音切除,降低對后續(xù)步驟造成的干擾。這個(gè)
發(fā)表于 05-30 07:41
特定人語音識別的方法有哪些?特定人語音識別系統(tǒng)是由哪些部分組成的?如何去實(shí)現(xiàn)一種特定人語音
發(fā)表于 05-19 06:44
語音與“家電溝通”,控制其開啟和關(guān)斷?;舅悸罚鹤髌啡诤蠁纹瑱C(jī)技術(shù)、基于非特定人的語音識別技術(shù)、無線信息發(fā)傳輸
發(fā)表于 09-15 06:50
基于STM32F429的語音識別交互系統(tǒng)有哪些具體功能?怎樣去設(shè)計(jì)一種基于STM32F429的語音識別交互系統(tǒng)?
發(fā)表于 10-20 06:58
基于微軟嵌入式系統(tǒng)該怎樣去添加語音識別及朗讀功能呢?
發(fā)表于 12-23 06:42
什么是語音識別技術(shù)
語音識別技術(shù)就是讓機(jī)器通過識別
發(fā)表于 03-06 10:35
?1619次閱讀
Cloud Shell表明微軟正在研發(fā)一種基于云計(jì)算的Windows 10系統(tǒng),并且可以在基于x86架構(gòu)(英特爾、AMD)和ARM架構(gòu)(驍龍、Tegra、Exynos)等不同設(shè)備上運(yùn)行
發(fā)表于 01-29 22:47
?515次閱讀
隨著微處理器技術(shù)的發(fā)展與成熟,嵌入式語音識別系統(tǒng)已逐漸成為各領(lǐng)域研究的熱點(diǎn)方向,各種迎合人們需求的語音識別設(shè)備出現(xiàn)在我們的現(xiàn)實(shí)生活中。本課題
發(fā)表于 03-19 14:29
?4106次閱讀
語音識別是一種可以識別口語單詞的技術(shù),然后可以將其轉(zhuǎn)換為文本。語音
發(fā)表于 03-03 10:51
?1105次閱讀
方案介紹概要:此設(shè)計(jì)提供了一種低功耗的語音識別解決方案。它通過實(shí)現(xiàn)波束賦形和噪聲抑制器功能來提高識別率,并且可以根據(jù)工作環(huán)境進(jìn)行調(diào)整。系統(tǒng)優(yōu)勢通過使用 RA6M1 MCU 的低功耗
發(fā)表于 12-28 16:10
?0次下載
評論