百度和騰訊之后,阿里也正式入局智能語音助手。
在人工智能實(shí)驗(yàn)室夏季新品發(fā)布會(huì)上,阿里正式發(fā)布了語音音箱“天貓精靈X1”。
沒錯(cuò),所以它的喚醒詞,就是“天貓精靈”。
天貓精靈的價(jià)格,只需要499元人民幣。這個(gè)價(jià)錢,相比起市場(chǎng)上的其他智能音箱,確實(shí)非常便宜,此前蘋果Home Pod售價(jià)349美元,Google Home129美元,觸屏版的亞馬遜Echo是230美元。
天貓精靈X1于7月5日開始限量公測(cè),用戶和開發(fā)者可以在天貓精靈官網(wǎng)(bot.tmall.com)申請(qǐng)公測(cè),8月8日將面向天貓會(huì)員用戶進(jìn)行首批正式發(fā)售。
據(jù)阿里介紹,天貓精靈X1是阿里人工智能實(shí)驗(yàn)室推出的首款智能語音終端設(shè)備,內(nèi)置第一代中文人機(jī)交流系統(tǒng)AliGenie。AliGenie生活在云端,它能夠聽懂中文普通話語音指令,目前可實(shí)現(xiàn)智能家居控制、語音購(gòu)物、手機(jī)充值、叫外賣、音頻音樂播放等功能。不過據(jù)36氪了解,這個(gè)音箱似乎一定要插電源,不能直接充電。
1、天貓精靈有哪些較創(chuàng)新點(diǎn)?
前期體驗(yàn)過叮咚,語音交互和播放音樂用著還不錯(cuò)。
這次使用了天貓精靈之后,感覺感覺大體上還是叮咚那套東西,基本上叮咚有的功能,天貓精靈上面也有,無外乎就是兩個(gè)語音系統(tǒng)+兩個(gè)購(gòu)物體系+不同外觀內(nèi)核。給用戶展現(xiàn)傳遞出來的實(shí)質(zhì),差別不大。
天貓精靈可以充話費(fèi),但效果沒那么好,可以加購(gòu)物車,還可以查物流的,也算是個(gè)創(chuàng)新的,因?yàn)樗旧斫壎ǖ木褪前⒗锏膸簦@個(gè)也是別人做不到的獨(dú)特優(yōu)勢(shì)之處。
天貓精靈相比于其他智能音箱,增加多的、獨(dú)特的地方,就是阿里體系的那套東西,它目前主要是把支付寶的東西給移過去。
阿里巴巴的目標(biāo)應(yīng)該就是把這些能用語音實(shí)現(xiàn)的功能都把他移過去,比如交水電費(fèi)、充話費(fèi)、記賬、查物流等,主觀性小、只是要執(zhí)行操作就能完成的功能,后期應(yīng)該都會(huì)把它放在上面去,因?yàn)檫@些功能用語音操作都是很容易實(shí)現(xiàn)的。主觀性特別強(qiáng)、用語音做不了的東西就不移了,比如說搶紅包,購(gòu)買衣服,由于可選擇性太多,目前還不合適放進(jìn)去。
其實(shí)用語音去讓天貓精靈去完成這些事情,個(gè)人感覺也沒方便多少,不過是好奇新奇罷了,不如直接拿個(gè)手機(jī)點(diǎn)得快。后面如果做得更完善一點(diǎn)的話,應(yīng)該還會(huì)有個(gè)屏幕,比如說調(diào)用電視機(jī),這是最簡(jiǎn)單的方式。直接可以調(diào)用電視機(jī),用電視機(jī)顯示屏作為智能音箱的顯示屏使用,這樣既方便有節(jié)省空間和屏幕。
有屏幕交互會(huì)更好,在音箱的外表面環(huán)繞一圈。但音箱設(shè)計(jì)本身,是出于稍遠(yuǎn)距離的交互,而不是近距離的交互,如果是近距離的交互,沒必要做音箱了,做個(gè)平板更好用。
遠(yuǎn)距離的話,也是有范圍的,超過一定范圍你說話聲音就得喊著說了,時(shí)間長(zhǎng)了會(huì)覺得累。天貓精靈現(xiàn)在宣傳的距離范圍是五到十米。叮咚是十米。保守一點(diǎn),他用的方案也是比京東的差一些。如果確實(shí)能夠十米的話,家里面就夠用了。
2、天貓精靈有哪些做得不太好的體驗(yàn)?
在使用過程中,天貓精靈的產(chǎn)品經(jīng)理曾特地打電話過來咨詢使用過程中有什么反饋。個(gè)人覺得語言識(shí)別的準(zhǔn)確性還有待提高。
天貓精靈遠(yuǎn)場(chǎng)語音識(shí)別這一塊,做得不算好。宣傳的充話費(fèi)功能,在使用充話費(fèi)的功能的時(shí)候,它讓我報(bào)手機(jī)號(hào)碼,我報(bào)完我的手機(jī)號(hào)碼之后,我的手機(jī)號(hào)碼最后一位是數(shù)字8,它每次都會(huì)把最后一位數(shù)字8識(shí)別成語氣助詞的“吧”,然后提示手機(jī)號(hào)碼是不正確的。重新試了多次,每次都是同樣的錯(cuò)誤,改成“給185xxxxx8充值x元話費(fèi)”,才正確識(shí)別。
但在用其他家產(chǎn)品,比如手機(jī)上的訊飛輸入法之類的,念得非常快,對(duì)著我的手機(jī)輸入法用的時(shí)候,識(shí)別得非常容易,立馬就識(shí)別了,響應(yīng)速度快,識(shí)別得非常準(zhǔn)確。但是他家的識(shí)別得就不太好。
阿里巴巴(或者是使用第三方的)目前是沒有輸入法,像百度,訊飛,搜狗,他們的語音識(shí)別做得好,其實(shí)很受益于前期輸入法的積累。他們做輸入法開始語音識(shí)別的時(shí)候,最開始也是非常差,但經(jīng)過了輸入法這么多語料的迭代,再把這些語料再投回訓(xùn)練模型里面不斷地訓(xùn)練。現(xiàn)在他們的模型的識(shí)別率,遠(yuǎn)遠(yuǎn)地高于天貓精靈的識(shí)別率,這算是天貓精靈的一個(gè)短板,缺乏語音識(shí)別歷史的相關(guān)技術(shù)的積累。
還有一個(gè)不太好的體驗(yàn),下達(dá)語音指令時(shí),必須要暫停其他指令,無法實(shí)時(shí)。
比如說正在播放音樂時(shí),當(dāng)我想進(jìn)行下一個(gè)操作,我就用喚醒詞叫它時(shí),它就暫停了當(dāng)前的音樂播放。不能一邊跟它說,它還在一邊播放音樂,等我說完了命令,它再自然切換。
音箱本身交互也是個(gè)問題。其實(shí)這個(gè)就是語音交互最大的難題,就是他在播放音樂時(shí),他很難同時(shí)去采集你說話的聲音,在聽到喚醒詞之后必須要停下來,等待你的重新指令。因?yàn)槁曇羰腔ハ喔蓴_的,在麥克風(fēng)旁邊放一個(gè)音箱,你再打電話的時(shí)候,也是一樣的效果。
還有就是兩個(gè)人聊天的時(shí)候,音箱容易就被誤觸、被喚醒。在和別人在聊天,它在旁邊放著,如果你說的話語中包含一些讀音解決的詞語,其實(shí)雖然你不是跟他說的,但是依舊會(huì)被識(shí)別為指令,進(jìn)行喚醒。而且目前的喚醒詞只能是“天貓精靈”,不能更換為其他可愛、呆萌、簡(jiǎn)單的喚醒詞。這個(gè)原因可能是受限于短音節(jié)的更難識(shí)別準(zhǔn)確,所以目前市面基本都是4個(gè)字的喚醒詞。
3、天貓精靈使用最多的功能有哪些?
天貓精靈對(duì)我真正有用處的、滿足實(shí)際生活當(dāng)中需要的,其實(shí)都只是一些實(shí)用的小工具,比如定鬧鐘,播放音樂,設(shè)個(gè)倒計(jì)時(shí),告訴時(shí)間日期。它里面也提供了的一些娛樂內(nèi)容。比如給小盆友講故事、聽書,個(gè)人需求不算大,最開始可能會(huì)因?yàn)楹闷鏁?huì)玩一下,好奇心一過,后期就很少再使用了,還是要分使用場(chǎng)景和使用需求。
不管是什么東西,都應(yīng)該是解決用戶在實(shí)際生活中的需求,才會(huì)有持續(xù)用下去的動(dòng)力。
上述說到使用的小工具,其實(shí)手機(jī)也有,不過是手機(jī)不能遠(yuǎn)場(chǎng)使用。音箱放在客廳,就可以直接問他,現(xiàn)在幾點(diǎn)了,不用拿手機(jī),不用做任何事情,它就可以直接告訴你現(xiàn)在幾點(diǎn)了,幫定個(gè)幾點(diǎn)的鬧鐘。直接說完這句話就可以了,如果用手機(jī)的話,你還要翻,你要選中時(shí)間,然后再選中分鐘,然后點(diǎn)保存,包括Echo上面用的最多的功能也是問時(shí)間,定鬧鐘,說倒計(jì)時(shí),其實(shí)都是常見場(chǎng)景中一些較實(shí)用的小功能。
4、天貓精靈在使用過程中,有沒有特別好和吸引人的地方?
除了定鬧鐘、問天氣之外,沒有特別多的使用場(chǎng)景。時(shí)間在家里來說是不需要的,一般家里都有鐘。播報(bào)新聞特別難受,因?yàn)樘貏e慢,直接用眼睛看新聞,一會(huì)就看完了,很快,但讓音箱播放新聞,一字一句的念,時(shí)間很長(zhǎng),絕對(duì)受不了。對(duì)于現(xiàn)在比較急躁的社會(huì),智能音箱的語音速度不算快,任何功能一個(gè)個(gè)語音播報(bào)的話,對(duì)比之下你就會(huì)更喜歡用手機(jī)瀏覽。
目前暫時(shí)沒有太多吸引人的地方,它畢竟只是一個(gè)單獨(dú)的智能硬件。
如果它能夠形成一整個(gè)生態(tài)的東西,能夠控制我家里面所有的智能設(shè)備的時(shí)候,比如關(guān)燈,把空調(diào)溫度調(diào)到26度,幫切換一個(gè)電視節(jié)目,我想看《人民的名義》第三集,然后直接幫我切換到這個(gè)電視劇。如果它能對(duì)接天貓?bào)w系(阿里智能)的話,應(yīng)該是可以實(shí)現(xiàn)很多很多功能的,如果是形成了一整套客廳內(nèi)的智能家居生態(tài)的話,它就相當(dāng)于一個(gè)客廳的所有的智能家居的一個(gè)入口,這時(shí)候它的價(jià)值會(huì)比現(xiàn)在多得多。
5、關(guān)于智能音箱的使用和發(fā)展
目前智能音箱不是剛需,更多的是滿足科技的好奇心和獵奇。某一些喜歡玩智能音箱的人,他可能會(huì)買回來玩。但是目前天貓精靈沒法長(zhǎng)期用,因?yàn)榭赏嫘圆桓?,除了播放音樂之外,他們沒有把真正可玩的東西做起來。
在語音方面應(yīng)該繼續(xù)深化他的相關(guān)功能。至少要有很多定制的功能,能讓別人去玩的功能。
聽歌不叫玩,這只是音箱本身應(yīng)有的功能,普通藍(lán)牙音箱也有播放音樂的功能,智能音箱多了個(gè)語音說話,但對(duì)要聽歌的人來說是沒有意義的,在手機(jī)上點(diǎn)和直接跟對(duì)它說,對(duì)聽歌的人是沒有區(qū)別。
如果就語音上來設(shè)計(jì)的話,一定是要有更多的交流用途,能設(shè)計(jì)出語音能做的事情,代替變成剛需的東西,他才會(huì)發(fā)展。現(xiàn)階段的智能音箱,最多還只算是一個(gè)比較初級(jí)的功能。天貓精靈現(xiàn)在應(yīng)該是還算一個(gè)比較初級(jí)的產(chǎn)品,后期的話要形成一個(gè)整體的智能家居的生態(tài)鏈的一個(gè)入口,這樣才會(huì)發(fā)揮他應(yīng)該有的價(jià)值。
純粹的語音音箱,發(fā)展不會(huì)太長(zhǎng)久,路線也比較窄。所以智能音箱暫時(shí)還沒有看到有很強(qiáng)的應(yīng)用在里面。智能音箱要真正用起來,還需要多結(jié)合的設(shè)備,智能音箱要做的話就應(yīng)該是一個(gè)入口、一個(gè)控制器,而不僅僅是音箱。
6、國(guó)內(nèi)能夠做起來的一整套智能家居的公司有哪些?
能夠做起來的一整套智能家居的,國(guó)內(nèi)廠家有這兩家:小米,華為。
更有可能的是小米。家里剛買了一套小米的設(shè)備,有攝像頭,數(shù)碼機(jī),有門鈴,有中樞音箱說話的,門鈴就是站在門口的時(shí)候,那個(gè)門鈴就會(huì)叮咚叮咚,不用按的,有人站在門口,他就會(huì)響,小米、小米盒子,還有米家,家里面可以看小孩,小米的家居系列東西很全面,他是全套的。
對(duì)于天貓目前只有一個(gè)音箱的話,這個(gè)可用性、可聯(lián)動(dòng)線就很低。而小米現(xiàn)在他是一個(gè)配套的,他能做成一個(gè)中樞了,他用Zigbee連在網(wǎng)上,中樞用WIFI連在網(wǎng)上,我看到他就這樣子用了,感覺還可以,在家里面都是老人在用,就做兩個(gè)模式,一個(gè)是在家,一個(gè)是出門,點(diǎn)出門那東西就會(huì)自動(dòng)打開,攝像頭打開,回家點(diǎn)一下,攝像頭就關(guān)了,傳感器關(guān)了,點(diǎn)門鈴,門就會(huì)自動(dòng)打開。
華為也有配套設(shè)施。華為/榮耀也有路由器,有電腦、有手機(jī)、有基礎(chǔ)通信設(shè)施,也有一套東西在里面了,而且包括監(jiān)控本來就是華為的強(qiáng)項(xiàng),他的芯片占了80%-90%的市場(chǎng)。華為的好處就是硬件本來就是他自己的,他有芯片,他有多種技術(shù)、人才,包括通訊的那塊東西,他本來就有的,就看他要不要做這個(gè)行業(yè)了。
阿里和騰訊都在開始做智能音箱,他們的定位可能就是做一個(gè)后臺(tái)的內(nèi)容服務(wù)整合商,做的是一個(gè)平臺(tái);百度想做的是一套系統(tǒng),給你一個(gè)硬件到軟件的整體的方案,包括OS,包括給你開發(fā)版,他想做的是給你一個(gè)完整的方案,他的目標(biāo)就是將來成為AI時(shí)代的安卓。
BAT這三家公司,定位也不一樣,小米是想做一整套家居生態(tài)之類的,各個(gè)廠家雖然都在做,想法還是有所不同的。阿里和騰訊他們做內(nèi)容服務(wù)整合商,有著天然優(yōu)勢(shì),他們包括與之相關(guān)聯(lián)的公司,包括音樂、新聞、視頻、FM收音機(jī),充分具備這樣的資源。對(duì)小公司來說就資源匱乏了。
目前做智能音箱的公司雖然多,但是國(guó)內(nèi)一年的銷量是有限的,即便是叮咚音響,一年的銷量也不足20萬臺(tái)。大公司銷量不佳,小公司說做智能音箱基本上是在忽悠。
即使智能音箱行業(yè)的號(hào)角剛剛吹響,但是由于準(zhǔn)入門檻比較高,這個(gè)行業(yè)基本上沒有小公司生存的余地。沒有什么是小公司能獨(dú)立自己做的,語音交互的技術(shù),優(yōu)質(zhì)而豐富的內(nèi)容,硬件原料的供應(yīng)鏈,這三點(diǎn)都不見得小公司有優(yōu)勢(shì)。
7、如何看待亞馬遜、阿里巴巴、京東等行業(yè)巨頭公司做智能音箱呢?小公司還有機(jī)會(huì)嗎?
現(xiàn)在智能音箱在風(fēng)口了,大家都去做智能音箱,即便克服困難做成了智能音箱,消費(fèi)者如何知道并信任你的產(chǎn)品并為此買單?直接跟BAT大公司面對(duì)面競(jìng)爭(zhēng),大公司的資金、渠道、資源整合能力等,各個(gè)角度都秒殺、碾壓小公司,幾乎是沒有任何機(jī)會(huì)的。
音箱方面,阿里等于是開了個(gè)語音的淘寶,小公司去他的語音/智能音箱(平臺(tái))里開個(gè)商鋪(應(yīng)用)就好了,別想也去開個(gè)類似的大平臺(tái),你去賣你的東西就好,阿里不會(huì)去做很底層的東西,阿里一直都是這樣做的,提供一個(gè)大的平臺(tái),大家來平臺(tái)里面賣東西就好了,小公司就是賣服務(wù)、賣應(yīng)用,這個(gè)市場(chǎng)能做起來能火起來,是因?yàn)橛泻芏嘈」緛砥脚_(tái)賣服務(wù),共建平臺(tái)的生態(tài)系統(tǒng)。
類似于做手機(jī)一樣,做手機(jī)的廠商很多,做手機(jī)應(yīng)用的公司更多。亞馬遜的Alex也是,Alex里面有1.5萬+種服務(wù)和應(yīng)用,這1.5萬+種服務(wù)和應(yīng)用,肯定不全部都是亞馬遜自己做的,更多是依靠眾多的第三方公司來提供這些服務(wù),其實(shí)這就是眾多小公司的機(jī)會(huì)。小公司一定要做內(nèi)容提供商,而不是去做很大的產(chǎn)品。
評(píng)論