欧美性猛交xxxx免费看_牛牛在线视频国产免费_天堂草原电视剧在线观看免费_国产粉嫩高清在线观看_国产欧美日本亚洲精品一5区

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

創(chuàng)新探究:智能對(duì)話(huà)的連接與交互案例分析

8g3K_AI_Thinker ? 2017-12-01 13:38 ? 次閱讀

過(guò)去 20 多年,互聯(lián)網(wǎng)及移動(dòng)互聯(lián)網(wǎng)將人類(lèi)帶到了一個(gè)全新的時(shí)代,如果用一個(gè)詞來(lái)總結(jié)和概括這個(gè)時(shí)代的話(huà),「連接」這個(gè)詞再合適不過(guò)。這個(gè)時(shí)代主要建立了四種連接:第一,人和商品的連接;第二,人和人的連接;第三,人和信息的連接;第四,人和設(shè)備的連接。

「連接」本身不是目的,它只是為「交互」建立了通道。在人機(jī)交互(Human-Computer Interaction)中,人通過(guò)輸入設(shè)備給機(jī)器輸入相關(guān)信號(hào),這些信號(hào)包括語(yǔ)音、文本、圖像、觸控等中的一種模態(tài)或多種模態(tài),機(jī)器通過(guò)輸出或顯示設(shè)備給人提供相關(guān)反饋信號(hào)?!高B接」為「交互」雙方架起了橋梁。

「交互」的演進(jìn)方向是更加自然、高效、友好和智能。對(duì)人來(lái)說(shuō),采用自然語(yǔ)言與機(jī)器進(jìn)行智能對(duì)話(huà)交互是最自然的交互方式之一,但這條路上充滿(mǎn)了各種挑戰(zhàn)。

如何讓機(jī)器理解人類(lèi)復(fù)雜的自然語(yǔ)言?如何對(duì)用戶(hù)的提問(wèn)給出精準(zhǔn)的答案而不是一堆候選?如何更加友好地與用戶(hù)閑聊而不是答非所問(wèn)?如何管理復(fù)雜的多輪對(duì)話(huà)狀態(tài)和對(duì)話(huà)上下文?

在阿里巴巴,我們從 2014 年初開(kāi)始對(duì)智能對(duì)話(huà)交互進(jìn)行探索和實(shí)踐創(chuàng)新,研發(fā)成果逐步大規(guī)模應(yīng)用在了智能客服(針對(duì)阿里巴巴生態(tài)內(nèi)部企業(yè)的阿里小蜜、針對(duì)阿里零售平臺(tái)上的千萬(wàn)商家的店小蜜,以及針對(duì)阿里之外企業(yè)及政府的云小蜜等)和各種設(shè)備(如 YunOS 手機(jī)、天貓魔盒、互聯(lián)網(wǎng)汽車(chē)等)上。

本文將對(duì)阿里巴巴在智能對(duì)話(huà)交互技術(shù)上的實(shí)踐和創(chuàng)新進(jìn)行系統(tǒng)的介紹。首先簡(jiǎn)要介紹智能對(duì)話(huà)交互框架和主要任務(wù);接下來(lái)詳細(xì)介紹自然語(yǔ)言理解、智能問(wèn)答、智能聊天和對(duì)話(huà)管理等核心技術(shù);然后介紹阿里巴巴的智能對(duì)話(huà)交互產(chǎn)品;最后是總結(jié)和思考。

智能對(duì)話(huà)交互框架

典型的智能對(duì)話(huà)交互框架如圖 1 所示。其中,語(yǔ)音識(shí)別模塊和文本轉(zhuǎn)語(yǔ)音模塊為可選模塊,比如在某些場(chǎng)景下用戶(hù)用文本輸入,系統(tǒng)也用文本回復(fù)。自然語(yǔ)言理解和對(duì)話(huà)管理是其中的核心模塊,廣義的自然語(yǔ)言理解模塊包括對(duì)任務(wù)類(lèi)、問(wèn)答類(lèi)和閑聊類(lèi)用戶(hù)輸入的理解,但在深度學(xué)習(xí)興起后,大量端到端(End-to-End)的方法涌現(xiàn)出來(lái),問(wèn)答和聊天的很多模型都是端到端訓(xùn)練和部署的,所以本文中的自然語(yǔ)言理解狹義的單指任務(wù)類(lèi)用戶(hù)輸入的語(yǔ)義理解。在圖 2 所示的智能對(duì)話(huà)交互核心功能模塊中,自然語(yǔ)言理解和對(duì)話(huà)管理之外,智能問(wèn)答用來(lái)完成問(wèn)答類(lèi)任務(wù),智能聊天用來(lái)完成閑聊類(lèi)任務(wù)。在對(duì)外輸出層,我們提供了 SaaS 平臺(tái)、PaaS 平臺(tái)和 Bot Framework 三種方式,其中 Bot Framework 為用戶(hù)提供了定制智能助理的平臺(tái)。

圖1 智能對(duì)話(huà)交互框架

智能對(duì)話(huà)交互核心技術(shù)

智能對(duì)話(huà)交互中的核心功能模塊如圖 2 所示,本部分詳細(xì)介紹智能對(duì)話(huà)交互中除輸出層外的自然語(yǔ)言理解、智能問(wèn)答、智能聊天和對(duì)話(huà)管理四個(gè)核心模塊。

圖2 智能對(duì)話(huà)交互中的核心功能模塊

自然語(yǔ)言理解

自然語(yǔ)言理解是人工智能AI-Hard 問(wèn)題 [1],也是目前智能對(duì)話(huà)交互的核心難題。機(jī)器要理解自然語(yǔ)言,主要面臨語(yǔ)言的多樣性、語(yǔ)言的多義性、語(yǔ)言的表達(dá)錯(cuò)誤、語(yǔ)言的知識(shí)依賴(lài)和語(yǔ)言的上下文(示例見(jiàn)表 1)的五個(gè)挑戰(zhàn)。

表 1 上下文示例

整個(gè)自然語(yǔ)言理解圍繞著如何解決以上難點(diǎn)問(wèn)題展開(kāi)。

自然語(yǔ)言理解語(yǔ)義表示

自然語(yǔ)言理解的語(yǔ)義表示主要有分布語(yǔ)義表示 (Distributional semantics)、框架語(yǔ)義表示 (Frame semantics) 和模型論語(yǔ)義表示 (Model-theoretic semantics) 三種方式 [2]。

在智能對(duì)話(huà)交互中,自然語(yǔ)言理解一般采用的是 frame semantics 表示的一種變形,即采用領(lǐng)域(domain)、意圖(intent)和屬性槽(slots)來(lái)表示語(yǔ)義結(jié)果,如圖 3 所示。

圖3 domain ongology 示意圖

在定義了上述的 domain ontology 結(jié)構(gòu)后,整個(gè)算法流程如圖 4 所示。

圖4 自然語(yǔ)言理解流程簡(jiǎn)圖

意圖分類(lèi)

意圖分類(lèi)是一種文本分類(lèi),主要分為基于規(guī)則的方法、基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法和基于深度學(xué)習(xí)的方法,如 CNN[3]、LSTM[4]、RCNN[5]、C-LSTM[6] 及 FastText[7] 等。針對(duì) CNN、LSTM、RCNN、C-LSTM 四種典型的模型框架,我們?cè)?14 個(gè)領(lǐng)域的數(shù)據(jù)集上進(jìn)行訓(xùn)練,在 4 萬(wàn)左右規(guī)模的測(cè)試集上進(jìn)行測(cè)試,采用 Micro F1 作為度量指標(biāo)(注:此處的訓(xùn)練和測(cè)試中,神經(jīng)網(wǎng)絡(luò)的輸入只包含 word embedding,沒(méi)有融合符號(hào)表示),結(jié)果如圖 5 所示,其中 Yoon Kim 在 2014 年提出的基于 CNN[3] 的分類(lèi)算法效果最好。

圖5 四種模型的分類(lèi)效果對(duì)比

單純以 word vector 為輸入的 CNN 分類(lèi)效果,在某些領(lǐng)域上無(wú)法超越復(fù)雜特征工程的 SVM 分類(lèi)器。如何進(jìn)一步提升深度學(xué)習(xí)的效果,其中一個(gè)探索方向就是試圖把分布式表示和符號(hào)表示進(jìn)行融合。比如對(duì)于「劉德華的忘情水」這句話(huà),通過(guò)知識(shí)庫(kù)可以標(biāo)注劉德華為 singer、忘情水為 song,期望能把 singer 和 song 這樣的符號(hào)表示融入到網(wǎng)絡(luò)中去。具體融合方法,既可以把符號(hào)標(biāo)簽進(jìn)行 embedding,然后把 embedding 后的 vector 拼接到 word vector 后進(jìn)行分類(lèi),也可以直接用 multihot 的方式拼接到 word vector 后面。分布式表示和符號(hào)表示融合后的 CNN 結(jié)構(gòu)如圖 6 所示。

圖6 分布式表示和符號(hào)表示融合后的 CNN 分類(lèi)網(wǎng)絡(luò)結(jié)構(gòu)

經(jīng)過(guò)融合后,在 14 個(gè)領(lǐng)域約 4 萬(wàn)條測(cè)試數(shù)據(jù)集上,對(duì)比融合前后的 F1 值(如圖 7 所示),從中可以看出,像餐廳、酒店、音樂(lè)等命名實(shí)體多且命名形式自由的領(lǐng)域,效果提升非常明顯。

圖7 在 CNN 中分布式表示融合符號(hào)表示前后效果對(duì)比

在以詞為輸入單位的 CNN 中,經(jīng)常會(huì)遇到 OOV(Out-Of-Vocabulary)問(wèn)題,一般情況下會(huì)使用一個(gè)特殊向量(比如固定的隨機(jī)向量或者已知詞向量的平均值)來(lái)表示所有的 OOV,這樣做的效果肯定不夠好。在我們的實(shí)現(xiàn)中,引入了 FastText[8] 來(lái)訓(xùn)練 word vector,對(duì)于 OOV,可以用其 subword 向量計(jì)算得到,有效地解決了 OOV 的問(wèn)題。

在 效 果 優(yōu) 化 方 面,除了本文中所述的 word vector 的動(dòng)態(tài)訓(xùn)練和 dropout 之外,通過(guò)對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng)(data augmentation),效果會(huì)有較大的提升。

屬性抽取

屬性抽取問(wèn)題可以抽象為一個(gè)序列標(biāo)注問(wèn)題,可以以字為單位進(jìn)行序列標(biāo)注,也可以以詞為單位進(jìn)行序列標(biāo)注,如圖 8 所示為以詞為單位進(jìn)行序列標(biāo)注的示例。在這個(gè)例子中包含 departure、destination 和 time 三個(gè)待標(biāo)注標(biāo)簽;B 表示一個(gè)待標(biāo)注標(biāo)簽的起始詞;I 表示一個(gè)待標(biāo)注標(biāo)簽的非起始詞,O 表示非待標(biāo)注標(biāo)簽詞。

圖8 序列標(biāo)注示例

屬性抽取的方法,包括基于規(guī)則的方法和基于傳統(tǒng)統(tǒng)計(jì)模型的方法,經(jīng)典的如 CRF[9],以及基于深度學(xué)習(xí)模型的方法。

2014 年,在 ARTIS 數(shù)據(jù)集上,RNN[10] 模型的效果超過(guò)了 CRF。此后,R-CRF [11]、LSTM[12]、Bi-RNN[13]、 Bi-LSTM-CRF[14] 等各種模型陸續(xù)出來(lái)。

在屬性抽取這個(gè)任務(wù)中,我們采用了如圖 9 的網(wǎng)絡(luò)結(jié)構(gòu),該結(jié)構(gòu)具有以下優(yōu)點(diǎn)。

圖9 屬性抽取網(wǎng)絡(luò)結(jié)構(gòu)

輸入層

在輸入層,我們做了三部分工作:① 采用了分布式表示(word vector)和符號(hào)表示(symbol vector)融合的方式,有效利用了分布式的上下文學(xué)習(xí)能力和符號(hào)的抽象知識(shí)表示能力;② 采用了局部上下文窗口(localcontext window),將窗口內(nèi)的詞的表示拼接在一起送入一個(gè)非線(xiàn)性映射層,非線(xiàn)性映射具有特征學(xué)習(xí)和特征降維的作用;③ 采用了 FastText [8] 進(jìn)行 word embedding 的學(xué)習(xí),可以有效解決 OOV 的問(wèn)題。

Bi-LSTM 層

在中間的隱藏層,采用 Bi-LSTM 進(jìn)行特征學(xué)習(xí),既能捕捉上文特征,也能捕捉下文特征。

輸出層

在輸出層有幾種典型的做法,比如 Bi-LSTM+Softmax、Bi-LSTM+CRF 等,Bi-LSTM+Softmax 是把屬性抽取在輸出層當(dāng)成了一個(gè)分類(lèi)問(wèn)題,得到的標(biāo)注結(jié)果是局部最優(yōu),Bi-LSTM+CRF 在輸出層會(huì)綜合句子層面的信息得到全局最優(yōu)結(jié)果。

意圖排序

在表1 中,我們展示了一個(gè)例子,如果不看上下文,無(wú)法確定「后天呢」的意圖。為了解決這個(gè)問(wèn)題,在系統(tǒng)中我們?cè)O(shè)計(jì)了意圖排序模塊,其流程如圖 10 所示。對(duì)于用戶(hù)輸入的 utterance,一方面先利用分類(lèi)抽取模型去判定意圖并做抽?。涣硪环矫?,直接繼承上文的意圖,然后根據(jù)這個(gè)意圖做屬性抽取。這兩個(gè)結(jié)果通過(guò)特征抽取后一起送入一個(gè) LR 分類(lèi)器,以判定當(dāng)前 utterance 是應(yīng)該繼承上文的意圖,還是遵循分類(lèi)器分類(lèi)的意圖。如果是繼承上文意圖,那么可以把這個(gè)意圖及其屬性抽取結(jié)果作為最終結(jié)果輸出;如果是遵循分類(lèi)器分類(lèi)的結(jié)果,那么可以把各個(gè)結(jié)果按照分類(lèi)器分類(lèi)的置信度排序輸出。

圖10 基于上下文的意圖延續(xù)判定

智能問(wèn)答

在具體的業(yè)務(wù)場(chǎng)景中有三種典型的問(wèn)答任務(wù),一是用戶(hù)提供 QA-Pairs,一問(wèn)一答;二是建立結(jié)構(gòu)化的知識(shí)圖譜,進(jìn)行基于知識(shí)圖譜的問(wèn)答;三是針對(duì)非結(jié)構(gòu)化的文本,進(jìn)行基于閱讀理解的問(wèn)答。本文重點(diǎn)介紹我們?cè)陂喿x理解方面做的工作,比如利用閱讀理解解決淘寶活動(dòng)規(guī)則的問(wèn)答。

在閱讀理解的方法上,目前針對(duì)斯坦福大學(xué)的數(shù)據(jù)集 SquAD,有大量?jī)?yōu)秀的方法不斷涌現(xiàn),比如 match-LSTM[15]、BiDAF[16]、DCN[17]、 FastQA[18] 等。文獻(xiàn) [18] 給出了目前的通用框架,如圖 11 所示,主要分為 4 層:① Word Embedder,對(duì)問(wèn)題和文檔中的詞進(jìn)行 embedding;② Encoder,對(duì)問(wèn)題和文檔進(jìn)行編碼,一般采用 RNN/LSTM/BiLSTM; ③ Interaction Layer(交互層),在問(wèn)題和文檔之間逐詞進(jìn)行交互,這是目前研究的熱點(diǎn),主流方法是采用注意力機(jī)制(attention);④ Answer Layer(答案層),預(yù)測(cè)答案的起始位置和結(jié)束位置。

圖11 閱讀理解的通用框架

我們?cè)诰唧w實(shí)現(xiàn)中,參考 BiDAF[16] 網(wǎng)絡(luò)結(jié)構(gòu),在此基礎(chǔ)上做了大量?jī)?yōu)化。

模型的業(yè)務(wù)優(yōu)化

需要改進(jìn)模型的結(jié)構(gòu)設(shè)計(jì),使得模型可以支持電商文檔格式的輸入。電商規(guī)則文檔往往包含大量的文檔結(jié)構(gòu),如大小標(biāo)題和文檔的層級(jí)結(jié)構(gòu)等,將這些特定的篇章結(jié)構(gòu)信息一起編碼輸入到網(wǎng)絡(luò)中,將大幅提升訓(xùn)練的效果。

模型的簡(jiǎn)化

學(xué)術(shù)文獻(xiàn)中的模型一般都較為復(fù)雜,而工業(yè)界場(chǎng)景中由于對(duì)性能的要求,無(wú)法將這些模型直接在線(xiàn)上使用,需要做一些針對(duì)性的簡(jiǎn)化,使得模型效果下降可控的情況下,盡可能提升線(xiàn)上預(yù)測(cè)性能,例如可以簡(jiǎn)化模型中的各種 bi-lstm 結(jié)構(gòu)。

多種模型的融合

當(dāng)前這些模型都是純粹的 end-to-end 模型,其預(yù)測(cè)的可控性和可解釋性較低,要適用于業(yè)務(wù)場(chǎng)景的話(huà),需要考慮將深度學(xué)習(xí)模型與傳統(tǒng)模型進(jìn)行融合,達(dá)到智能程度和可控性的最佳平衡點(diǎn)。

智能聊天

面向 open domain 的聊天機(jī)器人目前無(wú)論在學(xué)術(shù)界還是在工業(yè)界都是一大難題,目前有兩種典型的方法:一是基于檢索的模型,比如文獻(xiàn) [19-20],其基本思路是利用搜索引擎通過(guò)計(jì)算相關(guān)性來(lái)給出答案;二是基于 Seq2Seq 的生成式模型,典型的方法如文獻(xiàn) [21-22],其網(wǎng)絡(luò)結(jié)構(gòu)如圖 12 所示。

圖12 Seq2Seq 典型網(wǎng)絡(luò)結(jié)構(gòu)

檢索模型的優(yōu)點(diǎn)是答案在預(yù)設(shè)的語(yǔ)料庫(kù)中,可控,匹配模型相對(duì)簡(jiǎn)單,可解釋性強(qiáng);缺點(diǎn)是在一定程度上缺乏對(duì)語(yǔ)義的理解,且有固定語(yǔ)料庫(kù)的局限性,長(zhǎng)尾問(wèn)題覆蓋率較差。生成模型的優(yōu)點(diǎn)是通過(guò)深層語(yǔ)義方式進(jìn)行答案生成,答案不受語(yǔ)料庫(kù)規(guī)模限制;缺點(diǎn)是模型的可解釋性不強(qiáng),且難以保證回答一致性和合理性。

在我們的聊天引擎中,結(jié)合檢索模型和生成模型各自的優(yōu)勢(shì),提出了一種新的模型 AliMe Chat [23],基本流程如圖 13 所示。首先采用檢索模型從 QA 知識(shí)庫(kù)中找出候選答案集合; 然后利用帶注意力的 Seq2Seq 模型對(duì)候選答案進(jìn)行排序,如果第一候選的得分超過(guò)某個(gè)閾值,則作為最終答案輸出,否則利用生成模型生成答案。其中帶注意力的 Seq2Seq 模型結(jié)構(gòu)如圖 14 所示。經(jīng)過(guò)訓(xùn)練后,主要做了如下測(cè)試:如圖 15 所示,利用 600 個(gè)問(wèn)題的測(cè)試集,測(cè)試了檢索(IR)、生成(Generation)、檢索+ 重排序(Rerank)及檢索+ 重排序+ 生成(IR+Rerank+Generation)四種方法的效果,可以看到在閾值為 0.19 時(shí),IR+Rerank+Generation 的方法效果最好。

圖13 AliMe Chat 流程圖

圖14 帶注意力的 Seq2Seq 網(wǎng)絡(luò)結(jié)構(gòu)示例

圖15 IR、Generation、Rerank、IR+Rerank+Generation 效果對(duì)比

此模型在阿里小蜜中上線(xiàn),示例如圖 16 所示。在阿里小蜜中,針對(duì)之前的 IR 模型和 AliMe Chat 模型,利用線(xiàn)上流量做了 A/B Test,結(jié)果如表 2 所示。從用戶(hù)日志中隨機(jī)選擇 2 136 條數(shù)據(jù),其中 1 089 是采用 IR 模型回答,另外 1 047 是采用 AliMe Chat 回答,AliMe Chat Top1 答案的準(zhǔn)確率(accuracy)是 60.36%,遠(yuǎn)遠(yuǎn)好于 IR 的 40.86%。

圖16 AliMe Chat 在阿里小蜜中上線(xiàn)后的聊天示例

表 2 阿里小蜜中 IR 方法與 AliMe Chat 方法 A/B Test 結(jié)果

對(duì)話(huà)管理

對(duì)話(huà)管理根據(jù)語(yǔ)言理解的結(jié)構(gòu)化語(yǔ)義表示結(jié)果以及上下文,來(lái)管理整個(gè)對(duì)話(huà)的狀態(tài),并決定下一步采取什么樣的動(dòng)作。

下面來(lái)看一個(gè)簡(jiǎn)單的對(duì)話(huà)例子。

對(duì)話(huà)交互分成兩個(gè)階段,第一階段,通過(guò)多輪對(duì)話(huà)交互,把用戶(hù)的需求收集完整,得到結(jié)構(gòu)化的信息(出發(fā)地、目的地、時(shí)間等);第二階段就是請(qǐng)求服務(wù),接著還要去做選擇、確定、支付、購(gòu)買(mǎi)等后面一系列的步驟。

傳統(tǒng)的人機(jī)對(duì)話(huà),包括現(xiàn)在市面上常見(jiàn)的人機(jī)對(duì)話(huà),一般都是只在做第一階段的對(duì)話(huà),第二階段的對(duì)話(huà)做得不多。對(duì)此,我們?cè)O(shè)計(jì)了一套對(duì)話(huà)管理體系,如圖 17 所示,這套對(duì)話(huà)管理體系具有以三個(gè)特點(diǎn)。

圖17 對(duì)話(huà)管理框架圖

第一,設(shè)計(jì)了一套面向 Task Flow 的對(duì)話(huà)描述語(yǔ)言。該描述語(yǔ)言能夠把整個(gè)對(duì)話(huà)任務(wù)流完整地表達(dá)出來(lái),這個(gè)任務(wù)流就是類(lèi)似于程序設(shè)計(jì)的流程圖。對(duì)話(huà)描述語(yǔ)言帶來(lái)的好處是它能夠讓對(duì)話(huà)引擎和業(yè)務(wù)邏輯實(shí)現(xiàn)分離,分離之后業(yè)務(wù)方可以開(kāi)發(fā)腳本語(yǔ)言,不需要修改背后的引擎。

第二,由于有了 Task Flow 的機(jī)制,我們?cè)趯?duì)話(huà)引擎方帶來(lái)的收益是能夠?qū)崿F(xiàn)對(duì)話(huà)的中斷和返回機(jī)制。在人機(jī)對(duì)話(huà)當(dāng)中有兩類(lèi)中斷,一類(lèi)是用戶(hù)主動(dòng)選擇到另外一個(gè)意圖,更多是由于機(jī)器沒(méi)有理解用戶(hù)話(huà)的意思,導(dǎo)致這個(gè)意圖跳走了。由于我們維護(hù)了對(duì)話(huà)完整的任務(wù)流,知道當(dāng)前這個(gè)對(duì)話(huà)處在一個(gè)什么狀態(tài),是在中間狀態(tài)還是成功結(jié)束了,如果在中間狀態(tài),我們有機(jī)會(huì)讓它回來(lái),剛才講過(guò)的話(huà)不需要從頭講,可以接著對(duì)話(huà)。

第三,設(shè)計(jì)了對(duì)話(huà)面向開(kāi)發(fā)者的方案,稱(chēng)之為 Open Dialog,背后有一個(gè)語(yǔ)言理解引擎和一個(gè)對(duì)話(huà)引擎。面向開(kāi)發(fā)者的語(yǔ)言理解引擎是基于規(guī)則辦法,能夠比較好地解決冷啟動(dòng)的問(wèn)題,開(kāi)發(fā)者只需要寫(xiě)語(yǔ)言理解的 Grammar,基于對(duì)話(huà)描述語(yǔ)言開(kāi)發(fā)一個(gè)對(duì)話(huà)過(guò)程,并且還有對(duì)數(shù)據(jù)的處理操作。這樣,一個(gè)基本的人機(jī)對(duì)話(huà)就可以完成了。

阿里智能對(duì)話(huà)交互產(chǎn)品

智能服務(wù)——小蜜家族

2015 年 7 月,阿里巴巴推出了自己的智能服務(wù)助理——阿里小蜜,一個(gè)圍繞著電子商務(wù)領(lǐng)域中的服務(wù)、導(dǎo)購(gòu),以及任務(wù)助理為核心的智能對(duì)話(huà)交互產(chǎn)品。通過(guò)電子商務(wù)領(lǐng)域與智能對(duì)話(huà)交互領(lǐng)域的結(jié)合,帶來(lái)傳統(tǒng)服務(wù)行業(yè)模式的變革與體驗(yàn)的提升。在 2016 年的「雙十一」期間,阿里小蜜整體智能服務(wù)量達(dá)到 643 萬(wàn),其中智能解決率達(dá)到 95%,智能服務(wù)在整個(gè)服務(wù)量 ( 總服務(wù)量= 智能服務(wù)量+ 在線(xiàn)人工服務(wù)量+ 電話(huà)服務(wù)量) 占比也達(dá)到 95%,成為了「雙+ 十一」期間服務(wù)的絕對(duì)主力。阿里小蜜主要服務(wù)阿里國(guó)內(nèi)業(yè)務(wù)和阿里國(guó)際化業(yè)務(wù),國(guó)內(nèi)業(yè)務(wù)如淘寶、天貓、飛豬、健康、閑魚(yú)、菜鳥(niǎo)等,國(guó)際化業(yè)務(wù)如 Lazada、PayTM、AE 等。

隨著阿里小蜜的成功,將智能服務(wù)能力賦能給阿里生態(tài)圈商家及阿里生態(tài)之外的企業(yè)和政府部門(mén),便成了必然的路徑。店小蜜主要賦能阿里生態(tài)中的商家,云小蜜則面向阿里之外的大中小企業(yè)、政府等。整個(gè)小蜜家族如圖 18 所示。

圖18 小蜜家族

智能設(shè)備

過(guò)去 3~4 年,我們可以看到,連接互聯(lián)網(wǎng)的設(shè)備發(fā)生了很大變化,設(shè)備已經(jīng)從 PC 和智能手機(jī)延伸到更廣泛的智能設(shè)備,比如智能音箱、智能電視、機(jī)器人、智能汽車(chē)等設(shè)備。智能設(shè)備的快速發(fā)展正在改變著人和設(shè)備之間的交互方式。

我們研發(fā)的智能對(duì)話(huà)交互平臺(tái)為各種設(shè)備提供對(duì)話(huà)交互能力,目前在 YunOS 手機(jī)、天貓魔盒、互聯(lián)網(wǎng)汽車(chē)等設(shè)備上已經(jīng)大量應(yīng)用。比如在天貓魔盒中,用戶(hù)通過(guò)對(duì)話(huà)交互可以完成搜視頻、查音樂(lè)、問(wèn)天氣等,可以進(jìn)行閑聊,還可以進(jìn)行購(gòu)物。

總結(jié)與思考

過(guò)去幾年中,結(jié)合阿里巴巴在電商、客服、智能設(shè)備方面的剛性需求和場(chǎng)景,我們?cè)谥悄軐?duì)話(huà)交互上做了大量的探索和嘗試,構(gòu)建了一套相對(duì)完整的數(shù)據(jù)、算法、在線(xiàn)服務(wù)、離線(xiàn)數(shù)據(jù)閉環(huán)的技術(shù)體系,并在智能服務(wù)和智能設(shè)備上得到了大規(guī)模的應(yīng)用,簡(jiǎn)單總結(jié)如下。

(1)自然語(yǔ)言理解方面,通過(guò) CNN/Bi-LSTM-CRF 等深度學(xué)習(xí)模型、分布式表示和符號(hào)表示的融合、多粒度的 wordembedding、基于上下文的意圖排序等方法,構(gòu)建了規(guī)則和深度學(xué)習(xí)模型有機(jī)融合的自然語(yǔ)言理解系統(tǒng)。

(2)智能問(wèn)答方面,成功的將機(jī)器閱讀理解應(yīng)用在了小蜜產(chǎn)品中。

(3)智能聊天方面,提出了 AliMe Chat 模型,融合了搜索模型和生成模型的優(yōu)點(diǎn),大大提高了閑聊的精度。

(4)對(duì)話(huà)管理方面,設(shè)計(jì)了基于 Task Flow 的對(duì)話(huà)描述語(yǔ)言,將業(yè)務(wù)邏輯和對(duì)話(huà)引擎分離,并能實(shí)現(xiàn)任務(wù)的中斷返回和屬性的 carry-over 等復(fù)雜功能。

在智能交互技術(shù)落地應(yīng)用的過(guò)程,我們也在不斷思考怎么進(jìn)一步提高智能交互技術(shù)水平和用戶(hù)體驗(yàn)。

第一,堅(jiān)持用戶(hù)體驗(yàn)為先。堅(jiān)持用戶(hù)體驗(yàn)為先,就是產(chǎn)品要為用戶(hù)提供核心價(jià)值。第二,提高語(yǔ)言理解的魯棒性和領(lǐng)域擴(kuò)展性。第三,大力發(fā)展機(jī)器閱讀理解能力。第四,打造讓機(jī)器持續(xù)學(xué)習(xí)能力。第五,打造數(shù)據(jù)閉環(huán),用數(shù)據(jù)驅(qū)動(dòng)效果的持續(xù)提升。

目前的人工智能領(lǐng)域仍然處在弱人工智能階段,特別是從感知到認(rèn)知領(lǐng)域需要提升的空間還非常大。智能對(duì)話(huà)交互在專(zhuān)有領(lǐng)域已經(jīng)可以與實(shí)際場(chǎng)景緊密結(jié)合并產(chǎn)生巨大價(jià)值,尤其在智能客服領(lǐng)域(如阿里巴巴的小蜜)。隨著人工智能技術(shù)的不斷發(fā)展,未來(lái)智能對(duì)話(huà)交互領(lǐng)域的發(fā)展還將會(huì)有不斷的提升。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 語(yǔ)音識(shí)別
    +關(guān)注

    關(guān)注

    38

    文章

    1745

    瀏覽量

    112968
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1624

    瀏覽量

    47573

原文標(biāo)題:阿里智能對(duì)話(huà)交互實(shí)踐與創(chuàng)新

文章出處:【微信號(hào):AI_Thinker,微信公眾號(hào):人工智能頭條】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    商湯科技推出SenseNova-5o,限時(shí)免費(fèi)實(shí)時(shí)音視頻對(duì)話(huà)服務(wù)

    的實(shí)時(shí)交互、視覺(jué)識(shí)別、記憶思考、持續(xù)對(duì)話(huà)和復(fù)雜推理等多項(xiàng)能力。這些功能使得AI與人類(lèi)之間的交流更加自然、流暢,每一次互動(dòng)都充滿(mǎn)了智能與貼心。 通過(guò)SenseNova-5o,用戶(hù)可以享受到前所未有的
    的頭像 發(fā)表于 01-20 15:11 ?334次閱讀

    HarmonyOS NEXT 應(yīng)用開(kāi)發(fā)練習(xí):AI智能對(duì)話(huà)

    一、練習(xí)內(nèi)容 在這個(gè)HarmonyOS NEXT原生應(yīng)用DEMO中,我們將使用ArkTS開(kāi)發(fā)語(yǔ)言創(chuàng)建一個(gè)功能更為豐富的AI智能對(duì)話(huà)框。這個(gè)對(duì)話(huà)框不僅具備基本的聊天功能,還能展示圖片消息、表情符號(hào),并
    發(fā)表于 01-03 11:29

    TNC連接器對(duì)比分析:與其他射頻連接器的性能對(duì)

    德索工程師說(shuō)道在射頻連接器領(lǐng)域,TNC連接器以其卓越的性能和廣泛的應(yīng)用而著稱(chēng)。以下是TNC連接器與其他射頻連接器的性能對(duì)比分析: TNC
    的頭像 發(fā)表于 12-17 10:58 ?321次閱讀
    TNC<b class='flag-5'>連接</b>器對(duì)比<b class='flag-5'>分析</b>:與其他射頻<b class='flag-5'>連接</b>器的性<b class='flag-5'>能對(duì)</b>決

    具身智能對(duì)人機(jī)交互的影響

    在人工智能的發(fā)展歷程中,人機(jī)交互一直是研究的核心領(lǐng)域之一。隨著技術(shù)的進(jìn)步,人機(jī)交互的方式也在不斷演變。從最初的命令行界面,到圖形用戶(hù)界面,再到現(xiàn)在的自然語(yǔ)言處理和語(yǔ)音識(shí)別,每一次技術(shù)的突破都極大
    的頭像 發(fā)表于 10-27 09:58 ?464次閱讀

    圖為大模型一體機(jī)新探索,賦能智能家居行業(yè)

    圖為大模型一體機(jī)新探索,賦能智能家居行業(yè) ?在21世紀(jì)的今天,科技的飛速進(jìn)步正以前所未有的速度重塑著我們的生活方式。從智能手機(jī)到物聯(lián)網(wǎng),從大數(shù)據(jù)到人工智能,每一項(xiàng)技術(shù)
    的頭像 發(fā)表于 10-24 11:05 ?309次閱讀

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    和國(guó)際合作等多個(gè)層面。這些內(nèi)容讓我更加認(rèn)識(shí)到,在推動(dòng)人工智能與能源科學(xué)融合的過(guò)程中,需要不斷探索和創(chuàng)新,以應(yīng)對(duì)各種挑戰(zhàn)和機(jī)遇。 最后,通過(guò)閱讀這一章,我深刻感受到人工智能對(duì)于能源科學(xué)的重要性。人工
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第一章人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    周末收到一本新書(shū),非常高興,也非常感謝平臺(tái)提供閱讀機(jī)會(huì)。 這是一本挺好的書(shū),包裝精美,內(nèi)容詳實(shí),干活滿(mǎn)滿(mǎn)。 《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》這本書(shū)的第一章,作為整個(gè)著作的開(kāi)篇
    發(fā)表于 10-14 09:12

    MQTT智能網(wǎng)關(guān)接入物聯(lián)網(wǎng)平臺(tái):實(shí)現(xiàn)高效連接與數(shù)據(jù)交互

    連接設(shè)備和物聯(lián)網(wǎng)平臺(tái)的關(guān)鍵橋梁,在數(shù)據(jù)采集、傳輸和控制中發(fā)揮著至關(guān)重要的作用。本文將詳細(xì)介紹MQTT智能網(wǎng)關(guān)如何接入物聯(lián)網(wǎng)平臺(tái),實(shí)現(xiàn)高效連接與數(shù)據(jù)交互。 一、選擇合適的MQTT
    的頭像 發(fā)表于 09-27 17:04 ?389次閱讀

    科大訊飛發(fā)布星火極速超擬人交互,重塑智能對(duì)話(huà)新體驗(yàn)

    8月19日,科大訊飛震撼宣布了一項(xiàng)關(guān)于其明星產(chǎn)品——星火語(yǔ)音大模型的重大革新,即將推出的“星火極速超擬人交互”功能,預(yù)示著人機(jī)交互的新紀(jì)元。該功能定于8月30日正式登陸訊飛星火App,面向廣大用戶(hù)開(kāi)放體驗(yàn),引領(lǐng)一場(chǎng)前所未有的智能對(duì)話(huà)
    的頭像 發(fā)表于 08-20 16:46 ?405次閱讀

    阿里巴巴將推出人工智能對(duì)話(huà)式采購(gòu)引擎,重塑全球電商生態(tài)

    在數(shù)字化轉(zhuǎn)型的浪潮中,阿里巴巴國(guó)際數(shù)字商業(yè)集團(tuán)再次引領(lǐng)潮流,宣布將于今年9月面向全球商家推出一款革命性的“人工智能驅(qū)動(dòng)的對(duì)話(huà)式采購(gòu)引擎”。這一創(chuàng)新舉措旨在簡(jiǎn)化繁瑣的全球企業(yè)間電子商務(wù)流程,為商家?guī)?lái)前所未有的便捷與高效。
    的頭像 發(fā)表于 08-05 14:19 ?665次閱讀

    聆思CSK6視覺(jué)語(yǔ)音大模型AI開(kāi)發(fā)板入門(mén)資源合集(硬件資料、大模型語(yǔ)音/多模態(tài)交互/英語(yǔ)評(píng)測(cè)SDK合集)

    大模型語(yǔ)音問(wèn)答、拍照識(shí)圖、大模型繪圖等豐富供能示例,支持語(yǔ)音喚醒、多輪語(yǔ)音交互。 2智能對(duì)話(huà)除了大模型語(yǔ)音對(duì)話(huà),還集成了可離線(xiàn)運(yùn)行的坐姿檢測(cè)算法,是一個(gè) 大模型在線(xiàn)服務(wù)+離線(xiàn)AI能力 的示例。 3
    發(fā)表于 06-18 17:33

    智能語(yǔ)音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話(huà)

    隨著現(xiàn)代人工智能在各行業(yè)的普及,智能語(yǔ)音交互技術(shù)也越來(lái)越多的在日常工作、生活中應(yīng)用,智能語(yǔ)音交互的出現(xiàn)不僅僅大量節(jié)省了人工的工作時(shí)間提高了工
    的頭像 發(fā)表于 05-23 15:16 ?773次閱讀
    <b class='flag-5'>智能</b>語(yǔ)音<b class='flag-5'>交互</b>技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然<b class='flag-5'>對(duì)話(huà)</b>

    智能語(yǔ)音交互技術(shù)如何助力設(shè)備實(shí)現(xiàn)人機(jī)自然對(duì)話(huà)

    智能語(yǔ)音交互技術(shù)是指通過(guò)語(yǔ)音識(shí)別、語(yǔ)音合成和自然語(yǔ)言理解等技術(shù),實(shí)現(xiàn)人與機(jī)器之間自然語(yǔ)言的交流和互動(dòng)。隨著現(xiàn)代人工智能在各行業(yè)的普及,智能語(yǔ)音交互
    的頭像 發(fā)表于 05-23 15:14 ?444次閱讀

    用于對(duì)話(huà)式AI的高性能MEMS麥克風(fēng),助力改進(jìn)用戶(hù)體驗(yàn)

    對(duì)話(huà)式人工智能(AI)是一個(gè)快速發(fā)展的機(jī)器學(xué)習(xí)(ML)領(lǐng)域,旨在使人機(jī)交互更加自然直觀。
    的頭像 發(fā)表于 03-12 09:44 ?930次閱讀
    用于<b class='flag-5'>對(duì)話(huà)</b>式AI的高性能MEMS麥克風(fēng),助力改進(jìn)用戶(hù)體驗(yàn)

    淺談智能消防疏散應(yīng)急照明系統(tǒng)的分析與應(yīng)用探究

    淺談智能消防疏散應(yīng)急照明系統(tǒng)的分析與應(yīng)用探究 張穎姣 安科瑞電氣股份有限公司 上海嘉定 201801 【摘要】:隨著社會(huì)的進(jìn)步發(fā)展,人們生活水平提高,對(duì)于日常出行也越來(lái)越重視。智能化照
    的頭像 發(fā)表于 02-27 13:42 ?425次閱讀
    淺談<b class='flag-5'>智能</b>消防疏散應(yīng)急照明系統(tǒng)的<b class='flag-5'>分析</b>與應(yīng)用<b class='flag-5'>探究</b>