7月15日至7月20日,計算機語言學(xué)領(lǐng)域的頂級學(xué)術(shù)會議ACL在墨爾本召開。ACL會議(Annual Meeting of the Association for Computational Linguistics)是自然語言處理與計算語言學(xué)領(lǐng)域最高級別的學(xué)術(shù)會議,由計算語言學(xué)協(xié)會主辦,每年一屆。
值得一提的是,擁有今日頭條、抖音等產(chǎn)品的字節(jié)跳動公司本次入選論文是由一位90后博士完成的。他在機器翻譯方向的研究內(nèi)容「Modeling Past and Future for Neural Machine Translation」被Transaction of ACL收錄,并受邀在ACL2018做現(xiàn)場報告。
論文針對神經(jīng)機器翻譯系統(tǒng)并沒有顯示地對已翻譯和未翻譯的內(nèi)容做建模這一現(xiàn)狀,提出了一種全新的機制。它在解碼過程中動態(tài)地將源端信息分成兩個部分:已經(jīng)翻譯的內(nèi)容(Past)和未翻譯的內(nèi)容(Future),并設(shè)計兩個不同的循環(huán)神經(jīng)網(wǎng)絡(luò)層對其進行建模。通過將兩部分信息動態(tài)地輸入到注意力模型和解碼器狀態(tài)中,從而使整個神經(jīng)翻譯模型更好地在當(dāng)前狀態(tài)下區(qū)分已翻和未翻的內(nèi)容。
圖說:論文模型圖
實驗結(jié)果表明,該論文提出的模型在中英,德英和英法三個標(biāo)準(zhǔn)數(shù)據(jù)集上可以顯著地提高基線系統(tǒng)的性能,相比于覆蓋率模型擁有更好的翻譯質(zhì)量和對齊質(zhì)量。
據(jù)了解,目前該翻譯方法已成功應(yīng)用至字節(jié)跳動旗下的多款國際產(chǎn)品中,為不同國家的用戶提供內(nèi)容翻譯服務(wù),促進信息更便捷的流動。公開資料顯示,僅抖音海外版在全球就已覆蓋超過150個國家和地區(qū),先后在40多個國家應(yīng)用商店排名前列。目前抖音全球月活用戶超過5億,是世界范圍內(nèi)增速最快的短視頻應(yīng)用。
圖說:ACL現(xiàn)場參會者在字節(jié)跳動展臺前觀看技術(shù)展示
成立僅僅兩年的字節(jié)跳動AI LAB專注于人工智能領(lǐng)域的前沿技術(shù)研究,在CVPR、ACL及NAACL等人工智能頂級學(xué)術(shù)會議上,均有論文入選。
作為最早一批將人工智能應(yīng)用到產(chǎn)品中的企業(yè),字節(jié)跳動致力于將研究成果應(yīng)用于相關(guān)的產(chǎn)品中,讓新技術(shù)更好地幫助內(nèi)容創(chuàng)作、分發(fā)、互動、管理。過去幾年間,實驗室不僅研發(fā)出自動問答、封面圖自動選取、自動寫稿機器人xiaomingbot等多種實用性功能,同時也創(chuàng)造了抖音尬舞機、3D全景博物館等深受用戶喜愛的功能。
今年6月,字節(jié)跳動CVPR入選論文“基于半監(jiān)督空間轉(zhuǎn)換網(wǎng)絡(luò)的球衣號碼識別”的相關(guān)技術(shù)也已經(jīng)應(yīng)用于旗下產(chǎn)品近期的世界杯圖文直播中。比賽精彩片段GIF圖、控球率分布圖、比賽熱力圖等內(nèi)容均基于該技術(shù)由機器自動實時生成。
-
人工智能
+關(guān)注
關(guān)注
1796文章
47789瀏覽量
240547 -
ACL
+關(guān)注
關(guān)注
0文章
61瀏覽量
12029
原文標(biāo)題:字節(jié)跳動90后員工論文入選國際頂級計算機語言學(xué)術(shù)會議
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論