12月27日,蘋果公司終于不再遮遮掩掩,發(fā)布了自己的首份人工智能研究報(bào)告。業(yè)內(nèi)人士稱,這對(duì)蘋果將來推廣自己的人工智能應(yīng)用大有裨益。蘋果本月初曾表示,將發(fā)布自己的人工智能研究報(bào)告。不到一個(gè)月的時(shí)間,蘋果就兌現(xiàn)了承諾。近日,蘋果發(fā)布了第一份關(guān)于人工智能的學(xué)術(shù)論文。
于于22日發(fā)布其首篇關(guān)于機(jī)器學(xué)習(xí)的研究論文,詳細(xì)描述了如何通過電腦合成圖像訓(xùn)練算法的識(shí)別能力。論文中解釋道,與現(xiàn)實(shí)生活中直接抓取的圖像相比,電腦合成圖像已經(jīng)包含標(biāo)記和注釋。在訓(xùn)練計(jì)算機(jī)人工神經(jīng)網(wǎng)絡(luò)算法時(shí),省去了大量人力,程序員無需再一一告訴計(jì)算機(jī),圖中顯示的每一樣?xùn)|西是什么。不過,電腦合成圖像相比真實(shí)世界缺乏真實(shí)感也是顯而易見的,論文中為此專門提出了一種叫做“模擬+無監(jiān)督學(xué)習(xí)”的方法。蘋果還改進(jìn)了現(xiàn)有的生成對(duì)抗網(wǎng)絡(luò)模型,使生成的圖片變得更加逼真。蘋果高調(diào)發(fā)聲進(jìn)軍人工智能領(lǐng)域,繼而迅速公布研究成果,足以見得它興趣濃厚,雄心勃勃。
這篇報(bào)告的第一作者是蘋果研究員阿希什·什里瓦斯特瓦(Ashish Shrivastava),擁有馬里蘭大學(xué)帕克分校計(jì)算機(jī)視覺博士學(xué)位。有業(yè)內(nèi)人士稱,對(duì)于蘋果而言,此次公開其首份人工智能研究報(bào)告也是一大進(jìn)步。多年來,蘋果對(duì)其在人工智能領(lǐng)域的研究一直守口如瓶,這遭到了人工智能研究社區(qū)的批評(píng)。同時(shí),這也影響了蘋果招募人工智能人才。
那么蘋果進(jìn)軍人工智能領(lǐng)域的過程到底經(jīng)歷了什么?
外界一直認(rèn)為蘋果在人工智能領(lǐng)域比較低調(diào),其技術(shù)也落后于Google、微軟等公司。
其實(shí)蘋果有著寫滿兩頁紙的機(jī)器學(xué)習(xí)應(yīng)用,部分已經(jīng)投入使用,其他的還在討論中。而這些應(yīng)用的背后則是這6年來蘋果已悄無聲息收購了15家人工智能公司,包括:語音識(shí)別、自然語言處理、圖像識(shí)別、人臉識(shí)別、動(dòng)作捕捉、機(jī)器學(xué)習(xí)等方向的創(chuàng)新型技術(shù)公司。
有個(gè)有趣的現(xiàn)象是,蘋果每收購一個(gè)AI公司后,均不會(huì)對(duì)外公布收購目的和發(fā)展計(jì)劃,而且會(huì)立即關(guān)閉被收購公司的產(chǎn)品和服務(wù)。
語音、語義識(shí)別
Siri語音助手
Siri無疑是蘋果最為重要的語音產(chǎn)品,2010年以2億美金的價(jià)格購入無疑是一筆非常劃算的買賣,之后蘋果在語音識(shí)別和NLP方向的收購舉措均基于Siri而展開。
Novauris語音識(shí)別
2014年4月,蘋果收購的Novauris是一家自動(dòng)化語音識(shí)別技術(shù)公司,Novauris是由Nuance旗下的Dragon Systems創(chuàng)始人創(chuàng)辦,而Nuance曾是Siri的基礎(chǔ)語音技術(shù)提供商。他們的核心產(chǎn)品是基于服務(wù)器的可擴(kuò)展語音識(shí)別系統(tǒng)NovaSystem,特點(diǎn)是能夠同時(shí)處理多個(gè)語音訪問請(qǐng)求。雖然蘋果拒絕透露如何使用Novauris團(tuán)隊(duì),但從Siri和Nuance的合作關(guān)系來看,蘋果此項(xiàng)收購意在擺脫對(duì)Nuance的依賴,利用Novauris團(tuán)隊(duì)開發(fā)自己的語音技術(shù)。
VocalIQ人機(jī)對(duì)話
一直以來,Siri只能識(shí)別最基本的指令,無法做出匹配度較高的回答,這導(dǎo)致它成為一款?yuàn)蕵穼傩缘膴蕵樊a(chǎn)品。2015年10月,蘋果通過收購VocalIQ予以解決此項(xiàng)問題。VocalIQ能夠利用深度學(xué)習(xí)來理解語言的環(huán)境,從而使得人機(jī)對(duì)話變得更加自然。開發(fā)者在Siri中嵌入VocalIQ的人工智能技術(shù)后,利用這個(gè)平臺(tái)來儲(chǔ)存和學(xué)習(xí)用戶的交流信息,實(shí)現(xiàn)準(zhǔn)確識(shí)別用戶的指令并提供更加智能的對(duì)話。
機(jī)器學(xué)習(xí)
蘋果曾提到他們利用AI技術(shù)試水一些微功能:如識(shí)別陌生來電;檢測(cè)用戶的運(yùn)動(dòng)狀態(tài);手機(jī)解鎖后列出最可能使用的應(yīng)用;自動(dòng)顯示附近標(biāo)記的酒店;日程表安排;興趣新聞推薦等等。這些看似簡(jiǎn)單的功能其實(shí)全部被置人到機(jī)器學(xué)習(xí)系統(tǒng)中,為此蘋果通過收購多家以興趣推薦和習(xí)慣預(yù)測(cè)為研究方向的機(jī)器學(xué)習(xí)公司,用于提高自身的數(shù)據(jù)挖掘?qū)嵙Α?/p>
Turi機(jī)器學(xué)習(xí)平臺(tái)
2016年8月,蘋果斥資2億美元收購機(jī)器學(xué)習(xí)公司Turi。目前Turi已推出了GraphLabCreate、Turi機(jī)器學(xué)習(xí)平臺(tái)、TuriDistributed和TuriPredictive Services等產(chǎn)品,這些產(chǎn)品主要用于開發(fā)推薦引擎、情緒分析、欺詐探測(cè)等解決方案。
Cue數(shù)據(jù)挖掘
2013年10月,蘋果以4000萬美金收購被稱為“云數(shù)據(jù)的搜索引擎”的Cue,Cue可以從用戶郵件、聯(lián)系人、臉書、推特、LinkedIn、Reddit、Dropbox、印象筆記、Tumblr中收集數(shù)據(jù),通過處理所有數(shù)據(jù)并通過機(jī)器學(xué)習(xí)算法找出用戶需要的信息,從而進(jìn)行整理:如提供日歷提醒、通知與某人約會(huì)、會(huì)面餐館推薦等。據(jù)悉,Cue將會(huì)整合到Siri中。
Matcha視頻推薦
2013年8月,蘋果約以1000—1500萬美金(雙方未對(duì)外公布明確交易價(jià)格)收購Matcha,其產(chǎn)品可從Netflix、iTunes、Hulu以及Amazon Prime等流媒體網(wǎng)站上抓取內(nèi)容,根據(jù)興趣焦點(diǎn)推薦合適的信息給用戶。蘋果收購Matcha主要就是為了獲得視頻推薦算法。下線之前,Matcha的iOS應(yīng)用在App Store娛樂類別軟件暢銷榜前15名,用戶增長率非常快。
Semetric音樂數(shù)據(jù)挖掘
2015年1月,蘋果以5000萬美金收購Semetric公司,該公司在2008年推出了Musicmetric服務(wù),主要業(yè)務(wù)是提供與音樂下載和流播放有關(guān)的數(shù)據(jù)分析服務(wù),利用機(jī)器學(xué)習(xí)幫助客戶分析社交媒體中音樂愛好者喜歡哪些歌手和歌曲,從而給出相關(guān)音樂推薦。完成收購后,蘋果將其整合在iTunes音樂中。除音樂外,Semetric在游戲、電視、電影和圖書方面的數(shù)據(jù)分析服務(wù)也有著一定的積累,這將有助于增強(qiáng)蘋果對(duì)旗下各類數(shù)字產(chǎn)品的數(shù)據(jù)挖掘。
Spotsetter地圖社交個(gè)性化推薦
Spotsetter是基于Google地圖的社交搜索引擎,于2014年6月被蘋果收購,其通過分析用戶的社交圈數(shù)據(jù),為用戶提供個(gè)性化的地點(diǎn)(如旅游地點(diǎn)和餐館)推薦服務(wù),致力于解決所謂的“where to go”問題。蘋果的收購目的不外乎其推薦算法與蘋果Maps整合的前景。
WiFiSlam機(jī)器學(xué)習(xí)與模式識(shí)別
2013年3月,蘋果以2000萬美元收購室內(nèi)導(dǎo)航服務(wù)商WiFiSlam,該公司的優(yōu)勢(shì)在于機(jī)器學(xué)習(xí)和模式識(shí)別技術(shù),可對(duì)設(shè)備上各種傳感器收集的數(shù)據(jù)進(jìn)行相關(guān)性繪圖,并且與WiFi三角定位的數(shù)據(jù)相結(jié)合,用于繪制準(zhǔn)確的室內(nèi)地圖,蘋果將其算法應(yīng)用在地圖中。
Topsy 社交數(shù)據(jù)挖掘
2013年,蘋果以2億美金收購Topsy,該公司的產(chǎn)品能夠幫助用戶從Twitter以及其他社交媒體數(shù)據(jù)中提取關(guān)鍵信息,包括關(guān)鍵字追蹤器以及判斷社交媒體中用戶對(duì)某個(gè)話題的反應(yīng)態(tài)度。
計(jì)算機(jī)視覺
蘋果官方提到,他們的人臉識(shí)別和視頻檢測(cè)技術(shù)已經(jīng)開始應(yīng)用在相機(jī)等產(chǎn)品當(dāng)中,與此同時(shí),消息人稱蘋果為研發(fā)VR/AR產(chǎn)品收購了多家專注于計(jì)算機(jī)視覺的公司。
Perceptio圖像識(shí)別
2015年10月,蘋果收購圖像識(shí)別公司Perceptio,該公司的產(chǎn)品是開發(fā)智能手機(jī)端的人工智能圖像分類系統(tǒng),該系統(tǒng)的最大優(yōu)勢(shì)是無需大量外部數(shù)據(jù)進(jìn)行分類。這符合蘋果的隱私保護(hù)策略,對(duì)用戶數(shù)據(jù)的利用最小化,并將盡可能多的技術(shù)放在手機(jī)端,而非云端。
Metaio計(jì)算機(jī)視覺
2015年5月蘋果收購Metaio,Metaio專注于計(jì)算機(jī)視覺和增強(qiáng)現(xiàn)實(shí)的技術(shù)公司,其在計(jì)算機(jī)視覺尤其是人臉識(shí)別方向有著十幾年的研發(fā)經(jīng)驗(yàn)。
Polar Rose人臉識(shí)別
2011年12月,蘋果以2900萬美元收購瑞典人臉識(shí)別廠商Polar Rose。Polar Rose曾推出多個(gè)產(chǎn)品,包括針對(duì)網(wǎng)絡(luò)服務(wù)的面部識(shí)別技術(shù)FaceCloud,以及為手機(jī)添加功能性的FaceLib。其臉部識(shí)別軟件,通過臉部識(shí)別Polar Rose可以為用戶自動(dòng)圈出照片中的人臉。
Emollient 人臉識(shí)別
2016年1月Emollient被蘋果收入囊中,其可以通過臉部識(shí)別技術(shù)分析人類的表情,從而判斷人的情緒。醫(yī)生也可以用他們公司的技術(shù)了解病人的表情是否痛苦,也可將這項(xiàng)技術(shù)應(yīng)用在監(jiān)視器,查看是否有“表情可疑”的人正在商品前面徘徊等等。
Flyby Media 計(jì)算機(jī)視覺
今年年初,蘋果悄悄買下Flyby Media,F(xiàn)lyby Media擁有尖端的計(jì)算機(jī)視覺技術(shù),此外其慣性傳感、同時(shí)定位和導(dǎo)航空間感知技術(shù)也深受蘋果喜愛。Flyby media曾與谷歌合作,利用計(jì)算機(jī)視覺技術(shù)幫助谷歌開發(fā)Project Tango。Flyby Media可幫助系統(tǒng)看到和繪制其周圍環(huán)境地圖,對(duì)于無人駕駛汽車和增強(qiáng)現(xiàn)實(shí)技術(shù)來說都必不可少。
人工智能這么火,蘋果怎么可能錯(cuò)過這個(gè)機(jī)會(huì),勢(shì)必會(huì)在人工智能領(lǐng)域占領(lǐng)一席之地!
評(píng)論