在蘋(píng)果宣布停止公布手機(jī)銷(xiāo)量,以富士康和和碩為代表的供應(yīng)商下調(diào)新款iPhone銷(xiāo)售預(yù)期,市場(chǎng)一致看衰的背景下,蘋(píng)果用什么來(lái)提振投資人的信心呢?
無(wú)人駕駛被蘋(píng)果拿出來(lái)說(shuō)事了。也是在上周,有媒體報(bào)道,庫(kù)克證實(shí)蘋(píng)果正在研發(fā)用于無(wú)人駕駛汽車(chē)的自主系統(tǒng),這也是庫(kù)克為數(shù)不多的第二次公開(kāi)披露蘋(píng)果關(guān)于無(wú)人駕駛方面的計(jì)劃和進(jìn)展。或許蘋(píng)果要為它的無(wú)人駕駛項(xiàng)目提速了。
蘋(píng)果無(wú)人駕駛研發(fā)成果秘而不宣
相比Google、特斯拉這類(lèi)競(jìng)爭(zhēng)者,蘋(píng)果進(jìn)入無(wú)人駕駛的賽道稍晚,2014年才開(kāi)始組建團(tuán)隊(duì),以“Project Titan”作為內(nèi)部代號(hào)。進(jìn)入的時(shí)間晚,并不意味著蘋(píng)果對(duì)無(wú)人駕駛項(xiàng)目不重視,當(dāng)庫(kù)克在2017年6月首次對(duì)外公開(kāi)其無(wú)人車(chē)戰(zhàn)略的時(shí)候,將無(wú)人駕駛技術(shù)拔到“所有AI項(xiàng)目之母”的高度。
于是蘋(píng)果挖來(lái)了特斯拉負(fù)責(zé)整車(chē)研發(fā)和制造的高級(jí)副總裁DougField、大眾汽車(chē)集團(tuán)的首席數(shù)字官JohannJungwirth、福特車(chē)身結(jié)構(gòu)和沖壓專(zhuān)家AindreaCampbell、保時(shí)捷919技術(shù)總監(jiān)AlexanderHitzinger、特斯拉負(fù)責(zé)工程研發(fā)的副總裁ChrisPorritt……
今年7月,美國(guó)聯(lián)邦調(diào)查局指控蘋(píng)果前員工竊取商業(yè)機(jī)密的訴訟文件曝光了蘋(píng)果“Titan”項(xiàng)目的團(tuán)隊(duì)規(guī)?!?000人。
一開(kāi)始,蘋(píng)果就把“盤(pán)子”鋪的很大??墒翘O(píng)果除了逐漸擴(kuò)大自己的測(cè)試車(chē)隊(duì)外(截止今年9月已達(dá)70輛,這個(gè)規(guī)模僅次于通用汽車(chē)的Cruise和Waymo),向外公布的研究成果對(duì)于無(wú)人駕駛技術(shù)并沒(méi)有突破性的指引。
比如類(lèi)似于飛機(jī)的空中加油機(jī)一樣,讓汽車(chē)在行駛時(shí)通過(guò)“連接臂”共享電池系統(tǒng);讓無(wú)人駕駛汽車(chē)與iPhone、iPad或MacBook等蘋(píng)果設(shè)備同步,當(dāng)汽車(chē)遇到緊急情況需要人類(lèi)接管時(shí),發(fā)送警報(bào)提醒正在使用這些設(shè)備的用戶及時(shí)接管汽車(chē)。
根據(jù)自動(dòng)駕駛初創(chuàng)公司Voyage聯(lián)合創(chuàng)始人MacCallister Higgins在網(wǎng)絡(luò)上放出一段蘋(píng)果第三代自動(dòng)駕駛測(cè)試車(chē)的視頻來(lái)看,相比前兩代測(cè)試車(chē),蘋(píng)果也只是對(duì)毫米波雷達(dá)數(shù)量進(jìn)行調(diào)整,對(duì)傳感器列陣進(jìn)行優(yōu)化。
此外還有一些天馬行空的想法:怎么搞一個(gè)靜音車(chē)門(mén),沒(méi)有方向盤(pán)和油門(mén)的情況內(nèi)飾怎么設(shè)計(jì),怎么把AR/VR設(shè)備放到車(chē)?yán)?,怎么?yīng)用球形輪胎、甚至還準(zhǔn)備重新設(shè)計(jì)一款更美觀的激光雷達(dá)……
迄今,蘋(píng)果無(wú)人駕駛技術(shù)展現(xiàn)給大眾的印象是,它的研發(fā)更多停留在硬件和設(shè)計(jì)層面,蘋(píng)果最為擅長(zhǎng)的軟件開(kāi)發(fā)、生態(tài)構(gòu)建等還沒(méi)有任何風(fēng)聲透出。值得玩味的是,蘋(píng)果在2015年買(mǎi)下了3個(gè)與車(chē)相關(guān)的頂級(jí)域名:apple.car,apple.cars和apple.auto,但是至今還未啟用。
用CarPlay接管無(wú)人車(chē)?蘋(píng)果沒(méi)那么天真
相信以蘋(píng)果公司的高度,它不會(huì)沒(méi)有認(rèn)識(shí)到一套充滿智慧的車(chē)載系統(tǒng)對(duì)于無(wú)人駕駛汽車(chē)的重要性。
2013年蘋(píng)果確定進(jìn)軍汽車(chē)領(lǐng)域時(shí)就制定了“iOS in the Car”計(jì)劃,并在次年的日內(nèi)瓦車(chē)展上展出了合作伙伴搭載的CarPlay——一套可以將用戶的iOS設(shè)備、iOS使用體驗(yàn)與汽車(chē)儀表盤(pán)進(jìn)行結(jié)合的車(chē)載系統(tǒng)。蘋(píng)果能用CarPlay來(lái)接管未來(lái)的無(wú)人車(chē)嗎?從目前來(lái)看,CarPlay還不具備這樣的能力。
用戶對(duì)CarPlay的槽點(diǎn)實(shí)在太多。
“支持的APP太少了,最基礎(chǔ)的專(zhuān)業(yè)導(dǎo)航都不支持。每當(dāng)我被迫用起蘋(píng)果坑爹的自帶導(dǎo)航時(shí),就無(wú)比懷念百度和高德?!?/p>
“CarPlay與汽車(chē)連接使用時(shí),經(jīng)常受手機(jī)信號(hào)的影響。手機(jī)信號(hào)不好或者行車(chē)抖動(dòng)會(huì)導(dǎo)致鏈接斷開(kāi),斷開(kāi)后正在使用的導(dǎo)航、音樂(lè)之類(lèi)的應(yīng)用也馬上關(guān)閉,好幾次差點(diǎn)出事!”
“蘋(píng)果系統(tǒng)一升級(jí),CarPlay系統(tǒng)就變得卡一點(diǎn),反應(yīng)也越來(lái)越遲鈍,點(diǎn)個(gè)圖標(biāo)也要等幾秒。”
“升級(jí)iOS 12后,數(shù)據(jù)線連接使用CarPlay時(shí),另外USB接口的U盤(pán)音樂(lè)不能播放,只能播放收音機(jī)與蘋(píng)果手機(jī)自帶的或手機(jī)app的音樂(lè)?!?/p>
“一連CarPlay,車(chē)載藍(lán)牙就失效,這個(gè)Bug好久了也沒(méi)見(jiàn)蘋(píng)果修復(fù)?!?/p>
……
當(dāng)然最讓人無(wú)法接受的是,大量用戶反映連接CarPlay后Siri無(wú)法使用,而在蘋(píng)果的規(guī)劃中,Siri是CarPlay的核心——讓司機(jī)在眼睛不離開(kāi)道路的情況下通過(guò)語(yǔ)音完成操作。
CarPlay這么難用,Google的Android Auto,福特與微軟合作開(kāi)發(fā)的SYNC也好不哪去。系統(tǒng)崩潰、觸屏難用、反應(yīng)速度慢這些問(wèn)題也都在它們身上出現(xiàn)過(guò),有些至今也沒(méi)解決。至于那些基于Android系統(tǒng)開(kāi)發(fā)出來(lái)的車(chē)載系統(tǒng),其穩(wěn)定性和人機(jī)交互邏輯的槽點(diǎn)就更多了。
“小艾你好、小度你好、斑馬你好、Nomi你好……誰(shuí)家的車(chē)多了,開(kāi)車(chē)還得記清那些開(kāi)門(mén)暗號(hào)?!睙o(wú)人駕駛賽道玩家太多,車(chē)載系統(tǒng)的研發(fā),究其源頭同質(zhì)化嚴(yán)重,對(duì)于普通用戶來(lái)說(shuō),要想分清這些語(yǔ)言交互助手和它們所匹配的車(chē)型還很有些難度。
很顯然,無(wú)論是iOS還是Android都是基于手機(jī)的使用場(chǎng)景設(shè)計(jì)開(kāi)發(fā)而來(lái)的,而汽車(chē)的使用場(chǎng)景和人機(jī)交互邏輯與手機(jī)完全不同,將iOS和Android稍稍修改就搬進(jìn)車(chē)內(nèi)注定是不會(huì)成功的。從庫(kù)克的這次表態(tài)來(lái)看,CarPlay可能成為蘋(píng)果無(wú)人車(chē)自主系統(tǒng)的一個(gè)過(guò)渡產(chǎn)品。
自主系統(tǒng)是蘋(píng)果布局無(wú)人駕駛的第一步
對(duì)于無(wú)人駕駛自主系統(tǒng)的研發(fā),蘋(píng)果無(wú)疑是有優(yōu)勢(shì)的,在蘋(píng)果龐大的商業(yè)帝國(guó)中,蘋(píng)果為它的Mac電腦開(kāi)發(fā)了Mac OS系統(tǒng);為iPhone開(kāi)發(fā)了iOS系統(tǒng);甚至連Apple Watch都有屬于自己的Watch OS系統(tǒng)。那么對(duì)于無(wú)人車(chē),蘋(píng)果為什么不從底層開(kāi)始,設(shè)計(jì)一套完全針對(duì)汽車(chē)駕駛場(chǎng)景的“Car OS”呢?
正如十年前手機(jī)行業(yè)面臨的變革一樣,無(wú)人駕駛技術(shù)也將對(duì)汽車(chē)行業(yè)產(chǎn)生翻天覆地的變化。在變化來(lái)臨之前,是先做車(chē)(硬件)還是先做系統(tǒng)(軟件)呢?
類(lèi)似于“先有雞?還是先有蛋?”這個(gè)經(jīng)典的哲學(xué)問(wèn)題,蘋(píng)果用iPhone的經(jīng)驗(yàn)進(jìn)行作答——用軟件定義硬件、用新技術(shù)定義舊行業(yè)。
自主系統(tǒng)是蘋(píng)果布局無(wú)人駕駛的第一步,然后就像用iPhone重新定義手機(jī)一樣,用AI重新定義汽車(chē)。未來(lái),汽車(chē)除了被用于出行之外,還將會(huì)是移動(dòng)的空間,移動(dòng)的計(jì)算終端,移動(dòng)的能源終端,移動(dòng)的攝像機(jī),移動(dòng)的溫度計(jì),移動(dòng)的機(jī)器人……借鑒著當(dāng)前消費(fèi)電子領(lǐng)域的成功,用一套爛熟于心的流程,建立一個(gè)“軟件+硬件+服務(wù)”的全新汽車(chē)消費(fèi)生態(tài)。
就像iOS(軟件)之于iPhone(硬件),在自動(dòng)駕駛無(wú)人車(chē)上,蘋(píng)果在自主系統(tǒng)(軟件)之后,它的無(wú)人車(chē)(硬件)在哪?
其實(shí)蘋(píng)果一直都在尋找制造無(wú)人車(chē)的合適機(jī)會(huì)。由于蘋(píng)果在汽車(chē)研發(fā)上缺乏經(jīng)驗(yàn),在保證現(xiàn)有業(yè)務(wù)體系不受影響的前提下,不可能像特斯拉那樣的初創(chuàng)公司一開(kāi)始就“赤膊上陣”,蘋(píng)果走的是一條委婉的“合作造車(chē)”路線。
合作伙伴的選擇一度讓蘋(píng)果頭痛。早期蘋(píng)果選擇的是加拿大的麥格納公司,之后則是寶馬和奔馳,甚至還與日本日產(chǎn)、中國(guó)比亞迪和英國(guó)的邁凱輪有過(guò)接觸,但都沒(méi)有達(dá)成具體的合作計(jì)劃,其中的主要原因就是蘋(píng)果太過(guò)強(qiáng)勢(shì),它想要主導(dǎo)權(quán),但車(chē)廠不愿將自己賴(lài)以安身立命的造車(chē)數(shù)據(jù)交給蘋(píng)果。
直到今年5月,蘋(píng)果才與大眾達(dá)成合作協(xié)議,共同開(kāi)發(fā)自動(dòng)駕駛的無(wú)人車(chē)。不過(guò)項(xiàng)目是以對(duì)大眾T6廂式車(chē)的改造開(kāi)始,蘋(píng)果重點(diǎn)對(duì)儀表盤(pán)和座椅等部分進(jìn)行改造,還計(jì)劃會(huì)加入各種傳感器和電子設(shè)備,底盤(pán)、車(chē)輪等動(dòng)力機(jī)械部分基本沒(méi)動(dòng)。
這或許只是蘋(píng)果與大眾進(jìn)行深度合作,開(kāi)發(fā)具有前瞻性質(zhì)的自動(dòng)駕駛無(wú)人車(chē)之前的一次試探與磨合。根據(jù)蘋(píng)果的商業(yè)模式,它無(wú)論如何都不會(huì)放棄對(duì)硬件領(lǐng)域的滲透,無(wú)人車(chē)也是如此。
只憑一個(gè)攝像頭 3D目標(biāo)檢測(cè)成績(jī)也能媲美激光雷達(dá)
靠一個(gè)攝像頭拍下的圖像做3D目標(biāo)檢測(cè),究竟有多難?目前最先進(jìn)系統(tǒng)的成績(jī)也不及用激光雷達(dá)做出來(lái)的1/10。
一份來(lái)自劍橋的研究,用單攝像頭的數(shù)據(jù)做出了媲美激光雷達(dá)的成績(jī)。
還有好事網(wǎng)友在Twitter上驚呼:
這個(gè)能不能解決特斯拉不用激光雷達(dá)的問(wèn)題?馬斯克你看見(jiàn)了沒(méi)?
靠“直覺(jué)”判斷
為何人單眼能做到3D識(shí)別,而相機(jī)卻做不到?
因?yàn)橹庇X(jué)。
人能夠根據(jù)遠(yuǎn)小近大的透視關(guān)系,得出物體的大小和相對(duì)位置關(guān)系。
而機(jī)器識(shí)別拍攝的2D照片,是3D圖形在平面上的投影,已經(jīng)失去了景深信息。
為了識(shí)別物體遠(yuǎn)近,無(wú)人車(chē)需要安裝激光雷達(dá),通過(guò)回波獲得物體的距離信息。這一點(diǎn)是只能獲得2D信息的攝像頭難以做到的。
為了讓攝像頭也有3D世界的推理能力,這篇論文提出了一種“正投影特征轉(zhuǎn)換”(OFT)算法。
作者把這種算法和端到端的深度學(xué)習(xí)架構(gòu)結(jié)合起來(lái),在KITTI 3D目標(biāo)檢測(cè)任務(wù)上實(shí)現(xiàn)了領(lǐng)先的成績(jī)。
這套算法包括5個(gè)部分:
前端ResNet特征提取器,用于從輸入圖像中提取多尺度特征圖。
正交特征變換,將每個(gè)尺度的基于圖像的特征圖變換為正投影鳥(niǎo)瞰圖表示。
自上而下的網(wǎng)絡(luò),由一系列ResNet殘余單元組成,以一種對(duì)圖像中觀察到的觀察效果不變的方式處理鳥(niǎo)瞰圖特征圖。
一組輸出頭,為每個(gè)物體類(lèi)和地平面上的每個(gè)位置生成置信分?jǐn)?shù)、位置偏移、維度偏移和方向向量等數(shù)據(jù)。
5. 非最大抑制和解碼階段,識(shí)別置信圖中的峰值并生成離散邊界框預(yù)測(cè)。
這種方法通過(guò)將基于圖像的特征映射到一個(gè)正交3D空間中,打破了圖像的束縛。在這個(gè)3D空間里,各個(gè)物體比例一致、距離也是有意義的。
效果遠(yuǎn)超Mono3D
作者用自動(dòng)駕駛數(shù)據(jù)集KITTI中3712張訓(xùn)練圖像,3769張圖像對(duì)訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)進(jìn)行檢測(cè)。并使用裁剪、縮放和水平翻轉(zhuǎn)等操作,來(lái)增加圖像數(shù)據(jù)集的樣本數(shù)量。
作者提出了根據(jù)KITTI 3D物體檢測(cè)基準(zhǔn)評(píng)估兩個(gè)任務(wù)的方法:最終要求每個(gè)預(yù)測(cè)的3D邊界框應(yīng)與相應(yīng)實(shí)際物體邊框相交,在汽車(chē)情況下至少為70%,對(duì)于行人和騎自行車(chē)者應(yīng)為50%。
與前人的Mono3D方法對(duì)比,OFT在鳥(niǎo)瞰圖平均精確度、3D物體邊界識(shí)別上各項(xiàng)測(cè)試成績(jī)上均優(yōu)于對(duì)手。
尤其在探測(cè)遠(yuǎn)處物體時(shí)要遠(yuǎn)超Mono3D,遠(yuǎn)處可識(shí)別出的汽車(chē)數(shù)量更多。甚至在嚴(yán)重遮擋、截?cái)嗟那闆r下仍能正確識(shí)別出物體。在某些場(chǎng)景下甚至達(dá)到了3DOP系統(tǒng)的水平。
不僅在遠(yuǎn)距離上,正投影特征轉(zhuǎn)換(OFT-Net)在對(duì)不同距離物體進(jìn)行評(píng)估時(shí)都都優(yōu)于Mono3D。
但是與Mono3D相比,這套系統(tǒng)性能也明顯降低得更慢,作者認(rèn)為是由于系統(tǒng)考慮遠(yuǎn)離相機(jī)的物體造成的。
在正交鳥(niǎo)瞰圖空間中的推理顯著提高了性能。為了驗(yàn)證這一說(shuō)法,論文中還進(jìn)行了一項(xiàng)研究:逐步從自上而下的網(wǎng)絡(luò)中刪除圖層。
下圖顯示了兩種不同體系結(jié)構(gòu)的平均精度與參數(shù)總數(shù)的關(guān)系圖。
趨勢(shì)很明顯,在自上而下網(wǎng)絡(luò)中刪除圖層會(huì)顯著降低性能。
這種性能下降的一部分原因可能是,減少自上而下網(wǎng)絡(luò)的規(guī)模會(huì)降低網(wǎng)絡(luò)的整體深度,從而降低其代表性能力。
從圖中可以看出,采用具有大型自上而下網(wǎng)絡(luò)的淺前端(ResNet-18),可以實(shí)現(xiàn)比沒(méi)有任何自上而下層的更深層網(wǎng)絡(luò)(ResNet-34)更好的性能,盡管有兩種架構(gòu)具有大致相同數(shù)量的參數(shù)。(量子位)
資源
論文:
Orthographic Feature Transform for Monocular 3D Object Detection
https://arxiv.org/abs/1811.08188
作者表示等論文正式發(fā)表后,就放出預(yù)訓(xùn)練模型和完整的源代碼。
評(píng)論