人工智慧開啟了新一代機器人技術(shù) Robotics 2.0,最大改變是從原先人工編寫程式而來的自動化,邁向了真正的自主學(xué)習(xí)。本文將嘗試揭開人工智慧(AI)應(yīng)用的神秘面紗,協(xié)助讀者瞭解 AI 機器人將如何影響我們的未來,并釐清我們常常聽到,但卻著墨不多、甚至根本尚未全然理解的主題。
本文為「Robotics 2.0」系列文章的第一篇,講述機器人技術(shù)與 AI 對于各大產(chǎn)業(yè)和未來工作的影響。我們將討論 AI 將如何釋放機器人技術(shù)的潛力,這項新技術(shù)的挑戰(zhàn)和機會,以及這一切將如何影響我們的生產(chǎn)力、就業(yè)狀況、甚至日常生活。在人工智慧被大肆宣傳的當下,我們希望透過這些文章鼓勵更有建設(shè)性和全面性的探討。
重新定義機器人:揭開次世代 AI 機器人 Robotics 2.0 的神秘面紗
提到機器人,我們總有各式各樣天馬行空的想像:從 Softbank(軟銀集團)的社交機器人 Pepper、能輕松后空翻的 Boston Dynamics 公司機器人 Atlas、《魔鬼終結(jié)者》(Terminator)系列電影的人造人殺手,到電視影集《西方極樂園》(West World)中隨處可見、栩栩如生的擬真機器人角色。
我們常常聽到兩極化的觀點;有些人傾向高估機器人模仿人類的能力,認為機器終將取代人類,有些人則對新研究和技術(shù)的潛力太過悲觀。
在過去一年之中,許多創(chuàng)業(yè)、科技、新創(chuàng)業(yè)界的朋友都曾問過我,在 AI,尤其是深度強化學(xué)習(xí)和機器人技術(shù)的領(lǐng)域,究竟有哪些「實際」進展?
令人最為好奇的是:
AI 機器人和傳統(tǒng)機器人有什么不一樣?AI 機器人是否真有顛覆各大產(chǎn)業(yè)的潛力?它的能力和限制又是什么?
看來,想要瞭解現(xiàn)在的技術(shù)進步和產(chǎn)業(yè)格局,是出乎意料的困難,更不用說要對未來做出預(yù)測。藉由這篇文章,我嘗試揭開人工智慧應(yīng)用于機器的神秘面紗,釐清這個我們常常聽到,但卻著墨不多、或根本未全然理解的主題。
首先必須回答的基本問題:什么是 AI 機器人(AI-enabled Robotics)?它們又有什么獨特之處?
機器人演進:從自動化到自主化
「機器學(xué)習(xí)解決了以往『對電腦困難,對人來說卻容易』的各種問題,或以更容易理解的方式來說,就是解決了『人類很難讓電腦也理解』的問題?!?/p>
— — Benedict Evans,安霍創(chuàng)投(a16z)
AI 所造就的機器人技術(shù)領(lǐng)域,最大成果是從原先的「自動化」(工程師藉由程式設(shè)計編寫規(guī)則,讓機器人遵守)邁向了真正的「自主學(xué)習(xí)」。
如果機器人只需要處理一件事情,那么,它到底有沒有人工智慧,差別其實看不出來;但是,如果機器人需要處理各式各樣的任務(wù)、或是回應(yīng)人類與環(huán)境的變化,就需要一定程度的自主性才能勝任。
我們不妨借用下列不同等級的自駕車定義,一併解釋機器人的演變:
Level 0 — 無自動化:由人類操作機器,沒有機器人的參與。(機器人的普遍定義,是指有能力自行從事復(fù)雜動作的可程式化擬人機械)。
Level 1 — 單一自動化運作:單一功能已自動化,但不使用環(huán)境資訊。這是自動化與制造業(yè)中傳統(tǒng)的機器人使用現(xiàn)況。透過程式編輯,機器人能夠以高精度與速度重復(fù)執(zhí)行特定工作;但直至目前為止,多數(shù)實際運用的機器人都無法感知或應(yīng)變環(huán)境的變化。
Level 2 — 部分自動化:透過環(huán)境感知所輸入的特定功能,協(xié)助機器進行決策。例如某些機器人透過視覺感應(yīng)器,識別并應(yīng)付不同的對象:然而,傳統(tǒng)的電腦視覺,需要對每個對象進行預(yù)先登記和清楚的指示,且機器人還是缺乏處理變更、意外狀況、或是新對象的能力。
Level 3 — 條件式自主:機器控制了所有的環(huán)境監(jiān)控行為,但仍需要人為檢查關(guān)注與(即時)介入。
Level 4 — 高度自主:在某些情況下、或是定義的區(qū)域內(nèi)完全自主。
Level 5 — 完全自主:在任何狀況下均可完全自主,不需人為介入。
我們現(xiàn)在處于哪一種自主等級呢?
現(xiàn)在,工廠里多數(shù)機器人都是透過開放式迴路、或是非回饋方式予以控制。這意味著它們的運作與感測器回饋各自獨立、彼此互不影響(level 1)。
少數(shù)在工廠中的機器人,會根據(jù)感測器回饋而調(diào)整操作(level 2);此外還有協(xié)作型機器人(cobot),他們的操做更加簡單安全,因此能與人類共同作業(yè)。然而,相較于產(chǎn)業(yè)用機器人,這種機器人的精確度和速度卻相形失色。另外,雖然協(xié)作型機器人的程式化相對簡單,但它們?nèi)匀徊痪哂凶灾鲗W(xué)習(xí)性;每當工作內(nèi)容或環(huán)境有所變動時,就需要由人類手動引導(dǎo)協(xié)作機器人進行調(diào)整,或是重新編寫程式,機器本身無法自主舉一反三,彈性應(yīng)變。
深度學(xué)習(xí)(Deep Learning)和強化學(xué)習(xí)(Reinforcement Learning)能幫助機器人自主處理各種物件,將人類的介入程度降到最低。
我們已經(jīng)開始看到一些使用 AI 機器人(level 3/4)的前導(dǎo)試行專案,例如「倉儲揀貨」就是一個很好的例子。在貨運倉庫中,員工需要根據(jù)客戶需求,將數(shù)百萬種不同的產(chǎn)品放入箱子里。傳統(tǒng)的電腦視覺沒辦法處理如此廣泛的物品類別,因為每個物品都需要事先登錄、并針對機器人需要採取的動作,先進行程式設(shè)計。
然而,現(xiàn)在由于深度學(xué)習(xí)和強化學(xué)習(xí)技術(shù),機器人能夠開始自主學(xué)習(xí)處理各種物件,降低人類的介入程度。在機器人的學(xué)習(xí)過程中,可能會出現(xiàn)它未曾遇過的某些貨品,而需要人類的協(xié)助或示范(level 3)。但是,隨著機器人搜集更多的資料、從試驗和錯誤中學(xué)習(xí)(level 4),演算法也將日益改善,邁向完全自主。
就像自駕汽車產(chǎn)業(yè)一樣,機器人新創(chuàng)公司也採取了不同的策略:有些公司看好人類和機器人之間的合作,專注于 level 3 的研發(fā);有些公司則相信,機器終將實現(xiàn)真正的完全自主,于是他們跳過 level 3,直接著眼于 level 4、甚至到 level 5。
這也是為什么我們很難評估現(xiàn)在產(chǎn)業(yè)自主程度的原因之一。
新創(chuàng)公司有可能自稱致力于研究 level 3/4 的自主系統(tǒng),但實際上卻是大量委外,以人工遠端操控機器。在無法了解其內(nèi)部軟體及 AI 產(chǎn)品發(fā)展程度的前提下,光從機器外觀看不出遠端操控和自主學(xué)習(xí)的差別。另一方面,目標為 level 4/5 的新創(chuàng)公司,萬一無法在短時間取得理想結(jié)果,可能反而降低了客戶的早期採用意愿、并導(dǎo)致早期階段的資料搜集更加困難。
在本文的后半部分,我將進一步討論新創(chuàng)公司的不同的商業(yè)策略思考。
AI 機器人的崛起:運用范圍不再侷限于倉儲管理
有趣的是,機器人的人工智慧應(yīng)用潛能甚至高于無人車,因為機器人有各式各樣的應(yīng)用與產(chǎn)業(yè),因此從某種意義上說,機器人理當比汽車更容易實現(xiàn) level 4 目標。
AI 機器手臂開始在倉庫中被採用,就是最好的例子。因為倉庫屬于「半受控」的環(huán)境,不確定性相對低。另外,揀貨作業(yè)雖然關(guān)鍵、但能容許錯誤。
至于自主居家型或手術(shù)機器人,則要等到更遙遠的未來才能實現(xiàn);畢竟相關(guān)環(huán)境的變數(shù)更多,且有些任務(wù)具備不可逆性,以及一定程度的危險性。但是,可以預(yù)見的是,隨著技術(shù)精度、準確性、可靠性的與時俱進,我們將看到更多產(chǎn)業(yè)採用 AI 機器人。
許多產(chǎn)業(yè)還沒有使用機械手臂,主要原因在于傳統(tǒng)機器人和電腦視覺的限制。
目前世界上只有大約 300 萬臺機器手臂,其中大多數(shù)從事搬運、焊接、裝配等任務(wù)。到目前為止,除了汽車業(yè)和電子業(yè)以外,倉儲、農(nóng)業(yè)和其他產(chǎn)業(yè),幾乎都還沒有開始使用機械手臂;主要原因,就在于上述傳統(tǒng)機器人和電腦視覺的限制。
在接下來的幾十年中,隨著深度學(xué)習(xí)(DL)、強化學(xué)習(xí)(RL)、以及云端技術(shù)釋放出的機器人潛力,我們將看到新一代機器人帶來的爆炸式增長、并改變產(chǎn)業(yè)格局。其中,AI 機器人的成長契機有哪些?新創(chuàng)公司和現(xiàn)有業(yè)者,又採取了哪些不同的方法和商業(yè)模式,來因應(yīng)新科技帶來的變化?
新世代 AI 機器人新創(chuàng)公司產(chǎn)業(yè)概況
接下來,我會介紹不同市場區(qū)隔中的幾間范例公司。這樣的概略介紹,當然無法涵蓋所有企業(yè)的狀況;歡迎你提供其他公司及應(yīng)用案例,一起讓內(nèi)容更加完備。
AI/Robotics 新創(chuàng)公司市場概況
研究新世代機器人新創(chuàng)產(chǎn)業(yè)結(jié)構(gòu),可以看到兩種截然不同的商業(yè)模式:垂直應(yīng)用與水平應(yīng)用。
1. 垂直應(yīng)用
第一種是垂直應(yīng)用:硅谷當?shù)囟鄶?shù)的新創(chuàng)公司,專注于為特定的垂直市場開發(fā)解決方案;如電子商務(wù)物流、制造業(yè)、農(nóng)業(yè)等等。
這種提供完整解決方案的作法相當合理,畢竟相關(guān)技術(shù)還處于萌芽階段;公司不依賴他人提供關(guān)鍵模組或元件,而是建構(gòu)端對端的解決方案。這種垂直整合的解決方案能更快進入市場,也能確保公司更全面掌握終端使用者的案例與效能表現(xiàn)。
但是,要找到像「倉庫分揀」這樣相對容易實現(xiàn)的應(yīng)用案例,則沒有那么容易。倉庫揀貨是相對簡單的工作,客戶的投資意愿與技術(shù)可行性都較高,而且每個倉庫幾乎都有相同的揀貨需求。
但在其他產(chǎn)業(yè)(如制造業(yè))中,裝配任務(wù)可能因工廠而各不相同;另外,在制造業(yè)中執(zhí)行的任務(wù),也需要更高的精度和速度,技術(shù)上相對困難。
目前具有學(xué)習(xí)能力的機器人,仍無法達到與封閉迴路機器人相同的精度。
盡管機器學(xué)習(xí)能讓機器人與時俱進,但目前透過機器學(xué)習(xí)運作的機器人,仍無法達到與封閉迴路機器人相同的精度,因為它需要累積嘗試錯誤的經(jīng)驗,從錯誤中學(xué)習(xí),逐漸進步。
這點說明了為什么 Mujin 和 CapSen 機器人這樣的新創(chuàng)公司,并未採用深度強化學(xué)習(xí),反而選擇使用傳統(tǒng)電腦視覺。
然而,傳統(tǒng)電腦視覺要求每個物件都要事先登錄,終究還是缺乏擴充和適應(yīng)變化的能力。一旦深度強化學(xué)習(xí)(DRL)達到了效能門檻、逐步成為產(chǎn)業(yè)主流,這種傳統(tǒng)方法終究會變得無用武之地。
此外,這些新創(chuàng)公司的另一個問題,在于它們的價值往往遭到高估。我們經(jīng)常看到,新創(chuàng)公司在硅谷籌集了數(shù)千萬美元資金,卻無法承諾創(chuàng)造出任何真正具體的收入流。
對于創(chuàng)業(yè)者來說,「描繪」深度強化學(xué)習(xí)的美好未來,再容易也不過了;但現(xiàn)實則是,我們還需要數(shù)年的時間才能達到如此的成果。盡管這些公司離創(chuàng)造獲利還有一段距離,硅谷的創(chuàng)投仍愿意繼續(xù)押寶在這些人才優(yōu)秀、技術(shù)先進的團隊上。
2. 水平應(yīng)用
另一方面,水平應(yīng)用則是更實用、卻比較罕見的模式。我們可以簡單將機器人技術(shù)簡化為感測(輸入)、處理、驅(qū)動(輸出)三個部分;除此之外,還有開發(fā)工具。(這里使用的「處理」一詞,同時概略涵蓋了控制器、機器學(xué)習(xí)、作業(yè)系統(tǒng)和機器人模組等等,各種不屬于感測或驅(qū)動的其他項目。)
我認為未來,這個領(lǐng)域?qū)⒆罹咴鲩L潛力。對于機器人的用戶來說,破碎而零細的市場是棘手的問題;因為所有的機器人制造商,都各自推展自家開發(fā)的語言和介面,使得系統(tǒng)整合商與終端使用者,都很難將機器人與相關(guān)系統(tǒng)進行整合。
隨著產(chǎn)業(yè)的逐漸成熟,有越來越多機器人應(yīng)用到了汽車和電子廠以外的領(lǐng)域;因此我們更加需要標準的作業(yè)系統(tǒng)、通訊協(xié)定、介面,從而提高效率、并縮短上市時間。
舉例來說,美國波士頓的幾家新創(chuàng)公司正在研究相關(guān)的模組;例如 Veo Robotics 公司開發(fā)的安全模組,能讓工業(yè)機器人更安全地和人類協(xié)同工作;Realtime Robotics 公司則提供加速了機械手臂路徑的解決方案。
評論