作者:劉偉
2023年11月2日,工信部在官網(wǎng)公布《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見》,提出人形機(jī)器人集成人工智能、高端制造、新材料等先進(jìn)技術(shù),有望成為繼計算機(jī)、智能手機(jī)、新能源汽車后的顛覆性產(chǎn)品,將深刻變革人類生產(chǎn)生活方式,重塑全球產(chǎn)業(yè)發(fā)展格局。中國計劃,到2025年,人形機(jī)器人創(chuàng)新體系初步建立,“大腦、小腦、肢體”等一批關(guān)鍵技術(shù)取得突破,確保核心部組件安全有效供給。整機(jī)產(chǎn)品達(dá)到國際先進(jìn)水平,并實現(xiàn)批量生產(chǎn),在特種、制造、民生服務(wù)等場景得到示范應(yīng)用,探索形成有效的治理機(jī)制和手段。
一、人形機(jī)器人簡史
人形機(jī)器人是指外形和人類相似的機(jī)器人。它們可以通過模仿人類的外貌、動作和表情來與人類進(jìn)行交互和溝通。人形機(jī)器人通常具備視覺、聽覺、語音、觸覺等多種感知能力,并且能夠通過自主決策和學(xué)習(xí)來適應(yīng)不同的環(huán)境和任務(wù)。人形機(jī)器人的發(fā)展歷史可以追溯到古代,但真正的發(fā)展始于20世紀(jì)。
以下是人形機(jī)器人發(fā)展的一些重要里程碑: (1)1920年代:最早的人形機(jī)器人問世。1921年,捷克作家卡雷爾·恰佩克的戲劇《羅瑟姆的萬能機(jī)器人》中首次提到了“機(jī)器人”一詞,劇名中的“Robota”一詞被用來形容一種經(jīng)過生物零部件組裝而成的生化人——為人類服務(wù)的奴隸。這個詞后來演化成了 Robot,成為人造人、機(jī)器人的代名詞。該戲劇引發(fā)了人們對于機(jī)器人概念的關(guān)注。 (2)1950年代:人類工程學(xué)研究的興起。隨著工業(yè)技術(shù)的進(jìn)步,人們開始研究如何設(shè)計機(jī)器人來模仿人類的外貌和動作。這個時期的機(jī)器人主要用于工業(yè)生產(chǎn)線上的簡單任務(wù)。
(3)1960年代:日本機(jī)器人產(chǎn)業(yè)的崛起。日本成為人形機(jī)器人研發(fā)的領(lǐng)先國家之一。在這個時期,能夠模仿人類行走和舉起物體的機(jī)器人開始出現(xiàn)。
(4)1980年代:機(jī)器人技術(shù)的飛速發(fā)展。隨著計算機(jī)技術(shù)的進(jìn)步,機(jī)器人的智能程度得到了提高。這個時期出現(xiàn)了一些具備人工智能和語音識別功能的機(jī)器人。
(5)2000年代:專用機(jī)器人的發(fā)展。除了工業(yè)和科研領(lǐng)域之外,人形機(jī)器人也開始應(yīng)用于其他領(lǐng)域,如醫(yī)療、教育和娛樂等。這些機(jī)器人能夠和人類進(jìn)行更復(fù)雜的互動。
(6)2010年代以來:人形機(jī)器人成為研究的熱點。人形機(jī)器人在科研和技術(shù)領(lǐng)域的研究得到了廣泛關(guān)注。一些具備高度復(fù)雜動作控制和情感交流能力的人形機(jī)器人開始問世。 目前,人形機(jī)器人的發(fā)展正在不斷向前推進(jìn)。隨著人工智能和機(jī)器學(xué)習(xí)等領(lǐng)域的不斷進(jìn)步,人形機(jī)器人的智能程度和逼真程度將會不斷提高,為人類生活帶來更多的便利和創(chuàng)新。 在中國古代,并沒有像現(xiàn)代科技中的機(jī)器人概念。
然而,古代中國的工藝技術(shù)卓越,曾經(jīng)有些能夠以人形為模型的自動化機(jī)械器械,其中的例子有西周周穆王時的倡優(yōu)跳舞機(jī)器人、唐朝倒酒機(jī)器人等。雖然這些古代的機(jī)械器械不被稱為機(jī)器人,但它們展示了中國古代人們對于自動化機(jī)械的興趣和創(chuàng)造力。這些機(jī)械不僅僅是藝術(shù)品或娛樂工具,更是古代科技與文化的結(jié)晶。最近,國內(nèi)一些公司如小米、優(yōu)必選、達(dá)闥、傅里葉、追覓、智元都在積極布局人形機(jī)器人,均普、字節(jié)跳動也擬入局機(jī)器人,探索把AI大模型能力用到機(jī)器人上。
二、人形機(jī)器人的三大關(guān)鍵技術(shù)及挑戰(zhàn)
(1)伺服控制。人形機(jī)器人需要具備精準(zhǔn)的動作和姿態(tài)控制能力,以模擬人類的運動和動作。伺服控制技術(shù)可以實現(xiàn)對人形機(jī)器人的關(guān)節(jié)和身體部位的精細(xì)控制,使其能夠進(jìn)行各種復(fù)雜的動作,如行走、跑步、跳躍等。
(2)人工智能。人形機(jī)器人需要具備人工智能的能力,以能夠感知和理解周圍環(huán)境,并做出相應(yīng)的反應(yīng)和決策。通過使用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù),人形機(jī)器人可以學(xué)習(xí)和適應(yīng)不同的環(huán)境和任務(wù),從而實現(xiàn)更加智能化的行為。
(3)運動控制。人形機(jī)器人的運動控制技術(shù)是實現(xiàn)其復(fù)雜動作和靈活移動的關(guān)鍵。運動控制技術(shù)可以確保人形機(jī)器人的穩(wěn)定性和平衡性,使其能夠在不同的地形和環(huán)境中保持平衡,并進(jìn)行各種動作和運動,如躲避障礙、攀爬等。為了實現(xiàn)高效的運動控制,通常采用傳感器和算法來監(jiān)測和調(diào)整機(jī)器人的運動狀態(tài)。 上面這三大問題,進(jìn)一步可分解為人形機(jī)器人研究和開發(fā)面臨的6個主要挑戰(zhàn):
(1)動力和能源管理。人形機(jī)器人通常需要大量的能量來驅(qū)動各種電動關(guān)節(jié)和傳感器,因此如何實現(xiàn)高效的能源管理是一個重要挑戰(zhàn)。
(2)機(jī)械設(shè)計和運動控制。人形機(jī)器人需要具備復(fù)雜的機(jī)械結(jié)構(gòu)和精確的運動控制能力,以模仿人類的運動和動作。解決這些問題需要解決動力學(xué)、運動學(xué)和控制理論等復(fù)雜問題。
(3)感知與感知處理。人形機(jī)器人需要能夠感知周圍環(huán)境和自身狀態(tài),例如使用視覺傳感器、觸覺傳感器和聲音傳感器。同時,還需要處理這些感知數(shù)據(jù)來做出適當(dāng)?shù)臎Q策和行為。
(4)智能決策與規(guī)劃。人形機(jī)器人需要具備智能的決策和規(guī)劃能力,能夠在不同的環(huán)境中做出正確的選擇和行為。這涉及到機(jī)器學(xué)習(xí)、人工智能和運動規(guī)劃等領(lǐng)域的研究。
(5)人機(jī)交互與安全性。人形機(jī)器人通常是為了與人類進(jìn)行交互和合作而設(shè)計的,因此需要能夠理解人類的語言和行為,并能夠與人類進(jìn)行安全的互動。確保人形機(jī)器人的安全性和用戶體驗是一個重要挑戰(zhàn)。
(6)成本和可用性。人形機(jī)器人的研究和開發(fā)成本通常較高,并且目前尚未有普及的消費市場。解決這些挑戰(zhàn)需要降低成本、提高可用性,并推動人形機(jī)器人技術(shù)的應(yīng)用和商業(yè)化。
三、人形機(jī)器人感知、理解、決策的瓶頸
人形機(jī)器人感知、理解、決策的瓶頸主要包括感知能力、語言理解、決策能力和社交交互能力等方面的限制,為此,人形機(jī)器人需要建立準(zhǔn)確的環(huán)境模型,并能夠?qū)鼍斑M(jìn)行分析和理解。這需要借助于機(jī)器學(xué)習(xí)和推理技術(shù),讓機(jī)器人能夠根據(jù)歷史數(shù)據(jù)和先驗知識,對當(dāng)前的環(huán)境狀態(tài)和可能的動態(tài)變化進(jìn)行預(yù)測和推測。人形機(jī)器人感知、理解、決策的瓶頸具體表現(xiàn)為:
(1)感知能力有限。人形機(jī)器人需要能夠感知周圍環(huán)境的各種信息,包括視覺、聽覺、觸覺等。然而,目前機(jī)器人的感知能力還遠(yuǎn)遠(yuǎn)不及人類,無法像人類一樣從復(fù)雜的場景中獲取準(zhǔn)確的感知信息。
(2)理解語言和上下文。人形機(jī)器人需要能夠理解人類的語言和上下文信息,并從中抽取出關(guān)鍵信息。然而,自然語言理解在處理復(fù)雜的語義和語用信息時仍存在困難,機(jī)器人往往不能準(zhǔn)確地理解人類的意圖和需求。
(3)決策能力不足。人形機(jī)器人需要能夠根據(jù)感知和理解的信息做出合理的決策。然而,在面對復(fù)雜、不確定的環(huán)境時,機(jī)器人往往難以做出準(zhǔn)確且適應(yīng)性強(qiáng)的決策。這涉及到機(jī)器人的推理和規(guī)劃能力的提升。
(4)社交交互能力有限。人形機(jī)器人需要具備良好的社交交互能力,能夠理解人類的情感和意圖,并以適當(dāng)?shù)姆绞脚c人類進(jìn)行交流。目前機(jī)器人在這方面的能力仍然有限,無法像人類一樣進(jìn)行情感交流和社交互動。綜上所述,提高人形機(jī)器人的態(tài)勢感知能力需要結(jié)合傳感器技術(shù)、機(jī)器視覺算法、數(shù)據(jù)融合和處理、環(huán)境建模和場景分析以及實時決策和規(guī)劃等多種關(guān)鍵技術(shù),這些技術(shù)的不斷發(fā)展和創(chuàng)新將為人形機(jī)器人的態(tài)勢感知能力提供更大的提升空間。
四、人形機(jī)器人的自主與協(xié)同
人形機(jī)器人的自主與群體協(xié)同競爭是指機(jī)器人可以在獨立執(zhí)行任務(wù)的同時,在團(tuán)隊中與其他機(jī)器人進(jìn)行協(xié)同配合,以實現(xiàn)更高效的工作。 首先,人形機(jī)器人的自主競爭能力是指機(jī)器人具有獨立決策和執(zhí)行任務(wù)的能力。機(jī)器人可以根據(jù)感知到的環(huán)境信息和任務(wù)目標(biāo),自主選擇行動策略,并實時調(diào)整策略以適應(yīng)不同的情況。例如,在一個工廠生產(chǎn)線上,人形機(jī)器人可以根據(jù)傳感器獲取的數(shù)據(jù)進(jìn)行分析和判斷,自動完成裝配、搬運和包裝等工作,而無需人工干預(yù)。這樣可以提高工作效率,降低勞動力成本。 其次,人形機(jī)器人的群體協(xié)同競爭能力是指多個機(jī)器人在一起工作時,能夠相互合作和協(xié)調(diào),實現(xiàn)更復(fù)雜的任務(wù)。機(jī)器人之間可以通過無線通信、傳感器共享等方式進(jìn)行信息交流和協(xié)作。例如,在一個物流中心,多個人形機(jī)器人可以根據(jù)指令分工合作,實現(xiàn)快速搬運和倉儲管理。
機(jī)器人之間可以根據(jù)彼此的位置和負(fù)荷情況進(jìn)行任務(wù)分配,避免沖突和重復(fù)工作,提升整體工作效率。 在自主與群體協(xié)同競爭中,人形機(jī)器人需要具備先進(jìn)的感知、決策和執(zhí)行能力。感知能力可以通過視覺、聽覺、觸覺等傳感器實現(xiàn),以感知環(huán)境中的障礙物、目標(biāo)物體和其他機(jī)器人。決策能力可以通過機(jī)器學(xué)習(xí)和人工智能算法實現(xiàn),以分析感知數(shù)據(jù),并生成相應(yīng)的行動策略。執(zhí)行能力可以通過運動控制和力觸反饋等技術(shù)實現(xiàn),以實現(xiàn)準(zhǔn)確和靈活的行動。 人形機(jī)器人的自主與群體協(xié)同競爭將會在工業(yè)生產(chǎn)、物流配送等領(lǐng)域發(fā)揮重要作用。
通過提高機(jī)器人的自主決策能力和協(xié)同合作能力,可以提高工作效率,降低人力成本,推動社會產(chǎn)業(yè)的發(fā)展。人形機(jī)器人的自主程度可以分為以下幾個級別: 第一級零自主,機(jī)器人完全依賴于外部控制,無法獨立決策和執(zhí)行任務(wù)。它們僅根據(jù)預(yù)先編程的指令進(jìn)行動作,無法適應(yīng)環(huán)境變化或處理復(fù)雜任務(wù)。 第二級有限的自主,機(jī)器人能夠通過傳感器獲取環(huán)境信息,并根據(jù)預(yù)先設(shè)定的規(guī)則和算法做出相應(yīng)的決策。它們可以執(zhí)行一些簡單的任務(wù),但對于復(fù)雜的情況仍然需要人類的監(jiān)督和指導(dǎo)。 第三級部分的自主,機(jī)器人能夠感知環(huán)境,分析和理解復(fù)雜的信息,并基于自己的判斷做出決策。
它們可以在一定范圍內(nèi)獨立執(zhí)行任務(wù),并具有一定的適應(yīng)性和學(xué)習(xí)能力。然而,它們?nèi)匀恍枰祟惖闹笇?dǎo)和干預(yù)來解決更復(fù)雜的問題。 第四級高度的自主,機(jī)器人具有高級的感知和認(rèn)知能力,能夠全面理解環(huán)境和任務(wù)要求,能夠根據(jù)不同情況靈活地決策和行動。它們可以在不同環(huán)境中自主執(zhí)行各種任務(wù),并能夠適應(yīng)變化和學(xué)習(xí)新的知識和技能。它們可以獨立解決復(fù)雜的問題,而不需要人類的直接干預(yù)。 需要說明的是,目前人形機(jī)器人的技術(shù)仍然在發(fā)展中,大多數(shù)機(jī)器人仍處于有限自主或部分自主的階段。高度自主的人形機(jī)器人仍然是一個挑戰(zhàn)性的目標(biāo),需要更多的研究和技術(shù)突破才能實現(xiàn)。
五、人形機(jī)器人的測試與評價
總體來說,評價人形機(jī)器人需要綜合考量其交互能力、動作控制能力、感知能力、決策能力以及用戶體驗等方面的表現(xiàn)。同時,可以借鑒人形機(jī)器人的應(yīng)用場景,對不同的任務(wù)和環(huán)境進(jìn)行定制化評價。具體而言,人形機(jī)器人的測試與評價可以從以下幾個方面來考量:
(1)人機(jī)交互能力
人形機(jī)器人是否能夠與人類進(jìn)行自然、流暢的交流,包括語音識別、語義理解、語音合成等能力。測試可以通過與機(jī)器人進(jìn)行對話、提問、指令等方式進(jìn)行。
(2)動作控制能力
人形機(jī)器人是否能夠準(zhǔn)確地完成各種動作與姿勢,如走路、跑步、跳躍、抓取物品、握手等。測試可以通過觀察機(jī)器人的動作執(zhí)行情況來評價。
(3)感知能力
人形機(jī)器人是否能夠準(zhǔn)確感知周圍環(huán)境的人和物體,包括識別人臉、物體、聲音等。測試可以通過模擬各種場景來評估機(jī)器人的感知能力。
(4)智能決策能力
人形機(jī)器人是否能夠根據(jù)周圍環(huán)境和任務(wù)需求做出智能決策,包括路徑規(guī)劃、任務(wù)分配、問題解決等。測試可以通過給機(jī)器人不同的任務(wù)或情境來考察其決策能力。
(5)用戶體驗評價
人形機(jī)器人的外觀、聲音、交互方式是否符合用戶需求,是否能夠給人帶來愉悅和舒適的體驗??梢酝ㄟ^用戶調(diào)查、反饋等方式進(jìn)行評價。 總而言之,人形機(jī)器人可以被視為一個典型的人機(jī)環(huán)境生態(tài)系統(tǒng),包括人形機(jī)器人、人類用戶和周圍的環(huán)境。人形機(jī)器人作為機(jī)器人智能化技術(shù)的體現(xiàn),通過傳感器、處理器和執(zhí)行器等技術(shù)來感知、處理和響應(yīng)環(huán)境的變化。它可以與人類用戶進(jìn)行交互,通過語音識別、圖像識別、姿勢識別等技術(shù)進(jìn)行溝通和理解人類的意圖。人形機(jī)器人還可以與環(huán)境互動,通過移動、抓取和操作等方式來完成任務(wù)。
人形機(jī)器人和人類用戶的交互是人機(jī)環(huán)境生態(tài)系統(tǒng)的重要組成部分。通過與人形機(jī)器人的交互,人類用戶可以向其傳達(dá)指令、提供信息,并從中獲取服務(wù)和反饋。人形機(jī)器人可以根據(jù)人類用戶的需求和意圖來做出相應(yīng)的行為,提供相關(guān)的服務(wù)和支持。周圍的環(huán)境也影響著人形機(jī)器人的行為和性能。環(huán)境中的物體、場景和其他人類用戶的存在都會對人形機(jī)器人的感知和決策產(chǎn)生影響。同時,人形機(jī)器人也可以通過與環(huán)境互動來獲取信息和執(zhí)行任務(wù)。因此,人形機(jī)器人可以被視為一個典型的人機(jī)環(huán)境生態(tài)系統(tǒng),其中機(jī)器人、人類用戶和環(huán)境之間相互作用,共同構(gòu)成一個復(fù)雜且動態(tài)的生態(tài)系統(tǒng)。
審核編輯:黃飛
?
評論