版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
人形機(jī)器人行業(yè)分析1.歷史:工業(yè)類(lèi)人形機(jī)器人嶄露鋒芒1.1.人形機(jī)器人發(fā)展的三階段人形機(jī)器人的“萌芽階段”(1960-1990)。這一階段的人形機(jī)器人特征為初具“人形態(tài)”,研發(fā)重點(diǎn)著重在機(jī)器人的“下肢運(yùn)動(dòng)”。1968年,美國(guó)的通用電氣公司(R.Smosher)試制了一臺(tái)名為“Rig”的操縱型雙足步行機(jī)器人機(jī)械,同年,日本早稻田大學(xué)加藤一郎教授在日本首先展開(kāi)了雙足機(jī)器人的研制工作,并先后推出了WAP-1、WAP-3、WL-5等持續(xù)迭代的雙足機(jī)器人版本,自此人形機(jī)器人產(chǎn)業(yè)步入萌芽階段。此外,除了日本在人形機(jī)器人研制上做出較大貢獻(xiàn)外,包括英國(guó)、蘇聯(lián)等國(guó)家也紛紛加入機(jī)器人的研制上,例如,英國(guó)于1970年研制成功的“Witt”型雙足機(jī)器人,蘇聯(lián)則研制出兩輪雙足行走機(jī)器人。而我國(guó)在人形機(jī)器人的研發(fā)起步相對(duì)較慢,自1985年始,國(guó)內(nèi)幾所科研院校才陸續(xù)開(kāi)始人形機(jī)器人的研發(fā)工作,而直到2000年,中國(guó)國(guó)防科技大學(xué)經(jīng)過(guò)多年的努力成果才研制出我國(guó)第一臺(tái)仿人型機(jī)器人“先行者”,哈爾濱工業(yè)大學(xué)也自1985年研發(fā)雙足步行機(jī)器人以來(lái),先后推出HJT-I、HJT-II、HJT-III等型號(hào)的機(jī)器人。人形機(jī)器人的“發(fā)展階段”(1990-2010)。這一階段的人形機(jī)器人特征為附加更多功能,研發(fā)重點(diǎn)從之前的“如何實(shí)現(xiàn)更好行走”到“賦予機(jī)器人更多其他的‘仿人特征’”。自1986年開(kāi)始,日本豐田公司推出了P系列1-3型機(jī)器人,在1997年推出了“P3”和2000年推出了“ASIMO”,“ASIMO”除了優(yōu)化步行方式外,還增加了對(duì)手部的操作和控制。同年,日本索尼于2000年推出人形娛樂(lè)機(jī)器人SDR-3X,該機(jī)器人較以往產(chǎn)品最大的區(qū)別在于配備了聲音識(shí)別和圖像識(shí)別功能,可以根據(jù)音樂(lè)實(shí)現(xiàn)節(jié)奏運(yùn)動(dòng)。豐田和索尼公司推出的新一代人形機(jī)器人,將仿人機(jī)器人的研制和生產(chǎn)正式推向?qū)嵱没?、工程化和市?chǎng)化。人形機(jī)器人的“百花齊放階段”(2010至今)。這一階段的人形機(jī)器人特征為“智能化”,研發(fā)重點(diǎn)從之前的“賦予機(jī)器人更多其他的‘仿人特征’”到“機(jī)器人如何衍生自主決策能力”。海外方面,波士頓動(dòng)力、特斯拉、EngineeredArts、軟銀等海外科技企業(yè)紛紛發(fā)布自主研發(fā)的人形機(jī)器人,比如2015年軟銀率先實(shí)現(xiàn)人形機(jī)器人的商業(yè)化進(jìn)程、2021年波士頓動(dòng)力展示運(yùn)動(dòng)能力出色的Atlas、2022年特斯拉發(fā)布Optimus原型機(jī)等。國(guó)內(nèi)方面,小米、優(yōu)必選、傅利葉智能等廠商也積極入局。該階段的人形機(jī)器人除了運(yùn)動(dòng)模塊和感知模塊更為成熟外,最突出的特點(diǎn)就是大模型的應(yīng)用,機(jī)器人的訓(xùn)練速度和效率大大提高、強(qiáng)化機(jī)器人的自主決策能力。1.2.以工業(yè)類(lèi)為代表的產(chǎn)品持續(xù)迭代人形機(jī)器人發(fā)展至今,涌現(xiàn)出適用于各種應(yīng)用場(chǎng)景的產(chǎn)品,按照目前主流的場(chǎng)景應(yīng)用分類(lèi),可大致分為工業(yè)類(lèi)、娛樂(lè)&服務(wù)類(lèi)等兩大類(lèi),對(duì)應(yīng)用在工業(yè)場(chǎng)景、家庭&商業(yè)場(chǎng)景。工業(yè)類(lèi)人形機(jī)器人主要用于處理物流、制造、安保和復(fù)雜任務(wù)等領(lǐng)域的工業(yè)場(chǎng)景,替代的是低級(jí)和高危人工勞動(dòng)、以及部分傳統(tǒng)工業(yè)機(jī)器人無(wú)法勝任的工種,比如流水線的后道工序。娛樂(lè)類(lèi)主要實(shí)現(xiàn)情感交互和表演展覽等場(chǎng)景,而服務(wù)類(lèi)則主要是從事家庭服務(wù)、教育、引導(dǎo)、送餐等場(chǎng)景。1.2.1.工業(yè)類(lèi)的代表之作由于工業(yè)場(chǎng)景相較于家庭、商用場(chǎng)景而言,環(huán)境的可預(yù)測(cè)、可控性更強(qiáng)以及機(jī)器人自身造成危害的影響性更低,對(duì)處于發(fā)展初期的人形機(jī)器人而言,工業(yè)場(chǎng)景的容錯(cuò)率相對(duì)更高,因此比較適合廠商作為人形機(jī)器人投放的第一站??v觀近幾年的機(jī)器人新品,工業(yè)類(lèi)產(chǎn)品進(jìn)展也相對(duì)較快,比如波士頓動(dòng)力的Atlas、特斯拉的Optimus、AgilityRobotics的Digit等。波士頓動(dòng)力:成立于1992年,公司先后借助美國(guó)軍方、谷歌、軟銀、現(xiàn)代集團(tuán)等股東的支持,陸續(xù)發(fā)布了BigDog、LittleDog、Cheetah、Spot等四足機(jī)器狗和Atlas等雙足機(jī)器人。于2022年和母公司現(xiàn)代汽車(chē)共同成立了BDAII(波士頓動(dòng)力人工智能研究所),目標(biāo)是“引領(lǐng)人工智能和機(jī)器人技術(shù)的進(jìn)步”,目前在圍繞Spot和Stretch這類(lèi)機(jī)器人的商業(yè)道路和獨(dú)立的完全專注于Atlas的技術(shù)研究道路兩條路線上齊頭并進(jìn)。Atlas:高約1.5米,重80公斤,擁有28個(gè)自由度,主動(dòng)力來(lái)源為電池,驅(qū)動(dòng)方式為液壓,配備RGB與深度相機(jī),機(jī)器人本體共搭載3臺(tái)NUC/工控機(jī)負(fù)責(zé)整體控制系統(tǒng)的運(yùn)算。Atlas最突出的亮點(diǎn)是能實(shí)現(xiàn)像人一樣奔跑、跳躍和跨越障礙,而實(shí)現(xiàn)這種跑酷動(dòng)作的核心源于其獨(dú)特的感知、規(guī)劃、驅(qū)動(dòng)以及驅(qū)動(dòng)背后的制造技術(shù)。感知能力:基于配備的RGB攝像頭和TOF深度傳感器,Atlas能快速生成環(huán)境的點(diǎn)云,再使用一種名為多平面分割的算法從點(diǎn)云中提取平面,機(jī)器人中的映射系統(tǒng)將算法獲取的信息構(gòu)建模型,從而輔助后續(xù)的行為規(guī)劃。規(guī)劃能力:一方面,設(shè)計(jì)人員通過(guò)離線優(yōu)化,為Atlas不斷創(chuàng)建新的運(yùn)動(dòng)軌跡,而在這些給定的軌跡設(shè)計(jì)下,Atlas會(huì)在實(shí)際行動(dòng)中盡量選擇與之匹配的行為動(dòng)作,從而減少相關(guān)的計(jì)算量,提升運(yùn)動(dòng)準(zhǔn)確性。另一方面,在實(shí)際的運(yùn)動(dòng)過(guò)程中,Atlas會(huì)使用MPC(模型預(yù)測(cè)控制器,該控制器使用機(jī)器人動(dòng)力學(xué)模型來(lái)預(yù)測(cè)機(jī)器人未來(lái)的動(dòng)作并計(jì)算出當(dāng)前要做的最優(yōu)動(dòng)作)來(lái)調(diào)整實(shí)時(shí)的力、姿勢(shì)和行為時(shí)間等細(xì)節(jié),以完成“沒(méi)有見(jiàn)過(guò)的動(dòng)作”。進(jìn)一步而言,MPC的預(yù)測(cè)特性還允許Atlas跨越行為邊界來(lái)查看后續(xù)動(dòng)作,使得機(jī)器人能實(shí)現(xiàn)從一個(gè)動(dòng)作到另一個(gè)動(dòng)作的平滑過(guò)渡。運(yùn)動(dòng)能力:在完成感知和動(dòng)作規(guī)劃后,機(jī)器人要“跑起來(lái)”,而液壓系統(tǒng)為Atlas產(chǎn)生了強(qiáng)大的推力,在同樣的空間內(nèi),用液壓元件所做的功是電機(jī)的數(shù)倍甚至是數(shù)十倍,因此液壓系統(tǒng)能幫助機(jī)器人實(shí)現(xiàn)奔跑、跳躍、后空翻等高難度的動(dòng)作。制造技術(shù):感知、規(guī)劃、運(yùn)動(dòng)是Atlas跑酷的核心程序,而這些動(dòng)作實(shí)現(xiàn)的背后離不開(kāi)“如何將重達(dá)80kg的物體推上天”的制造技術(shù)。波士頓動(dòng)力將3D打印應(yīng)用于制造Atlas機(jī)器人的液壓動(dòng)力單元(HPU),用于生產(chǎn)穩(wěn)態(tài)控制器、傳感器、過(guò)濾器、排污閥等部件,好處是可以制造緊湊、輕量型閥塊,極大減輕重量并提高空間利用率,從而賦予Atlas跳躍和翻騰所需的強(qiáng)度/重量比。AgilityRobotics:成立于2015年,公司以生產(chǎn)腿部行走機(jī)器人為主,專門(mén)為物流和制造企業(yè)提供倉(cāng)庫(kù)機(jī)器人,以應(yīng)對(duì)季節(jié)性需求波動(dòng)造成的勞動(dòng)力短缺,主要是可以協(xié)助人工完成卸貨搬箱、管理貨架、最后一公里配送等任務(wù)。Digit:高約1米,重31公斤,擁有18個(gè)自由度。Digit在高難度動(dòng)作、復(fù)雜環(huán)境適應(yīng)等高階維度可能不如波士頓動(dòng)力的Atlas以及特斯拉的Optimus,但是作為倉(cāng)儲(chǔ)的搬運(yùn)機(jī)器人,其突出的特點(diǎn)就是“實(shí)用”,即能在不充電情況下“暴走”5km,意味著Digit能較好地自適應(yīng)工廠中的各種復(fù)雜場(chǎng)地和實(shí)現(xiàn)高續(xù)航能力,完美適配特定場(chǎng)所的使用需求,而能實(shí)現(xiàn)穩(wěn)定敏捷的運(yùn)動(dòng),核心源于其深度學(xué)習(xí)能力和獨(dú)特的運(yùn)動(dòng)設(shè)計(jì)。學(xué)習(xí)能力:讓Digit學(xué)會(huì)走路,需要用到強(qiáng)化學(xué)習(xí)和模仿學(xué)習(xí)。其中,強(qiáng)化學(xué)習(xí)解決馬爾可夫決策過(guò)程(MarkovDecisionProcess,MDP)的最優(yōu)策略,需要用到策略梯度算法;而模仿學(xué)習(xí)則需要解決參數(shù)策略問(wèn)題。用關(guān)鍵算法DASS來(lái)搞定數(shù)據(jù)集,再將DASS于強(qiáng)化學(xué)習(xí)、模仿學(xué)習(xí)結(jié)合在一起,為機(jī)器人設(shè)定策略。通過(guò)強(qiáng)化學(xué)習(xí)和模擬學(xué)習(xí),訓(xùn)練雙足機(jī)器人模擬及適應(yīng)不同高度的地面變化,而且只需要稍加改變現(xiàn)有的平地強(qiáng)化學(xué)習(xí)框架,就可以在樓梯、不平的地面等場(chǎng)景中穩(wěn)健地行走。運(yùn)動(dòng)設(shè)計(jì):在下肢架構(gòu)上,Digit及其第一代產(chǎn)品Cassie最大的特點(diǎn)就是他的“鴕鳥(niǎo)腿”,在動(dòng)力學(xué)部分參考了鳥(niǎo)類(lèi)步態(tài),尤其是鴕鳥(niǎo),膝蓋設(shè)計(jì)成彎曲形狀,能以比較自然的方式去減緩震動(dòng)。同時(shí)在自由度配置上,Digit在下肢也配備了較多的自由度,每條腿5個(gè)自由度,其中臀部3個(gè),允許腿向前、后、側(cè)三個(gè)方向擺動(dòng),脛骨和腳踝各1個(gè)自由度,但區(qū)別于臀部由電機(jī)驅(qū)動(dòng),后兩者是附著在彈簧上,有助于機(jī)器人在遇到障礙物時(shí)也能保持平衡。另外,DigitV2版本還對(duì)足部進(jìn)行了優(yōu)化,增加了橫滾自由度,使得Digit可以在不進(jìn)行側(cè)向踩踏的條件下抵抗側(cè)向力沖擊,甚至可以實(shí)現(xiàn)單腳的靜態(tài)平衡。1.2.2.娛樂(lè)&服務(wù)類(lèi)的代表之作工業(yè)類(lèi)人形機(jī)器人側(cè)重點(diǎn)在“工作”,而娛樂(lè)&服務(wù)類(lèi)則著重在“交互”,前者更多是在傳統(tǒng)工業(yè)機(jī)器人基礎(chǔ)上增加“人形態(tài)”,使得機(jī)器人更適合替代人類(lèi)工作,而后者在某種意義層面更符合“仿人機(jī)器人”的概念本質(zhì)---能成為“人”。EngineeredArts:成立于2005年,公司至今推出了6款機(jī)器人,最新型號(hào)Ameca是EngineeredArts機(jī)器人技術(shù)的集大成者。公司的產(chǎn)品已用于娛樂(lè)與教育行業(yè)。Ameca:高1.87米,重49公斤,擁有51個(gè)主要關(guān)節(jié)并配置52個(gè)電動(dòng)馬達(dá)。Ameca最突出的特點(diǎn)就是能實(shí)現(xiàn)復(fù)雜的臉部表情管理,而這樣逼真的仿人表情核心在于結(jié)合了AI與AB(ArtificialBody)技術(shù)。此外,Ameca在近期接入了GPT-4訓(xùn)練其語(yǔ)言能力、嵌入了StableDiffusion賦予了自身繪畫(huà)能力。因此,可以看到Ameca除了運(yùn)動(dòng)能力外,在各方面都不斷逼近人類(lèi)的真實(shí)行為。而Ameca能實(shí)現(xiàn)這樣的動(dòng)作表現(xiàn),離不開(kāi)其底層系統(tǒng),包括機(jī)器人操作系統(tǒng)Tritium和工程藝術(shù)系統(tǒng)Mesmer。Tritium:該系統(tǒng)類(lèi)似于“大腦”,主要負(fù)責(zé)智能化和各個(gè)機(jī)械結(jié)構(gòu)之間的聯(lián)動(dòng)。Tritium可以直接在瀏覽器運(yùn)行,適用幾乎任何編碼語(yǔ)言和多種軟件,登錄后即可快速處理各種數(shù)據(jù),遠(yuǎn)程控制機(jī)器人面部、頭頸、四肢等的各方面組件,使得機(jī)器人適應(yīng)環(huán)境的突然變化并即時(shí)做出響應(yīng),保證人機(jī)交互的安全和樂(lè)趣。Mesmer:該系統(tǒng)負(fù)責(zé)展現(xiàn)身而為人的“靈魂”,像是給出人類(lèi)的情緒表情和肢體語(yǔ)言。為了讓Ameca看起來(lái)像人,Mesmer平臺(tái)首先解決的是關(guān)節(jié)問(wèn)題,通過(guò)對(duì)頸部的設(shè)計(jì),讓頭部可順滑轉(zhuǎn)移到任何方位,其次是通過(guò)搭配LIDAR設(shè)計(jì)偵測(cè)移動(dòng)物體,讓機(jī)器人能一直注視和它說(shuō)話的人類(lèi),然后通過(guò)對(duì)手臂、手腕、肩部等部位的設(shè)計(jì),讓機(jī)器人能做出微妙的肢體語(yǔ)言,比如“聳肩”,最后搭配上人工皮膚,使得Ameca從語(yǔ)言表達(dá)到行為動(dòng)作,都表現(xiàn)得和人一樣流暢自然。2.問(wèn)題&變化:政策扶持加碼,軟件端迎來(lái)奇點(diǎn)人形機(jī)器人從提出概念到最近一年各廠商最新型號(hào)的推出,已經(jīng)邁過(guò)了60個(gè)年頭,發(fā)展階段也從“萌芽”到現(xiàn)今的“百花齊放”,工業(yè)類(lèi)出現(xiàn)了以波士頓動(dòng)力、特斯拉為代表的優(yōu)秀產(chǎn)品,娛樂(lè)&服務(wù)類(lèi)進(jìn)展也持續(xù)推進(jìn),特別是最近幾年,人形機(jī)器人的產(chǎn)業(yè)發(fā)展持續(xù)超乎市場(chǎng)預(yù)期。而站在當(dāng)前時(shí)點(diǎn),我們可以看到整個(gè)人形機(jī)器人產(chǎn)業(yè)自上而下都出現(xiàn)了推動(dòng)產(chǎn)業(yè)和產(chǎn)品向下一階段演變的新變化,另一方面從產(chǎn)品本身角度來(lái)看,人形機(jī)器人也存在不少的問(wèn)題有待解決。具體而言:產(chǎn)業(yè)維度:今年以來(lái),國(guó)內(nèi)針對(duì)人形機(jī)器人的政策走向更為積極的方向,包括對(duì)產(chǎn)業(yè)的頂層設(shè)計(jì)和產(chǎn)業(yè)鏈的各環(huán)節(jié)扶持都陸續(xù)出臺(tái)了相關(guān)政策,人形機(jī)器人的國(guó)內(nèi)產(chǎn)業(yè)環(huán)境正逐步得到優(yōu)化,我們認(rèn)為,此舉或類(lèi)似此前新能源車(chē)和光伏產(chǎn)業(yè)爆發(fā)前夕,政策的持續(xù)加碼下的產(chǎn)業(yè)正逐步走出平臺(tái)期、邁向下一階段。產(chǎn)品維度:人形機(jī)器人按照系統(tǒng)進(jìn)行劃分,可大致分為感知、控制、執(zhí)行系統(tǒng),其中感知和控制系統(tǒng)主要依賴算法、模型等軟件,執(zhí)行系統(tǒng)則主要是通過(guò)執(zhí)行器及其中的零部件來(lái)實(shí)現(xiàn)。軟件端,隨著近年來(lái)大模型的爆發(fā)性發(fā)展,機(jī)器人的算法訓(xùn)練、感知能力和人機(jī)交互等方面都得到極大地改善,可以說(shuō)軟件端在這一輪AI革命中迎來(lái)了奇點(diǎn)時(shí)刻,機(jī)器人作為AI技術(shù)的載體也跟隨AI的變革出現(xiàn)了巨大變化。硬件端,相較于軟件端的問(wèn)題不斷得到優(yōu)化,機(jī)器人在下肢行走和手部集成等方面上仍存在一定的硬件問(wèn)題。簡(jiǎn)而言之,我們認(rèn)為,雖然硬件端的問(wèn)題有待完善,但受益于產(chǎn)業(yè)維度的政策催化和產(chǎn)品維度的軟件優(yōu)化,人形機(jī)器人產(chǎn)業(yè)應(yīng)該會(huì)比之前的三個(gè)發(fā)展階段“走得更快”,更多的優(yōu)秀產(chǎn)品也有望加速落地,推動(dòng)人形機(jī)器人最終走向人類(lèi)社會(huì)。2.1.產(chǎn)業(yè)維度:國(guó)內(nèi)政策不斷加碼今年以來(lái),針對(duì)機(jī)器人以及人形機(jī)器人的政策呈現(xiàn)顯著變化。一是從數(shù)量維度來(lái)看,2023年提出的相關(guān)文件明顯要比往年更多,根據(jù)不完全統(tǒng)計(jì),今年出臺(tái)的政策文件共計(jì)6份,而2019-2022年間共計(jì)出臺(tái)的相關(guān)政策文件才8份,可以看到國(guó)家在對(duì)機(jī)器人產(chǎn)業(yè)的扶持力度上不斷加碼;二是發(fā)布政策的部門(mén)由中央層面逐步擴(kuò)散到地方層面,比如在2019-2022年,發(fā)行部門(mén)均為包括發(fā)改委、工信部、科技部等部委級(jí)以上的單位,但是今年以來(lái),包括上海、深圳、北京等一線城市均出臺(tái)了相關(guān)的機(jī)器人行動(dòng)方案,我們認(rèn)為此舉意味著各地政府開(kāi)始深入落實(shí)國(guó)家對(duì)于機(jī)器人產(chǎn)業(yè)的支持指導(dǎo),有望加速機(jī)器人產(chǎn)業(yè)的落地,推動(dòng)相關(guān)企業(yè)在主流城市的發(fā)展;三是從政策的內(nèi)容來(lái)看,今年以來(lái)出臺(tái)的政策更多提及“人形機(jī)器人”這一概念,而非籠統(tǒng)的“機(jī)器人”,比如北京的《行動(dòng)方案》中,提及“對(duì)標(biāo)國(guó)際領(lǐng)先人形機(jī)器人產(chǎn)品,支持企業(yè)和高校院所開(kāi)展人形機(jī)器人整機(jī)產(chǎn)品、關(guān)鍵零部件攻關(guān)和工程化,加快建設(shè)北京市人形機(jī)器人產(chǎn)業(yè)創(chuàng)新中心,爭(zhēng)創(chuàng)國(guó)家制造業(yè)創(chuàng)新中心?!保梢钥闯?,政策的重點(diǎn)從最初聚焦在傳統(tǒng)工業(yè)機(jī)器人逐步擴(kuò)散到人形機(jī)器人上面。進(jìn)一步而言,即使是今年發(fā)布的機(jī)器人政策也呈現(xiàn)出顯著變化。我們將北京市在6月28日發(fā)布的《北京市機(jī)器人產(chǎn)業(yè)創(chuàng)新發(fā)展行動(dòng)方案(2023—2025年)》,與之前上海、深圳、山東等省市發(fā)布的相關(guān)政策作對(duì)比,可以發(fā)現(xiàn),最明顯的區(qū)別在于:之前的政策更多是立足在頂層設(shè)計(jì)維度對(duì)機(jī)器人及人形機(jī)器人產(chǎn)業(yè)作出指導(dǎo),對(duì)產(chǎn)業(yè)在發(fā)展趨勢(shì)上提供了建議,而北京的《行動(dòng)方案》除了頂層設(shè)計(jì)外,特別地將人形機(jī)器人產(chǎn)業(yè)鏈中重要的零部件單獨(dú)提出來(lái),包括減速器、伺服驅(qū)動(dòng)系統(tǒng)、控制器、傳感器、末端執(zhí)行器等,對(duì)其也同樣提出了對(duì)應(yīng)的指導(dǎo)意見(jiàn)。我們認(rèn)為,北京的《行動(dòng)方案》有著更為重要的意義,一是代表著產(chǎn)業(yè)政策從頂層設(shè)計(jì)落腳到具體的產(chǎn)業(yè)鏈環(huán)節(jié),為各地方政府對(duì)相關(guān)企業(yè)的扶持提供了更為明確的指導(dǎo)和要求,加速具體細(xì)則的落地;二是重點(diǎn)提及人形機(jī)器人產(chǎn)業(yè)鏈中的關(guān)鍵環(huán)節(jié),對(duì)技術(shù)難度大且價(jià)值量高的零部件環(huán)節(jié)和企業(yè)提供支持,有望進(jìn)一步完善我國(guó)人形機(jī)器人產(chǎn)業(yè)鏈,為后續(xù)產(chǎn)業(yè)鏈降本奠定基礎(chǔ),加速下游人形機(jī)器人產(chǎn)品的迭代和商業(yè)化落地。2.2.產(chǎn)品維度:軟件端迎來(lái)奇點(diǎn),硬件端有待優(yōu)化2.2.1.軟件端:AI賦能機(jī)器人在人形機(jī)器人的產(chǎn)品層面,軟件端的變化顯得尤為突出,特別是AI技術(shù)的發(fā)展,逐步滲透到機(jī)器人研發(fā)和生產(chǎn)中,并在算法訓(xùn)練、感知能力、人機(jī)交互等多個(gè)維度對(duì)人形機(jī)器人產(chǎn)生重大影響。2.2.1.1.算法訓(xùn)練在現(xiàn)實(shí)世界中構(gòu)建機(jī)器人需要從頭開(kāi)始創(chuàng)建數(shù)據(jù)集,這樣做既耗時(shí)又耗費(fèi)成本,并且訓(xùn)練速度較慢。開(kāi)發(fā)人員為了降低成本并加快訓(xùn)練,逐步開(kāi)始采用合成數(shù)據(jù)生成(SDG)、預(yù)訓(xùn)練AI模型(pretrainedAImodels)、機(jī)器人仿真(roboticssimulation)、遷移學(xué)習(xí)(transferlearning)等一系列工具。而以英偉達(dá)、谷歌為代表的大廠近幾年在這些工具開(kāi)發(fā)上均取得較好進(jìn)展,為機(jī)器人客戶在研發(fā)和訓(xùn)練上提供更為成熟的工具。1)英偉達(dá)Isaac是英偉達(dá)推出的一款專門(mén)用于機(jī)器人環(huán)境模擬的引擎,提供從數(shù)據(jù)合成和訓(xùn)練、到仿真和測(cè)試的全流程配套支持,他融合了機(jī)器人相關(guān)的深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、SLAM、圖像處理等的算法?;谟ミ_(dá)強(qiáng)大的硬件支持,相較于此前常用的仿真器(VREP、ROS等),Isaac在性能、算法、渲染效果、生態(tài)支持等維度都明顯更為出色。數(shù)據(jù)合成:IsaacSim是英偉達(dá)的一個(gè)機(jī)器人模擬應(yīng)用程序及合成數(shù)據(jù)生成的工具,而IsaacSimReplicator作為其中用于合成數(shù)據(jù)生成的引擎,可以生成物理級(jí)精確的3D合成數(shù)據(jù),用以加速AI感知模型的訓(xùn)練和性能。?模型訓(xùn)練:NVIDIANGC匯集了通過(guò)GPU優(yōu)化的AI軟件、模型和JupyterNotebook示例,包括各種預(yù)訓(xùn)練模型以及為NVIDIAAI平臺(tái)優(yōu)化的AI基準(zhǔn)和訓(xùn)練方式。研發(fā)人員通過(guò)NVIDIANGC選擇合適的預(yù)訓(xùn)練AI模型后,通過(guò)NVIDIATAO進(jìn)行進(jìn)一步的訓(xùn)練和微調(diào)(NVIDIATAO作為一個(gè)可使用自定義數(shù)據(jù)訓(xùn)練、調(diào)整和優(yōu)化的框架,使用NVIDIATAO工具包能幫助研發(fā)人員微調(diào)NVIDIANGC目錄中的預(yù)訓(xùn)練AI模型)。仿真和測(cè)試:研發(fā)人員通過(guò)使用仿真器,檢測(cè)物體之間的潛在碰撞和識(shí)別碰撞物體之間的接觸點(diǎn),并計(jì)算機(jī)器人的傳感器信號(hào),借此來(lái)構(gòu)建虛擬場(chǎng)景,在這個(gè)虛擬世界中,開(kāi)發(fā)人員創(chuàng)建了機(jī)器人、環(huán)境以及機(jī)器人可能遇到的其他資產(chǎn)的數(shù)字版本。這些環(huán)境可以遵守物理定律,并模仿現(xiàn)實(shí)世界的重力、摩擦、材料和照明條件。在所構(gòu)建的虛擬場(chǎng)景中,研發(fā)人員通過(guò)此前搭建的預(yù)訓(xùn)練模型進(jìn)行運(yùn)動(dòng)規(guī)劃和任務(wù)規(guī)劃,并讓機(jī)器人執(zhí)行任務(wù)。在對(duì)虛擬場(chǎng)景中執(zhí)行任務(wù)的機(jī)器人進(jìn)行多次試錯(cuò)和調(diào)整,以此不斷優(yōu)化控制信號(hào),從而驗(yàn)證和優(yōu)化機(jī)器人的設(shè)計(jì)、系統(tǒng)及其算法,為機(jī)器人在現(xiàn)實(shí)世界執(zhí)行任務(wù)實(shí)現(xiàn)最高效率打下基礎(chǔ)。至此,英偉達(dá)的Isaac平臺(tái)從數(shù)據(jù)合成、模型訓(xùn)練到仿真測(cè)試等提供了全流程的配套支持,幫助機(jī)器人客戶實(shí)現(xiàn)0-1構(gòu)建一個(gè)機(jī)器人,并大大降低了訓(xùn)練的成本和提高了機(jī)器人訓(xùn)練的速度。2)谷歌2023年6月20日,發(fā)布名為Robocat的AI模型,作為世界上第一個(gè)能解決和適應(yīng)多種任務(wù)的模型,能安裝在不同的現(xiàn)實(shí)機(jī)器人上使用。Robocat是一個(gè)用于機(jī)器人操作的能實(shí)現(xiàn)自我迭代的智能體,可以在虛擬和現(xiàn)實(shí)世界中實(shí)現(xiàn)多項(xiàng)任務(wù),包括對(duì)文字、圖像、語(yǔ)音等的處理。Robocat最大的特點(diǎn)是在于“自我迭代”,所謂的自我迭代是指基于一定數(shù)量的源于現(xiàn)實(shí)世界的數(shù)據(jù)集,對(duì)該數(shù)據(jù)集進(jìn)行微調(diào)后衍生出新的數(shù)據(jù)集,將現(xiàn)實(shí)世界和衍生出來(lái)的數(shù)據(jù)集進(jìn)行融合,并在此基礎(chǔ)上進(jìn)行新的訓(xùn)練,以此循環(huán)反復(fù)繼而不斷擴(kuò)充智能體的學(xué)習(xí)數(shù)據(jù)。具體來(lái)說(shuō),每個(gè)新任務(wù)的學(xué)習(xí)遵循5個(gè)步驟:1.使用由人類(lèi)控制的機(jī)械臂收集100-1000個(gè)新任務(wù)或機(jī)器人的演示;2.在這個(gè)新的任務(wù)/手臂上微調(diào)RoboCat,創(chuàng)建一個(gè)專門(mén)的衍生代理;3.衍生代理在這個(gè)新任務(wù)/手臂上平均練習(xí)10000次,生成更多的訓(xùn)練數(shù)據(jù);4.將演示數(shù)據(jù)和自生成數(shù)據(jù)整合到RoboCat現(xiàn)有的訓(xùn)練數(shù)據(jù)集中;5.在新訓(xùn)練數(shù)據(jù)集上訓(xùn)練新版本的RoboCat。而且這樣的“自我迭代”具備良性循環(huán)的訓(xùn)練:學(xué)習(xí)的新任務(wù)越多,它學(xué)習(xí)其他新任務(wù)的能力就越好。RoboCat的初始版本在以前看不見(jiàn)的任務(wù)上只有36%的時(shí)間成功,每個(gè)任務(wù)從500個(gè)演示中學(xué)習(xí)。但是最新的RoboCat,它已經(jīng)訓(xùn)練了更多樣化的任務(wù),在相同的任務(wù)上,成功率增加了一倍多。簡(jiǎn)而言之,RoboCat作為目前為止機(jī)器人控制AI模型的“最優(yōu)形態(tài)”,核心優(yōu)勢(shì)在于在合成數(shù)據(jù)生成維度的跳躍式發(fā)展,能快速根據(jù)模擬和現(xiàn)實(shí)世界中收集到的圖像和動(dòng)作數(shù)據(jù)進(jìn)行訓(xùn)練,大大降低了機(jī)器人對(duì)新任務(wù)的學(xué)習(xí)時(shí)間和障礙,極大地提高了訓(xùn)練效率。2.2.1.2.感知能力人形機(jī)器人的感知是指通過(guò)各種傳感器的信息收集,將被測(cè)量的環(huán)境信息轉(zhuǎn)化為電信號(hào)或其他所需的形式,然后經(jīng)過(guò)數(shù)據(jù)處理階段,輸送到不同的感知算法,為機(jī)器人后續(xù)的規(guī)劃、控制階段提供支持。機(jī)器人的傳感器按照類(lèi)別可以分為多種,包括視覺(jué)傳感器、力矩傳感器、觸覺(jué)傳感器、聽(tīng)覺(jué)傳感器等,雖然每個(gè)傳感器的功能都不一,但是當(dāng)機(jī)器人執(zhí)行某一動(dòng)作時(shí)有可能需要同時(shí)用到多種傳感器的信息,比如用于識(shí)別環(huán)境時(shí),需要使用攝像頭、激光雷達(dá)、毫米波雷達(dá)等傳感器,機(jī)器人才能比較精準(zhǔn)地確定物體的信息并進(jìn)行后續(xù)的操作。因此,如何融合多個(gè)傳感器的信息,并通過(guò)感知算法同時(shí)處理多維度信息,是人形機(jī)器人在運(yùn)動(dòng)規(guī)劃和感知能力上需要解決的問(wèn)題。多傳感器融合(Multi-sensorFusion,MSF),是指利用計(jì)算機(jī)技術(shù),將來(lái)自多傳感器或多源的信息和數(shù)據(jù)以一定的準(zhǔn)則進(jìn)行自動(dòng)分析和綜合,以完成所需的決策和估計(jì)而進(jìn)行的信息處理過(guò)程。和人的感知相似,不同的傳感器擁有其他傳感器不可替代的作用,當(dāng)各種傳感器進(jìn)行多層次,多空間的信息互補(bǔ)和優(yōu)化組合處理,最終產(chǎn)生對(duì)觀測(cè)環(huán)境的一致性解釋。傳感器融合能幫助機(jī)器人提高識(shí)別精度、增強(qiáng)魯棒性、擴(kuò)展覆蓋范圍。AI大模型將優(yōu)化多傳感器融合技術(shù)。按照信息融合架構(gòu)進(jìn)行劃分,可以將傳感器融合技術(shù)分為分布式、集中式和混合式,或者可以分為后融合算法和前融合算法,或者可以分為數(shù)據(jù)級(jí)、特征級(jí)和決策級(jí)融合。其中,目前常用的是分布式/后融合算法,其核心思想是每個(gè)傳感器都有自己獨(dú)立處理的目標(biāo)數(shù)據(jù),融合模塊將對(duì)各傳感器的濾波結(jié)果進(jìn)行有效結(jié)合,而集中式/前融合算法則相反,使用一個(gè)感知算法對(duì)多維綜合感知數(shù)據(jù)進(jìn)行處理。在以往算力受限和模型發(fā)展不成熟的情況下,使用分布式/后融合算法能在犧牲一定精度的同時(shí)降低算法復(fù)雜度,但由于不同傳感器的數(shù)據(jù)類(lèi)型不一,系統(tǒng)穩(wěn)定性也會(huì)因此受到影響,而且受限于單一類(lèi)型傳感器的能力上限,后融合算法會(huì)導(dǎo)致特定條件下的偶發(fā)性漏檢或誤檢。而隨著算力的提升和多模態(tài)大模型的發(fā)展,數(shù)據(jù)級(jí)/集中式/前融合算法的缺點(diǎn)有望得到彌補(bǔ),比如集中式融合存在因中央處理單元性能不足導(dǎo)致通信延遲和計(jì)算瓶頸的問(wèn)題,而AI大模型的算力提升將解決這一點(diǎn),從而將目前主流的融合算法方案從后融合/分布式/決策級(jí)推向前融合/集中式/數(shù)據(jù)級(jí),數(shù)據(jù)級(jí)的傳感融合也能減少感知過(guò)程中原始數(shù)據(jù)的信息損失而提高感知精度,提高數(shù)據(jù)處理的準(zhǔn)確性?;赥ransFormers模型的多傳感器融合技術(shù)率先在自動(dòng)駕駛領(lǐng)域得到應(yīng)用。TransFormers作為可能取代CNN和RNN的深度學(xué)習(xí)模型,能快速地完成對(duì)大量數(shù)據(jù)的特征提取,使得大模型在多模態(tài)信息處理上的能力得到不斷強(qiáng)化。而TransFormers需要海量訓(xùn)練數(shù)據(jù),而大模型和更大參數(shù)量級(jí)的發(fā)展將推動(dòng)TransFormers模型的完善,驅(qū)動(dòng)數(shù)據(jù)級(jí)的感知算法進(jìn)一步優(yōu)化。特斯拉在2021年的AIDay上率先發(fā)布BEV+TransFormers算法,基于“輸入-提取-轉(zhuǎn)換-融合-時(shí)序-輸出”的思路,實(shí)現(xiàn)“2D-3D-4D”的轉(zhuǎn)換。2.2.1.3.人機(jī)交互AI大模型對(duì)機(jī)器人在人機(jī)交互層面的影響除了能實(shí)現(xiàn)更好的對(duì)話交流,讓機(jī)器人執(zhí)行語(yǔ)言任務(wù)外,更為重要的影響是在于能將人類(lèi)傳遞的自然語(yǔ)言轉(zhuǎn)化為執(zhí)行任務(wù)的指令,讓機(jī)器人能根據(jù)指令反饋物理操作。1)語(yǔ)言任務(wù)近年來(lái),大型語(yǔ)言模型(LLM)在語(yǔ)言生成和理解方面取得了重大進(jìn)展,LLM的使用幫助機(jī)器人更好地理解和學(xué)習(xí)人類(lèi)語(yǔ)言,并根據(jù)人類(lèi)的意圖和語(yǔ)氣,進(jìn)行語(yǔ)音交流和反饋。比如,波士頓動(dòng)力將ChatGPT安裝到機(jī)器狗Spot中,Spot能根據(jù)工作人員的問(wèn)題作出相應(yīng)的回答,并且能根據(jù)機(jī)器狗自身的實(shí)際情況,將信息反饋給工作人員,例如當(dāng)被問(wèn)及下一次任務(wù)的檢查次數(shù)時(shí),Spot能準(zhǔn)確回答次數(shù)。除了能反饋語(yǔ)音信息外,機(jī)器人還可以根據(jù)所表達(dá)的語(yǔ)言,傳遞面部表情,例如,EngineeredArts將GPT-4接入到Ameca中,Ameca不僅能流暢地和人類(lèi)進(jìn)行交流,還會(huì)根據(jù)聊天的內(nèi)容作出相應(yīng)的面部表情,包括皺眉、吃驚、生氣、眨眼等。2)物理任務(wù)更進(jìn)一步而言,我們其實(shí)不僅希望LLM在機(jī)器人中的角色僅僅作為一個(gè)“語(yǔ)音助手”,對(duì)外界輸入的信息作出包括語(yǔ)言、圖片甚至表情等的輸出反饋,更是希望輸入的語(yǔ)音信息如何轉(zhuǎn)化為能使機(jī)器人主體在現(xiàn)實(shí)世界中作出物理行為。簡(jiǎn)單來(lái)說(shuō),我們希望LLM幫助機(jī)器人實(shí)現(xiàn)與人的對(duì)話互動(dòng),以及更為重要的動(dòng)作互動(dòng)。如何實(shí)現(xiàn)機(jī)器人與環(huán)境的物理交互,谷歌在今年推出的視覺(jué)語(yǔ)言模型PaLM-E給出了答案。PaLM-E作為一個(gè)具備5620億個(gè)參數(shù),集成了視覺(jué)和語(yǔ)言,用于機(jī)器人控制的視覺(jué)語(yǔ)言模型(VLM),與LLM不同之處在于其對(duì)物理世界的感知。PaLM-E能驅(qū)動(dòng)機(jī)器人執(zhí)行任務(wù),比如當(dāng)人類(lèi)給機(jī)器人一個(gè)高級(jí)指令,PaLM-E可以為機(jī)器人將這一指令生成行動(dòng)規(guī)劃,然后讓機(jī)器人親自執(zhí)行。為什么PaLM-E能實(shí)現(xiàn)這樣的功能?具體來(lái)說(shuō),PaLM-E是基于谷歌現(xiàn)有的大型語(yǔ)言模型PaLM,通過(guò)添加感官信息和機(jī)器人控制而迭代生成的。因此:一方面,它具備大型語(yǔ)言模型的功能。通過(guò)語(yǔ)言模型將指令分解為一系列文本步驟,同時(shí)訓(xùn)練人員會(huì)為機(jī)器人預(yù)先提供一個(gè)基礎(chǔ)技能庫(kù),這個(gè)技能庫(kù)包含了一系列的“原子”技能,每個(gè)“原子”技能對(duì)應(yīng)執(zhí)行一個(gè)短任務(wù)。因此當(dāng)機(jī)器人接受到高級(jí)指令時(shí),會(huì)通過(guò)LLM將其拆分為多個(gè)簡(jiǎn)單動(dòng)作,而且這些簡(jiǎn)單動(dòng)作已經(jīng)存在于訓(xùn)練集中,機(jī)器人只需要把對(duì)應(yīng)的動(dòng)作從訓(xùn)練集中摘取出來(lái),組成一套行為步驟即可。另一方面,它具備分析圖像和傳感器數(shù)據(jù)的能力。通過(guò)分析機(jī)器人相機(jī)收集的數(shù)據(jù),PaLM-E可以將這些圖像、語(yǔ)音之類(lèi)的數(shù)據(jù),編碼成一系列與語(yǔ)言標(biāo)記大小相同的向量,類(lèi)似語(yǔ)言模型處理語(yǔ)言數(shù)據(jù)一樣處理感官數(shù)據(jù)。最后,通過(guò)神經(jīng)網(wǎng)絡(luò)對(duì)機(jī)器人實(shí)現(xiàn)控制。簡(jiǎn)而言之,要實(shí)現(xiàn)機(jī)器人的動(dòng)作互動(dòng),一是要通過(guò)LLM使機(jī)器人理解人類(lèi)的自然語(yǔ)言,二是通過(guò)VLM使機(jī)器人實(shí)時(shí)理解周?chē)沫h(huán)境以便后續(xù)的任務(wù)操作。因此,在未來(lái),“LLM+VLM”將成為機(jī)器人作為一個(gè)智能體能夠推理環(huán)境、任務(wù),并完全根據(jù)語(yǔ)言采取行動(dòng)的核心框架。但是,上述的做法存在一個(gè)較大的問(wèn)題,萬(wàn)一拆分出來(lái)的短任務(wù)并沒(méi)有出現(xiàn)在數(shù)據(jù)集中,那如何處理?即當(dāng)面對(duì)沒(méi)有預(yù)訓(xùn)練樣本的行為動(dòng)作,機(jī)器人該如何執(zhí)行相應(yīng)任務(wù)。針對(duì)這一問(wèn)題,學(xué)術(shù)界最近也提出了新的解決方案,2023年7月12日,李飛飛團(tuán)隊(duì)發(fā)布最新成果展示:通過(guò)大模型的接入,能直接將復(fù)雜指令轉(zhuǎn)化為具體行動(dòng)規(guī)劃,而無(wú)需額外的數(shù)據(jù)和訓(xùn)練。換句話來(lái)說(shuō),當(dāng)人類(lèi)通過(guò)自然語(yǔ)言向機(jī)器人發(fā)出指令后,機(jī)器人通過(guò)視覺(jué)系統(tǒng)識(shí)別物體并進(jìn)行行動(dòng)規(guī)劃,然后在沒(méi)有預(yù)訓(xùn)練的基礎(chǔ)上執(zhí)行了任務(wù)。2.2.2.硬件端:零部件有待優(yōu)化人形機(jī)器人的執(zhí)行系統(tǒng)由多個(gè)執(zhí)行器組成,而執(zhí)行器主要安裝在機(jī)器人的雙臂和雙腿,幫助機(jī)器人實(shí)現(xiàn)手部操作和腿部移動(dòng)的兩個(gè)主要功能,因此機(jī)器人的硬件端問(wèn)題主要集中在上肢的手部和下肢的腿部?jī)蓚€(gè)部位。2.2.2.1.下肢:行走穩(wěn)定性雖然已經(jīng)有以Atlas為代表的機(jī)器人能實(shí)現(xiàn)十分炫酷的奔跑、跳躍等動(dòng)作,但其實(shí)目前對(duì)于大部分雙足人形機(jī)器人而言,行走穩(wěn)定性仍然難以保證,特別是針對(duì)非直線平面的環(huán)境,機(jī)器人因?yàn)楦兄?、?guī)劃等問(wèn)題仍會(huì)出現(xiàn)失去平衡等現(xiàn)象,而且使用雙足行走的機(jī)器人目前行走緩慢,最高行走速度也只有1-2m/s,比如Optimus最高時(shí)速為5英里/小時(shí)、Atlas時(shí)速為2.5m/s、CyberOne時(shí)速為3.6km/h等。因此,對(duì)于人形機(jī)器人而言,首要問(wèn)題仍是使機(jī)器人“像人一樣行走”---在各種環(huán)境中平穩(wěn)行走甚至奔跑,同時(shí)還擁有較快的速度。而目前看來(lái),從腳部的傳感器、驅(qū)動(dòng)器的方案到控制器的算法規(guī)劃,都有待進(jìn)一步完善的地方。下面我們主要討論硬件端的問(wèn)題及解決方案,即驅(qū)動(dòng)器和傳感器的情況。1)驅(qū)動(dòng)器存在的問(wèn)題:反射慣性大。為了實(shí)現(xiàn)動(dòng)態(tài)任務(wù),機(jī)器人的驅(qū)動(dòng)系統(tǒng)需要發(fā)揮出與機(jī)器人總重量相匹配的力,換句話來(lái)說(shuō),就是機(jī)器人的下肢需要較高的力密度。一般而言,增加執(zhí)行器的轉(zhuǎn)矩密度比較常用的方案是增加減速器的傳動(dòng)比,但這樣做的缺點(diǎn)是增加傳動(dòng)比的同時(shí)會(huì)增加關(guān)節(jié)中的摩擦力和轉(zhuǎn)子的反射慣性,從而降低肢體的反向驅(qū)動(dòng)能力及其調(diào)節(jié)和減輕沖擊的能力。而且更為重要的是,傳動(dòng)比不能無(wú)限地增加,因?yàn)榉聪蝌?qū)動(dòng)性能的下降速度是要明顯快于扭矩密度的增加速度。簡(jiǎn)單來(lái)說(shuō),目前常用的高齒輪減速比的方案(比如諧波減速器+力矩傳感器)可以使得機(jī)器人的扭矩密度在有限范圍內(nèi)增大,但同時(shí)由于其摩擦力增大和脆弱性提高,機(jī)器人只能比較緩慢地行走。2)力矩傳感器存在的問(wèn)題:負(fù)載能力不足。安裝在機(jī)器人腳部的力矩傳感器是最基本的傳感器,他的作用是測(cè)量施加在其腳上的地面反作用力和力矩,進(jìn)而用于計(jì)算零點(diǎn)矩點(diǎn),作為控制機(jī)器人行走穩(wěn)定性的重要參數(shù)。但是基于傳感器中的彈性體設(shè)計(jì)等因素,六維力矩傳感器在剛度、測(cè)量精確性、靈敏度等存在不足。特別是剛度問(wèn)題,根據(jù)數(shù)據(jù)統(tǒng)計(jì),目前六維力矩傳感器的最大力負(fù)載一般僅為機(jī)器人重量的1-2倍(當(dāng)面臨外部干擾或者變化復(fù)雜的地面環(huán)境時(shí),載荷也隨之下降),一旦承受超出這一范圍的沖擊力(機(jī)器人奔跑時(shí)的負(fù)載范圍較步行時(shí)更小),傳感器或出現(xiàn)故障并影響機(jī)器人的行走。另外,傳感器中的扭矩范圍也受到機(jī)器人重量和腳部尺寸的限制,一般而言,腳踝扭矩要求不大于機(jī)器人重量和腳部尺寸的乘積。解決方案:為了避免傳感器在意外情況下受到損壞,目前業(yè)界一般采用過(guò)載保護(hù)機(jī)制+安裝沖擊吸收部件的組合方案,一是過(guò)載保護(hù)機(jī)制,通過(guò)制動(dòng)器來(lái)實(shí)現(xiàn)斷開(kāi)保護(hù),二是在傳感器中安裝沖擊吸收部件以減輕機(jī)器人接觸地面時(shí)的反作用力,比如安裝阻尼器、記憶材料、液壓減震器、彈簧等。在《DesignofaHighlyDynamicHumanoidRobot》中也提到,使用定制的足部傳感器僅測(cè)量腳趾和腳跟的垂直反作用力,附加一個(gè)六維的IMU用于測(cè)量地面的接觸狀態(tài),這樣能減少傳感器的受力負(fù)載,同時(shí)使用線切割來(lái)作為過(guò)載保護(hù)??傮w而言,目前針對(duì)傳感器載荷能力的問(wèn)題,要么采用減少維度的方式降低受力(比如使用三維力矩傳感器),要么采用增加結(jié)構(gòu)件的方式緩沖受力,這兩種方法雖然一定程度上彌補(bǔ)了傳感器剛度不足的問(wèn)題,但同時(shí)導(dǎo)致測(cè)量精度下降和腿部關(guān)節(jié)模組集成難度增大等問(wèn)題,因此如何根據(jù)人形機(jī)器人的足部特點(diǎn)定制適合的傳感器,最大程度保證行走穩(wěn)定性仍然需要學(xué)術(shù)界和業(yè)界的進(jìn)一步探討。2.2.2.2.手部:零部件集成如果說(shuō)實(shí)現(xiàn)雙腿的平穩(wěn)行走是人形機(jī)器人的第一功能和要求,那么將機(jī)器人推向商業(yè)化的核心就是如何通過(guò)機(jī)器人的雙臂執(zhí)行任務(wù)來(lái)實(shí)現(xiàn)機(jī)器人的商用價(jià)值。人形機(jī)器人的雙臂是實(shí)現(xiàn)大部分工業(yè)操作的工具,因此對(duì)雙臂的要求主要集中感知物體和承載物體兩個(gè)維度,前者幫助機(jī)器人在執(zhí)行任務(wù)前識(shí)別所需要操作的目標(biāo),后者幫助機(jī)器人在工業(yè)流程中應(yīng)對(duì)各種任務(wù)。具體到硬件端,基于工業(yè)機(jī)械臂的成熟工藝,機(jī)器人在手部構(gòu)成上可借鑒機(jī)械臂的技術(shù),而區(qū)別在于人形機(jī)器人對(duì)于精細(xì)化操作要求更高,因此需要在傳感器上進(jìn)一步優(yōu)化。目前機(jī)器人的主要問(wèn)題體現(xiàn)在傳感器上,雖然和腿部的硬件類(lèi)似,但是手部對(duì)于傳感器的要求與上述談到的腿部部分有所不同。1)傳感器人形機(jī)器人的靈巧手安裝有多個(gè)不同的傳感器,以騰訊的TRX-Hand為例,手指就結(jié)合了視覺(jué)、接近覺(jué)、觸覺(jué)和力覺(jué)傳感器,而其中觸覺(jué)和力矩傳感器是大多數(shù)靈巧手都會(huì)配置的,用以在接觸物體時(shí),獲取物體的位置、形狀和受力等信息,使機(jī)器人能感知物體的狀態(tài)并在物體交互時(shí)更為輕柔和自然。存在的問(wèn)題:集成難度大。相對(duì)于腿部而言,手部對(duì)傳感器的集成有更高的要求。比如手部一般具有10-12個(gè)自由度,這就意味著需要將10-12組關(guān)節(jié)模組(包括驅(qū)動(dòng)器、傳感器和結(jié)構(gòu)件等零部件)都集成到手掌,這大大提高了對(duì)零部件的體積和重量的要求。進(jìn)一步而言,光是將觸覺(jué)傳感器集成到手指和指尖就存在不少問(wèn)題,比如機(jī)器人的手和人類(lèi)指骨有所不同,前者的手指近端和中端的距離要比人類(lèi)的短,接觸面積的縮小導(dǎo)致連接困難,而且由于靈活性的原因,觸覺(jué)傳感器不能完全覆蓋手指鏈接之間的空白區(qū)域。又比如,觸覺(jué)傳感器的觸覺(jué)元件增多會(huì)導(dǎo)致讀取和傳輸數(shù)據(jù)的導(dǎo)線增多,導(dǎo)線數(shù)量越多集成難度越大,而將并行連接改為串行連接可以減少導(dǎo)線數(shù)量,但會(huì)導(dǎo)致傳輸速率變慢,等等。解決方案:針對(duì)集成問(wèn)題,目前逐漸被市場(chǎng)所接受的是通過(guò)3D打印技術(shù)將傳感器嵌入機(jī)器人的手指,傳感器之間的緊湊性、堅(jiān)固性以穩(wěn)定性也因此得到提高,常用的材料包括TPU、炭黑、CNT等。另外,研究人員也提出使用欠驅(qū)動(dòng)運(yùn)動(dòng)(underactuatedmovements,當(dāng)致動(dòng)器數(shù)量小于自由度時(shí),機(jī)器人系統(tǒng)就被稱為欠驅(qū)動(dòng)系統(tǒng)),通過(guò)減少致動(dòng)器數(shù)量并簡(jiǎn)化結(jié)構(gòu)來(lái)實(shí)現(xiàn)自適應(yīng)抓取,將驅(qū)動(dòng)力傳遞給欠驅(qū)動(dòng)關(guān)節(jié),從而簡(jiǎn)化了機(jī)械手的組裝,以降低集成難度和成本,等等。3.未來(lái):應(yīng)用場(chǎng)景&市場(chǎng)空間人形機(jī)器人的應(yīng)用場(chǎng)景會(huì)是哪里?為什么在過(guò)去十年各家科技企業(yè)紛紛染指機(jī)器人賽道,并且花費(fèi)大量的時(shí)間、成本和人力進(jìn)行數(shù)次的試驗(yàn)和測(cè)試。雖然現(xiàn)在基于高昂的成本和不成熟的技術(shù),人形機(jī)器人的應(yīng)用場(chǎng)景有限,短期也難以激起大量的市場(chǎng)需求,但是我們認(rèn)為,正如馬斯克所說(shuō),當(dāng)人形機(jī)器人成熟后,機(jī)器人的需求將遠(yuǎn)超汽車(chē)等產(chǎn)品,屆時(shí)機(jī)器人的作用將作為人類(lèi)的“替代工具”,替代人類(lèi)在工業(yè)、家庭、商業(yè)中的部分功能,特別是成本、安全、健康等因素導(dǎo)致人類(lèi)無(wú)法勝任的工種,機(jī)器人的應(yīng)用場(chǎng)景也遍布人類(lèi)生活和工作的多個(gè)地方。比如,人工智能機(jī)器人公司Figure制造通用類(lèi)人形機(jī)器人的目的就是為了解決勞動(dòng)力短缺、人口老齡化、外太空探索等問(wèn)題。因此,考慮到成本、需求以及容錯(cuò)率等因素,我們認(rèn)為,人形機(jī)器人將率先在工業(yè)場(chǎng)景,特別是工廠中落地,隨后經(jīng)過(guò)技術(shù)優(yōu)化和成本下降,場(chǎng)景將逐步滲透到家庭和商用。3.1.工業(yè)場(chǎng)景:替代傳統(tǒng)工業(yè)機(jī)器人和人類(lèi)勞動(dòng)力3.1.1.性能+成本優(yōu)勢(shì)凸顯在人形機(jī)器人中,未來(lái)率先應(yīng)用的大概率會(huì)在工業(yè)場(chǎng)景,去取代重復(fù)、無(wú)聊、危險(xiǎn)的工作,替代傳統(tǒng)工業(yè)機(jī)器人和人類(lèi)勞動(dòng)力。性能優(yōu)勢(shì)下,機(jī)器人將部分替代傳統(tǒng)工業(yè)機(jī)器人?,F(xiàn)階段傳統(tǒng)工業(yè)機(jī)器人基本上能覆蓋工業(yè)制造中大部分的使用場(chǎng)景,那人形機(jī)器人取代的是哪部分工種呢?傳統(tǒng)工業(yè)機(jī)器人存在靈活性較差的問(wèn)題。對(duì)于工業(yè)機(jī)器人而言,按照應(yīng)用場(chǎng)景來(lái)分類(lèi),可以分為搬運(yùn)、碼垛、分揀、焊接、裝配、噴涂、切割、檢測(cè)等用途,目前主要以搬運(yùn)和焊接為主,其他場(chǎng)景由于工業(yè)機(jī)器人的可移動(dòng)性較差、安裝條件要求較高等原因無(wú)法較好地使用機(jī)器人。按照作業(yè)方式進(jìn)行劃分,可以分為直角坐標(biāo)、圓柱坐標(biāo)、SCARA、多關(guān)節(jié)、協(xié)助機(jī)器人,除了協(xié)助機(jī)器人外,前4種屬于傳統(tǒng)工業(yè)機(jī)器人,這些傳統(tǒng)工業(yè)機(jī)器人存在的問(wèn)題是,雖然可以按照需求開(kāi)發(fā)新的功能,但是需要專業(yè)人員進(jìn)行編程、測(cè)試、開(kāi)發(fā)等一系列流程,靈活性較差,而協(xié)助機(jī)器人雖然操作簡(jiǎn)單、編程方便,但是只適合用在任務(wù)簡(jiǎn)單的工種,且屬于輕量級(jí)機(jī)器人,負(fù)載能力相對(duì)較弱。因此,歸納起來(lái)可以發(fā)現(xiàn),傳統(tǒng)工業(yè)機(jī)器人的靈活性、易用性較差,難以滿足一些長(zhǎng)尾和靈活性要求較高的工業(yè)需求。人形機(jī)器人將作為傳統(tǒng)工業(yè)機(jī)器人的重要補(bǔ)充。人形機(jī)器人的優(yōu)勢(shì)在于,在運(yùn)動(dòng)方面能像人一樣靈活移動(dòng),快速移動(dòng)到工廠中各種場(chǎng)景,在任務(wù)執(zhí)行中基于大模型訓(xùn)練迭代后形成的自主決策能力,能針對(duì)各種工作和場(chǎng)景做出實(shí)時(shí)的反饋。簡(jiǎn)單而言,人形機(jī)器人在工業(yè)場(chǎng)景中,依靠更高階的自主決策能力和更靈活的移動(dòng)方式,能較好地填補(bǔ)傳統(tǒng)工業(yè)機(jī)器人的不足、替代原本由人工操作的工作。成本優(yōu)勢(shì)下,機(jī)器人將部分取代人類(lèi)勞動(dòng)。海外高昂的勞動(dòng)力成本使得機(jī)器人替代人工的優(yōu)點(diǎn)越發(fā)凸顯。以美國(guó)為例,用工成本除了基本薪酬外,還包含稅收、福利、保險(xiǎn)、培訓(xùn)費(fèi)用以及各種法律法規(guī)風(fēng)險(xiǎn)造成的潛在成本。首先只粗略對(duì)比基本薪酬,根據(jù)美國(guó)勞工統(tǒng)計(jì)局?jǐn)?shù)據(jù),2023年5月美國(guó)所有員工的實(shí)際平均工資為28.83美元/小時(shí),聯(lián)邦規(guī)定的最低工資標(biāo)準(zhǔn)也達(dá)到7.25美元/小時(shí),我們假設(shè)人形機(jī)器人的初期售
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 資金管理與優(yōu)化實(shí)踐總結(jié)
- 廣西河池市環(huán)江縣2022-2023學(xué)年六年級(jí)上學(xué)期英語(yǔ)期末試卷
- 《演講中的自我介紹》課件
- 2025年山西省、陜西省、寧夏、青海省八省聯(lián)考高考地理模擬試卷
- 2023年廣西壯族自治區(qū)柳州市公開(kāi)招聘警務(wù)輔助人員輔警筆試自考題1卷含答案
- 2024年山西省朔州市公開(kāi)招聘警務(wù)輔助人員輔警筆試自考題2卷含答案
- 《全身麻醉》課件
- 機(jī)電部的口號(hào)和目標(biāo)
- 遼寧省本溪市(2024年-2025年小學(xué)六年級(jí)語(yǔ)文)統(tǒng)編版綜合練習(xí)((上下)學(xué)期)試卷及答案
- 《慢阻肺健康大課堂》課件
- QC小組活動(dòng)管理制度
- 市區(qū)自備井排查整治工作實(shí)施方案
- 8位半萬(wàn)用表大比拼
- 品牌管理部績(jī)效考核指標(biāo)
- 《數(shù)學(xué)廣角——數(shù)與形》評(píng)課稿
- 瀝青路面施工監(jiān)理工作細(xì)則
- 物業(yè)設(shè)備設(shè)施系統(tǒng)介紹(詳細(xì)).ppt
- 公司走賬合同范本
- 獲獎(jiǎng)一等獎(jiǎng)QC課題PPT課件
- 人教版小學(xué)三年級(jí)數(shù)學(xué)上冊(cè)判斷題(共3頁(yè))
- 國(guó)際項(xiàng)目管理手冊(cè)The Project Manager’s Manual
評(píng)論
0/150
提交評(píng)論