人形機(jī)器人行業(yè)分析1

上傳人：白*** IP屬地：湖南上傳時(shí)間：2023-09-30 格式：DOCX 頁(yè)數(shù)：28 大?。?.10MB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩23頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

人形機(jī)器人行業(yè)分析1.歷史：工業(yè)類(lèi)人形機(jī)器人嶄露鋒芒1.1.人形機(jī)器人發(fā)展的三階段人形機(jī)器人的“萌芽階段”（1960-1990）。這一階段的人形機(jī)器人特征為初具“人形態(tài)”，研發(fā)重點(diǎn)著重在機(jī)器人的“下肢運(yùn)動(dòng)”。1968年，美國(guó)的通用電氣公司（R．Smosher）試制了一臺(tái)名為“Rig”的操縱型雙足步行機(jī)器人機(jī)械，同年，日本早稻田大學(xué)加藤一郎教授在日本首先展開(kāi)了雙足機(jī)器人的研制工作，并先后推出了WAP-1、WAP-3、WL-5等持續(xù)迭代的雙足機(jī)器人版本，自此人形機(jī)器人產(chǎn)業(yè)步入萌芽階段。此外，除了日本在人形機(jī)器人研制上做出較大貢獻(xiàn)外，包括英國(guó)、蘇聯(lián)等國(guó)家也紛紛加入機(jī)器人的研制上，例如，英國(guó)于1970年研制成功的“Witt”型雙足機(jī)器人，蘇聯(lián)則研制出兩輪雙足行走機(jī)器人。而我國(guó)在人形機(jī)器人的研發(fā)起步相對(duì)較慢，自1985年始，國(guó)內(nèi)幾所科研院校才陸續(xù)開(kāi)始人形機(jī)器人的研發(fā)工作，而直到2000年，中國(guó)國(guó)防科技大學(xué)經(jīng)過(guò)多年的努力成果才研制出我國(guó)第一臺(tái)仿人型機(jī)器人“先行者”，哈爾濱工業(yè)大學(xué)也自1985年研發(fā)雙足步行機(jī)器人以來(lái)，先后推出HJT-I、HJT-II、HJT-III等型號(hào)的機(jī)器人。人形機(jī)器人的“發(fā)展階段”（1990-2010）。這一階段的人形機(jī)器人特征為附加更多功能，研發(fā)重點(diǎn)從之前的“如何實(shí)現(xiàn)更好行走”到“賦予機(jī)器人更多其他的‘仿人特征’”。自1986年開(kāi)始，日本豐田公司推出了P系列1-3型機(jī)器人，在1997年推出了“P3”和2000年推出了“ASIMO”，“ASIMO”除了優(yōu)化步行方式外，還增加了對(duì)手部的操作和控制。同年，日本索尼于2000年推出人形娛樂(lè)機(jī)器人SDR-3X，該機(jī)器人較以往產(chǎn)品最大的區(qū)別在于配備了聲音識(shí)別和圖像識(shí)別功能，可以根據(jù)音樂(lè)實(shí)現(xiàn)節(jié)奏運(yùn)動(dòng)。豐田和索尼公司推出的新一代人形機(jī)器人，將仿人機(jī)器人的研制和生產(chǎn)正式推向?qū)嵱没?、工程化和市?chǎng)化。人形機(jī)器人的“百花齊放階段”（2010至今）。這一階段的人形機(jī)器人特征為“智能化”，研發(fā)重點(diǎn)從之前的“賦予機(jī)器人更多其他的‘仿人特征’”到“機(jī)器人如何衍生自主決策能力”。海外方面，波士頓動(dòng)力、特斯拉、EngineeredArts、軟銀等海外科技企業(yè)紛紛發(fā)布自主研發(fā)的人形機(jī)器人，比如2015年軟銀率先實(shí)現(xiàn)人形機(jī)器人的商業(yè)化進(jìn)程、2021年波士頓動(dòng)力展示運(yùn)動(dòng)能力出色的Atlas、2022年特斯拉發(fā)布Optimus原型機(jī)等。國(guó)內(nèi)方面，小米、優(yōu)必選、傅利葉智能等廠商也積極入局。該階段的人形機(jī)器人除了運(yùn)動(dòng)模塊和感知模塊更為成熟外，最突出的特點(diǎn)就是大模型的應(yīng)用，機(jī)器人的訓(xùn)練速度和效率大大提高、強(qiáng)化機(jī)器人的自主決策能力。1.2.以工業(yè)類(lèi)為代表的產(chǎn)品持續(xù)迭代人形機(jī)器人發(fā)展至今，涌現(xiàn)出適用于各種應(yīng)用場(chǎng)景的產(chǎn)品，按照目前主流的場(chǎng)景應(yīng)用分類(lèi)，可大致分為工業(yè)類(lèi)、娛樂(lè)&服務(wù)類(lèi)等兩大類(lèi)，對(duì)應(yīng)用在工業(yè)場(chǎng)景、家庭&商業(yè)場(chǎng)景。工業(yè)類(lèi)人形機(jī)器人主要用于處理物流、制造、安保和復(fù)雜任務(wù)等領(lǐng)域的工業(yè)場(chǎng)景，替代的是低級(jí)和高危人工勞動(dòng)、以及部分傳統(tǒng)工業(yè)機(jī)器人無(wú)法勝任的工種，比如流水線的后道工序。娛樂(lè)類(lèi)主要實(shí)現(xiàn)情感交互和表演展覽等場(chǎng)景，而服務(wù)類(lèi)則主要是從事家庭服務(wù)、教育、引導(dǎo)、送餐等場(chǎng)景。1.2.1.工業(yè)類(lèi)的代表之作由于工業(yè)場(chǎng)景相較于家庭、商用場(chǎng)景而言，環(huán)境的可預(yù)測(cè)、可控性更強(qiáng)以及機(jī)器人自身造成危害的影響性更低，對(duì)處于發(fā)展初期的人形機(jī)器人而言，工業(yè)場(chǎng)景的容錯(cuò)率相對(duì)更高，因此比較適合廠商作為人形機(jī)器人投放的第一站?？v觀近幾年的機(jī)器人新品，工業(yè)類(lèi)產(chǎn)品進(jìn)展也相對(duì)較快，比如波士頓動(dòng)力的Atlas、特斯拉的Optimus、AgilityRobotics的Digit等。波士頓動(dòng)力：成立于1992年，公司先后借助美國(guó)軍方、谷歌、軟銀、現(xiàn)代集團(tuán)等股東的支持，陸續(xù)發(fā)布了BigDog、LittleDog、Cheetah、Spot等四足機(jī)器狗和Atlas等雙足機(jī)器人。于2022年和母公司現(xiàn)代汽車(chē)共同成立了BDAII（波士頓動(dòng)力人工智能研究所），目標(biāo)是“引領(lǐng)人工智能和機(jī)器人技術(shù)的進(jìn)步”，目前在圍繞Spot和Stretch這類(lèi)機(jī)器人的商業(yè)道路和獨(dú)立的完全專注于Atlas的技術(shù)研究道路兩條路線上齊頭并進(jìn)。Atlas：高約1.5米，重80公斤，擁有28個(gè)自由度，主動(dòng)力來(lái)源為電池，驅(qū)動(dòng)方式為液壓，配備RGB與深度相機(jī)，機(jī)器人本體共搭載3臺(tái)NUC/工控機(jī)負(fù)責(zé)整體控制系統(tǒng)的運(yùn)算。Atlas最突出的亮點(diǎn)是能實(shí)現(xiàn)像人一樣奔跑、跳躍和跨越障礙，而實(shí)現(xiàn)這種跑酷動(dòng)作的核心源于其獨(dú)特的感知、規(guī)劃、驅(qū)動(dòng)以及驅(qū)動(dòng)背后的制造技術(shù)。感知能力：基于配備的RGB攝像頭和TOF深度傳感器，Atlas能快速生成環(huán)境的點(diǎn)云，再使用一種名為多平面分割的算法從點(diǎn)云中提取平面，機(jī)器人中的映射系統(tǒng)將算法獲取的信息構(gòu)建模型，從而輔助后續(xù)的行為規(guī)劃。規(guī)劃能力：一方面，設(shè)計(jì)人員通過(guò)離線優(yōu)化，為Atlas不斷創(chuàng)建新的運(yùn)動(dòng)軌跡，而在這些給定的軌跡設(shè)計(jì)下，Atlas會(huì)在實(shí)際行動(dòng)中盡量選擇與之匹配的行為動(dòng)作，從而減少相關(guān)的計(jì)算量，提升運(yùn)動(dòng)準(zhǔn)確性。另一方面，在實(shí)際的運(yùn)動(dòng)過(guò)程中，Atlas會(huì)使用MPC（模型預(yù)測(cè)控制器，該控制器使用機(jī)器人動(dòng)力學(xué)模型來(lái)預(yù)測(cè)機(jī)器人未來(lái)的動(dòng)作并計(jì)算出當(dāng)前要做的最優(yōu)動(dòng)作）來(lái)調(diào)整實(shí)時(shí)的力、姿勢(shì)和行為時(shí)間等細(xì)節(jié)，以完成“沒(méi)有見(jiàn)過(guò)的動(dòng)作”。進(jìn)一步而言，MPC的預(yù)測(cè)特性還允許Atlas跨越行為邊界來(lái)查看后續(xù)動(dòng)作，使得機(jī)器人能實(shí)現(xiàn)從一個(gè)動(dòng)作到另一個(gè)動(dòng)作的平滑過(guò)渡。運(yùn)動(dòng)能力：在完成感知和動(dòng)作規(guī)劃后，機(jī)器人要“跑起來(lái)”，而液壓系統(tǒng)為Atlas產(chǎn)生了強(qiáng)大的推力，在同樣的空間內(nèi)，用液壓元件所做的功是電機(jī)的數(shù)倍甚至是數(shù)十倍，因此液壓系統(tǒng)能幫助機(jī)器人實(shí)現(xiàn)奔跑、跳躍、后空翻等高難度的動(dòng)作。制造技術(shù)：感知、規(guī)劃、運(yùn)動(dòng)是Atlas跑酷的核心程序，而這些動(dòng)作實(shí)現(xiàn)的背后離不開(kāi)“如何將重達(dá)80kg的物體推上天”的制造技術(shù)。波士頓動(dòng)力將3D打印應(yīng)用于制造Atlas機(jī)器人的液壓動(dòng)力單元（HPU），用于生產(chǎn)穩(wěn)態(tài)控制器、傳感器、過(guò)濾器、排污閥等部件，好處是可以制造緊湊、輕量型閥塊，極大減輕重量并提高空間利用率，從而賦予Atlas跳躍和翻騰所需的強(qiáng)度/重量比。AgilityRobotics：成立于2015年，公司以生產(chǎn)腿部行走機(jī)器人為主，專門(mén)為物流和制造企業(yè)提供倉(cāng)庫(kù)機(jī)器人，以應(yīng)對(duì)季節(jié)性需求波動(dòng)造成的勞動(dòng)力短缺，主要是可以協(xié)助人工完成卸貨搬箱、管理貨架、最后一公里配送等任務(wù)。Digit：高約1米，重31公斤，擁有18個(gè)自由度。Digit在高難度動(dòng)作、復(fù)雜環(huán)境適應(yīng)等高階維度可能不如波士頓動(dòng)力的Atlas以及特斯拉的Optimus，但是作為倉(cāng)儲(chǔ)的搬運(yùn)機(jī)器人，其突出的特點(diǎn)就是“實(shí)用”，即能在不充電情況下“暴走”5km，意味著Digit能較好地自適應(yīng)工廠中的各種復(fù)雜場(chǎng)地和實(shí)現(xiàn)高續(xù)航能力，完美適配特定場(chǎng)所的使用需求，而能實(shí)現(xiàn)穩(wěn)定敏捷的運(yùn)動(dòng)，核心源于其深度學(xué)習(xí)能力和獨(dú)特的運(yùn)動(dòng)設(shè)計(jì)。學(xué)習(xí)能力：讓Digit學(xué)會(huì)走路，需要用到強(qiáng)化學(xué)習(xí)和模仿學(xué)習(xí)。其中，強(qiáng)化學(xué)習(xí)解決馬爾可夫決策過(guò)程（MarkovDecisionProcess,MDP）的最優(yōu)策略，需要用到策略梯度算法；而模仿學(xué)習(xí)則需要解決參數(shù)策略問(wèn)題。用關(guān)鍵算法DASS來(lái)搞定數(shù)據(jù)集，再將DASS于強(qiáng)化學(xué)習(xí)、模仿學(xué)習(xí)結(jié)合在一起，為機(jī)器人設(shè)定策略。通過(guò)強(qiáng)化學(xué)習(xí)和模擬學(xué)習(xí)，訓(xùn)練雙足機(jī)器人模擬及適應(yīng)不同高度的地面變化，而且只需要稍加改變現(xiàn)有的平地強(qiáng)化學(xué)習(xí)框架，就可以在樓梯、不平的地面等場(chǎng)景中穩(wěn)健地行走。運(yùn)動(dòng)設(shè)計(jì)：在下肢架構(gòu)上，Digit及其第一代產(chǎn)品Cassie最大的特點(diǎn)就是他的“鴕鳥(niǎo)腿”，在動(dòng)力學(xué)部分參考了鳥(niǎo)類(lèi)步態(tài)，尤其是鴕鳥(niǎo)，膝蓋設(shè)計(jì)成彎曲形狀，能以比較自然的方式去減緩震動(dòng)。同時(shí)在自由度配置上，Digit在下肢也配備了較多的自由度，每條腿5個(gè)自由度，其中臀部3個(gè)，允許腿向前、后、側(cè)三個(gè)方向擺動(dòng)，脛骨和腳踝各1個(gè)自由度，但區(qū)別于臀部由電機(jī)驅(qū)動(dòng)，后兩者是附著在彈簧上，有助于機(jī)器人在遇到障礙物時(shí)也能保持平衡。另外，DigitV2版本還對(duì)足部進(jìn)行了優(yōu)化，增加了橫滾自由度，使得Digit可以在不進(jìn)行側(cè)向踩踏的條件下抵抗側(cè)向力沖擊，甚至可以實(shí)現(xiàn)單腳的靜態(tài)平衡。1.2.2.娛樂(lè)&服務(wù)類(lèi)的代表之作工業(yè)類(lèi)人形機(jī)器人側(cè)重點(diǎn)在“工作”，而娛樂(lè)&服務(wù)類(lèi)則著重在“交互”，前者更多是在傳統(tǒng)工業(yè)機(jī)器人基礎(chǔ)上增加“人形態(tài)”，使得機(jī)器人更適合替代人類(lèi)工作，而后者在某種意義層面更符合“仿人機(jī)器人”的概念本質(zhì)---能成為“人”。EngineeredArts：成立于2005年，公司至今推出了6款機(jī)器人，最新型號(hào)Ameca是EngineeredArts機(jī)器人技術(shù)的集大成者。公司的產(chǎn)品已用于娛樂(lè)與教育行業(yè)。Ameca：高1.87米，重49公斤，擁有51個(gè)主要關(guān)節(jié)并配置52個(gè)電動(dòng)馬達(dá)。Ameca最突出的特點(diǎn)就是能實(shí)現(xiàn)復(fù)雜的臉部表情管理，而這樣逼真的仿人表情核心在于結(jié)合了AI與AB（ArtificialBody）技術(shù)。此外，Ameca在近期接入了GPT-4訓(xùn)練其語(yǔ)言能力、嵌入了StableDiffusion賦予了自身繪畫(huà)能力。因此，可以看到Ameca除了運(yùn)動(dòng)能力外，在各方面都不斷逼近人類(lèi)的真實(shí)行為。而Ameca能實(shí)現(xiàn)這樣的動(dòng)作表現(xiàn)，離不開(kāi)其底層系統(tǒng)，包括機(jī)器人操作系統(tǒng)Tritium和工程藝術(shù)系統(tǒng)Mesmer。Tritium：該系統(tǒng)類(lèi)似于“大腦”，主要負(fù)責(zé)智能化和各個(gè)機(jī)械結(jié)構(gòu)之間的聯(lián)動(dòng)。Tritium可以直接在瀏覽器運(yùn)行，適用幾乎任何編碼語(yǔ)言和多種軟件，登錄后即可快速處理各種數(shù)據(jù)，遠(yuǎn)程控制機(jī)器人面部、頭頸、四肢等的各方面組件，使得機(jī)器人適應(yīng)環(huán)境的突然變化并即時(shí)做出響應(yīng)，保證人機(jī)交互的安全和樂(lè)趣。Mesmer：該系統(tǒng)負(fù)責(zé)展現(xiàn)身而為人的“靈魂”，像是給出人類(lèi)的情緒表情和肢體語(yǔ)言。為了讓Ameca看起來(lái)像人，Mesmer平臺(tái)首先解決的是關(guān)節(jié)問(wèn)題，通過(guò)對(duì)頸部的設(shè)計(jì)，讓頭部可順滑轉(zhuǎn)移到任何方位，其次是通過(guò)搭配LIDAR設(shè)計(jì)偵測(cè)移動(dòng)物體，讓機(jī)器人能一直注視和它說(shuō)話的人類(lèi)，然后通過(guò)對(duì)手臂、手腕、肩部等部位的設(shè)計(jì)，讓機(jī)器人能做出微妙的肢體語(yǔ)言，比如“聳肩”，最后搭配上人工皮膚，使得Ameca從語(yǔ)言表達(dá)到行為動(dòng)作，都表現(xiàn)得和人一樣流暢自然。2.問(wèn)題&變化：政策扶持加碼，軟件端迎來(lái)奇點(diǎn)人形機(jī)器人從提出概念到最近一年各廠商最新型號(hào)的推出，已經(jīng)邁過(guò)了60個(gè)年頭，發(fā)展階段也從“萌芽”到現(xiàn)今的“百花齊放”，工業(yè)類(lèi)出現(xiàn)了以波士頓動(dòng)力、特斯拉為代表的優(yōu)秀產(chǎn)品，娛樂(lè)&服務(wù)類(lèi)進(jìn)展也持續(xù)推進(jìn)，特別是最近幾年，人形機(jī)器人的產(chǎn)業(yè)發(fā)展持續(xù)超乎市場(chǎng)預(yù)期。而站在當(dāng)前時(shí)點(diǎn)，我們可以看到整個(gè)人形機(jī)器人產(chǎn)業(yè)自上而下都出現(xiàn)了推動(dòng)產(chǎn)業(yè)和產(chǎn)品向下一階段演變的新變化，另一方面從產(chǎn)品本身角度來(lái)看，人形機(jī)器人也存在不少的問(wèn)題有待解決。具體而言：產(chǎn)業(yè)維度：今年以來(lái)，國(guó)內(nèi)針對(duì)人形機(jī)器人的政策走向更為積極的方向，包括對(duì)產(chǎn)業(yè)的頂層設(shè)計(jì)和產(chǎn)業(yè)鏈的各環(huán)節(jié)扶持都陸續(xù)出臺(tái)了相關(guān)政策，人形機(jī)器人的國(guó)內(nèi)產(chǎn)業(yè)環(huán)境正逐步得到優(yōu)化，我們認(rèn)為，此舉或類(lèi)似此前新能源車(chē)和光伏產(chǎn)業(yè)爆發(fā)前夕，政策的持續(xù)加碼下的產(chǎn)業(yè)正逐步走出平臺(tái)期、邁向下一階段。產(chǎn)品維度：人形機(jī)器人按照系統(tǒng)進(jìn)行劃分，可大致分為感知、控制、執(zhí)行系統(tǒng)，其中感知和控制系統(tǒng)主要依賴算法、模型等軟件，執(zhí)行系統(tǒng)則主要是通過(guò)執(zhí)行器及其中的零部件來(lái)實(shí)現(xiàn)。軟件端，隨著近年來(lái)大模型的爆發(fā)性發(fā)展，機(jī)器人的算法訓(xùn)練、感知能力和人機(jī)交互等方面都得到極大地改善，可以說(shuō)軟件端在這一輪AI革命中迎來(lái)了奇點(diǎn)時(shí)刻，機(jī)器人作為AI技術(shù)的載體也跟隨AI的變革出現(xiàn)了巨大變化。硬件端，相較于軟件端的問(wèn)題不斷得到優(yōu)化，機(jī)器人在下肢行走和手部集成等方面上仍存在一定的硬件問(wèn)題。簡(jiǎn)而言之，我們認(rèn)為，雖然硬件端的問(wèn)題有待完善，但受益于產(chǎn)業(yè)維度的政策催化和產(chǎn)品維度的軟件優(yōu)化，人形機(jī)器人產(chǎn)業(yè)應(yīng)該會(huì)比之前的三個(gè)發(fā)展階段“走得更快”，更多的優(yōu)秀產(chǎn)品也有望加速落地，推動(dòng)人形機(jī)器人最終走向人類(lèi)社會(huì)。2.1.產(chǎn)業(yè)維度：國(guó)內(nèi)政策不斷加碼今年以來(lái)，針對(duì)機(jī)器人以及人形機(jī)器人的政策呈現(xiàn)顯著變化。一是從數(shù)量維度來(lái)看，2023年提出的相關(guān)文件明顯要比往年更多，根據(jù)不完全統(tǒng)計(jì)，今年出臺(tái)的政策文件共計(jì)6份，而2019-2022年間共計(jì)出臺(tái)的相關(guān)政策文件才8份，可以看到國(guó)家在對(duì)機(jī)器人產(chǎn)業(yè)的扶持力度上不斷加碼；二是發(fā)布政策的部門(mén)由中央層面逐步擴(kuò)散到地方層面，比如在2019-2022年，發(fā)行部門(mén)均為包括發(fā)改委、工信部、科技部等部委級(jí)以上的單位，但是今年以來(lái)，包括上海、深圳、北京等一線城市均出臺(tái)了相關(guān)的機(jī)器人行動(dòng)方案，我們認(rèn)為此舉意味著各地政府開(kāi)始深入落實(shí)國(guó)家對(duì)于機(jī)器人產(chǎn)業(yè)的支持指導(dǎo)，有望加速機(jī)器人產(chǎn)業(yè)的落地，推動(dòng)相關(guān)企業(yè)在主流城市的發(fā)展；三是從政策的內(nèi)容來(lái)看，今年以來(lái)出臺(tái)的政策更多提及“人形機(jī)器人”這一概念，而非籠統(tǒng)的“機(jī)器人”，比如北京的《行動(dòng)方案》中，提及“對(duì)標(biāo)國(guó)際領(lǐng)先人形機(jī)器人產(chǎn)品，支持企業(yè)和高校院所開(kāi)展人形機(jī)器人整機(jī)產(chǎn)品、關(guān)鍵零部件攻關(guān)和工程化，加快建設(shè)北京市人形機(jī)器人產(chǎn)業(yè)創(chuàng)新中心，爭(zhēng)創(chuàng)國(guó)家制造業(yè)創(chuàng)新中心?！保梢钥闯?，政策的重點(diǎn)從最初聚焦在傳統(tǒng)工業(yè)機(jī)器人逐步擴(kuò)散到人形機(jī)器人上面。進(jìn)一步而言，即使是今年發(fā)布的機(jī)器人政策也呈現(xiàn)出顯著變化。我們將北京市在6月28日發(fā)布的《北京市機(jī)器人產(chǎn)業(yè)創(chuàng)新發(fā)展行動(dòng)方案（2023—2025年）》，與之前上海、深圳、山東等省市發(fā)布的相關(guān)政策作對(duì)比，可以發(fā)現(xiàn)，最明顯的區(qū)別在于：之前的政策更多是立足在頂層設(shè)計(jì)維度對(duì)機(jī)器人及人形機(jī)器人產(chǎn)業(yè)作出指導(dǎo)，對(duì)產(chǎn)業(yè)在發(fā)展趨勢(shì)上提供了建議，而北京的《行動(dòng)方案》除了頂層設(shè)計(jì)外，特別地將人形機(jī)器人產(chǎn)業(yè)鏈中重要的零部件單獨(dú)提出來(lái)，包括減速器、伺服驅(qū)動(dòng)系統(tǒng)、控制器、傳感器、末端執(zhí)行器等，對(duì)其也同樣提出了對(duì)應(yīng)的指導(dǎo)意見(jiàn)。我們認(rèn)為，北京的《行動(dòng)方案》有著更為重要的意義，一是代表著產(chǎn)業(yè)政策從頂層設(shè)計(jì)落腳到具體的產(chǎn)業(yè)鏈環(huán)節(jié)，為各地方政府對(duì)相關(guān)企業(yè)的扶持提供了更為明確的指導(dǎo)和要求，加速具體細(xì)則的落地；二是重點(diǎn)提及人形機(jī)器人產(chǎn)業(yè)鏈中的關(guān)鍵環(huán)節(jié)，對(duì)技術(shù)難度大且價(jià)值量高的零部件環(huán)節(jié)和企業(yè)提供支持，有望進(jìn)一步完善我國(guó)人形機(jī)器人產(chǎn)業(yè)鏈，為后續(xù)產(chǎn)業(yè)鏈降本奠定基礎(chǔ)，加速下游人形機(jī)器人產(chǎn)品的迭代和商業(yè)化落地。2.2.產(chǎn)品維度：軟件端迎來(lái)奇點(diǎn)，硬件端有待優(yōu)化2.2.1.軟件端：AI賦能機(jī)器人在人形機(jī)器人的產(chǎn)品層面，軟件端的變化顯得尤為突出，特別是AI技術(shù)的發(fā)展，逐步滲透到機(jī)器人研發(fā)和生產(chǎn)中，并在算法訓(xùn)練、感知能力、人機(jī)交互等多個(gè)維度對(duì)人形機(jī)器人產(chǎn)生重大影響。2.2.1.1.算法訓(xùn)練在現(xiàn)實(shí)世界中構(gòu)建機(jī)器人需要從頭開(kāi)始創(chuàng)建數(shù)據(jù)集，這樣做既耗時(shí)又耗費(fèi)成本，并且訓(xùn)練速度較慢。開(kāi)發(fā)人員為了降低成本并加快訓(xùn)練，逐步開(kāi)始采用合成數(shù)據(jù)生成（SDG）、預(yù)訓(xùn)練AI模型（pretrainedAImodels）、機(jī)器人仿真（roboticssimulation）、遷移學(xué)習(xí)（transferlearning）等一系列工具。而以英偉達(dá)、谷歌為代表的大廠近幾年在這些工具開(kāi)發(fā)上均取得較好進(jìn)展，為機(jī)器人客戶在研發(fā)和訓(xùn)練上提供更為成熟的工具。1）英偉達(dá)Isaac是英偉達(dá)推出的一款專門(mén)用于機(jī)器人環(huán)境模擬的引擎，提供從數(shù)據(jù)合成和訓(xùn)練、到仿真和測(cè)試的全流程配套支持，他融合了機(jī)器人相關(guān)的深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、SLAM、圖像處理等的算法?；谟ミ_(dá)強(qiáng)大的硬件支持，相較于此前常用的仿真器（VREP、ROS等），Isaac在性能、算法、渲染效果、生態(tài)支持等維度都明顯更為出色。數(shù)據(jù)合成：IsaacSim是英偉達(dá)的一個(gè)機(jī)器人模擬應(yīng)用程序及合成數(shù)據(jù)生成的工具，而IsaacSimReplicator作為其中用于合成數(shù)據(jù)生成的引擎，可以生成物理級(jí)精確的3D合成數(shù)據(jù)，用以加速AI感知模型的訓(xùn)練和性能。?模型訓(xùn)練：NVIDIANGC匯集了通過(guò)GPU優(yōu)化的AI軟件、模型和JupyterNotebook示例，包括各種預(yù)訓(xùn)練模型以及為NVIDIAAI平臺(tái)優(yōu)化的AI基準(zhǔn)和訓(xùn)練方式。研發(fā)人員通過(guò)NVIDIANGC選擇合適的預(yù)訓(xùn)練AI模型后，通過(guò)NVIDIATAO進(jìn)行進(jìn)一步的訓(xùn)練和微調(diào)（NVIDIATAO作為一個(gè)可使用自定義數(shù)據(jù)訓(xùn)練、調(diào)整和優(yōu)化的框架，使用NVIDIATAO工具包能幫助研發(fā)人員微調(diào)NVIDIANGC目錄中的預(yù)訓(xùn)練AI模型）。仿真和測(cè)試：研發(fā)人員通過(guò)使用仿真器，檢測(cè)物體之間的潛在碰撞和識(shí)別碰撞物體之間的接觸點(diǎn)，并計(jì)算機(jī)器人的傳感器信號(hào)，借此來(lái)構(gòu)建虛擬場(chǎng)景，在這個(gè)虛擬世界中，開(kāi)發(fā)人員創(chuàng)建了機(jī)器人、環(huán)境以及機(jī)器人可能遇到的其他資產(chǎn)的數(shù)字版本。這些環(huán)境可以遵守物理定律，并模仿現(xiàn)實(shí)世界的重力、摩擦、材料和照明條件。在所構(gòu)建的虛擬場(chǎng)景中，研發(fā)人員通過(guò)此前搭建的預(yù)訓(xùn)練模型進(jìn)行運(yùn)動(dòng)規(guī)劃和任務(wù)規(guī)劃，并讓機(jī)器人執(zhí)行任務(wù)。在對(duì)虛擬場(chǎng)景中執(zhí)行任務(wù)的機(jī)器人進(jìn)行多次試錯(cuò)和調(diào)整，以此不斷優(yōu)化控制信號(hào)，從而驗(yàn)證和優(yōu)化機(jī)器人的設(shè)計(jì)、系統(tǒng)及其算法，為機(jī)器人在現(xiàn)實(shí)世界執(zhí)行任務(wù)實(shí)現(xiàn)最高效率打下基礎(chǔ)。至此，英偉達(dá)的Isaac平臺(tái)從數(shù)據(jù)合成、模型訓(xùn)練到仿真測(cè)試等提供了全流程的配套支持，幫助機(jī)器人客戶實(shí)現(xiàn)0-1構(gòu)建一個(gè)機(jī)器人，并大大降低了訓(xùn)練的成本和提高了機(jī)器人訓(xùn)練的速度。2）谷歌2023年6月20日，發(fā)布名為Robocat的AI模型，作為世界上第一個(gè)能解決和適應(yīng)多種任務(wù)的模型，能安裝在不同的現(xiàn)實(shí)機(jī)器人上使用。Robocat是一個(gè)用于機(jī)器人操作的能實(shí)現(xiàn)自我迭代的智能體，可以在虛擬和現(xiàn)實(shí)世界中實(shí)現(xiàn)多項(xiàng)任務(wù)，包括對(duì)文字、圖像、語(yǔ)音等的處理。Robocat最大的特點(diǎn)是在于“自我迭代”，所謂的自我迭代是指基于一定數(shù)量的源于現(xiàn)實(shí)世界的數(shù)據(jù)集，對(duì)該數(shù)據(jù)集進(jìn)行微調(diào)后衍生出新的數(shù)據(jù)集，將現(xiàn)實(shí)世界和衍生出來(lái)的數(shù)據(jù)集進(jìn)行融合，并在此基礎(chǔ)上進(jìn)行新的訓(xùn)練，以此循環(huán)反復(fù)繼而不斷擴(kuò)充智能體的學(xué)習(xí)數(shù)據(jù)。具體來(lái)說(shuō)，每個(gè)新任務(wù)的學(xué)習(xí)遵循5個(gè)步驟：1.使用由人類(lèi)控制的機(jī)械臂收集100-1000個(gè)新任務(wù)或機(jī)器人的演示；2.在這個(gè)新的任務(wù)/手臂上微調(diào)RoboCat，創(chuàng)建一個(gè)專門(mén)的衍生代理；3.衍生代理在這個(gè)新任務(wù)/手臂上平均練習(xí)10000次，生成更多的訓(xùn)練數(shù)據(jù)；4.將演示數(shù)據(jù)和自生成數(shù)據(jù)整合到RoboCat現(xiàn)有的訓(xùn)練數(shù)據(jù)集中；5.在新訓(xùn)練數(shù)據(jù)集上訓(xùn)練新版本的RoboCat。而且這樣的“自我迭代”具備良性循環(huán)的訓(xùn)練：學(xué)習(xí)的新任務(wù)越多，它學(xué)習(xí)其他新任務(wù)的能力就越好。RoboCat的初始版本在以前看不見(jiàn)的任務(wù)上只有36%的時(shí)間成功，每個(gè)任務(wù)從500個(gè)演示中學(xué)習(xí)。但是最新的RoboCat，它已經(jīng)訓(xùn)練了更多樣化的任務(wù)，在相同的任務(wù)上，成功率增加了一倍多。簡(jiǎn)而言之，RoboCat作為目前為止機(jī)器人控制AI模型的“最優(yōu)形態(tài)”，核心優(yōu)勢(shì)在于在合成數(shù)據(jù)生成維度的跳躍式發(fā)展，能快速根據(jù)模擬和現(xiàn)實(shí)世界中收集到的圖像和動(dòng)作數(shù)據(jù)進(jìn)行訓(xùn)練，大大降低了機(jī)器人對(duì)新任務(wù)的學(xué)習(xí)時(shí)間和障礙，極大地提高了訓(xùn)練效率。2.2.1.2.感知能力人形機(jī)器人的感知是指通過(guò)各種傳感器的信息收集，將被測(cè)量的環(huán)境信息轉(zhuǎn)化為電信號(hào)或其他所需的形式，然后經(jīng)過(guò)數(shù)據(jù)處理階段，輸送到不同的感知算法，為機(jī)器人后續(xù)的規(guī)劃、控制階段提供支持。機(jī)器人的傳感器按照類(lèi)別可以分為多種，包括視覺(jué)傳感器、力矩傳感器、觸覺(jué)傳感器、聽(tīng)覺(jué)傳感器等，雖然每個(gè)傳感器的功能都不一，但是當(dāng)機(jī)器人執(zhí)行某一動(dòng)作時(shí)有可能需要同時(shí)用到多種傳感器的信息，比如用于識(shí)別環(huán)境時(shí)，需要使用攝像頭、激光雷達(dá)、毫米波雷達(dá)等傳感器，機(jī)器人才能比較精準(zhǔn)地確定物體的信息并進(jìn)行后續(xù)的操作。因此，如何融合多個(gè)傳感器的信息，并通過(guò)感知算法同時(shí)處理多維度信息，是人形機(jī)器人在運(yùn)動(dòng)規(guī)劃和感知能力上需要解決的問(wèn)題。多傳感器融合（Multi-sensorFusion,MSF），是指利用計(jì)算機(jī)技術(shù)，將來(lái)自多傳感器或多源的信息和數(shù)據(jù)以一定的準(zhǔn)則進(jìn)行自動(dòng)分析和綜合，以完成所需的決策和估計(jì)而進(jìn)行的信息處理過(guò)程。和人的感知相似，不同的傳感器擁有其他傳感器不可替代的作用，當(dāng)各種傳感器進(jìn)行多層次，多空間的信息互補(bǔ)和優(yōu)化組合處理，最終產(chǎn)生對(duì)觀測(cè)環(huán)境的一致性解釋。傳感器融合能幫助機(jī)器人提高識(shí)別精度、增強(qiáng)魯棒性、擴(kuò)展覆蓋范圍。AI大模型將優(yōu)化多傳感器融合技術(shù)。按照信息融合架構(gòu)進(jìn)行劃分，可以將傳感器融合技術(shù)分為分布式、集中式和混合式，或者可以分為后融合算法和前融合算法，或者可以分為數(shù)據(jù)級(jí)、特征級(jí)和決策級(jí)融合。其中，目前常用的是分布式/后融合算法，其核心思想是每個(gè)傳感器都有自己獨(dú)立處理的目標(biāo)數(shù)據(jù)，融合模塊將對(duì)各傳感器的濾波結(jié)果進(jìn)行有效結(jié)合，而集中式/前融合算法則相反，使用一個(gè)感知算法對(duì)多維綜合感知數(shù)據(jù)進(jìn)行處理。在以往算力受限和模型發(fā)展不成熟的情況下，使用分布式/后融合算法能在犧牲一定精度的同時(shí)降低算法復(fù)雜度，但由于不同傳感器的數(shù)據(jù)類(lèi)型不一，系統(tǒng)穩(wěn)定性也會(huì)因此受到影響，而且受限于單一類(lèi)型傳感器的能力上限，后融合算法會(huì)導(dǎo)致特定條件下的偶發(fā)性漏檢或誤檢。而隨著算力的提升和多模態(tài)大模型的發(fā)展，數(shù)據(jù)級(jí)/集中式/前融合算法的缺點(diǎn)有望得到彌補(bǔ)，比如集中式融合存在因中央處理單元性能不足導(dǎo)致通信延遲和計(jì)算瓶頸的問(wèn)題，而AI大模型的算力提升將解決這一點(diǎn)，從而將目前主流的融合算法方案從后融合/分布式/決策級(jí)推向前融合/集中式/數(shù)據(jù)級(jí)，數(shù)據(jù)級(jí)的傳感融合也能減少感知過(guò)程中原始數(shù)據(jù)的信息損失而提高感知精度，提高數(shù)據(jù)處理的準(zhǔn)確性?；赥ransFormers模型的多傳感器融合技術(shù)率先在自動(dòng)駕駛領(lǐng)域得到應(yīng)用。TransFormers作為可能取代CNN和RNN的深度學(xué)習(xí)模型，能快速地完成對(duì)大量數(shù)據(jù)的特征提取，使得大模型在多模態(tài)信息處理上的能力得到不斷強(qiáng)化。而TransFormers需要海量訓(xùn)練數(shù)據(jù)，而大模型和更大參數(shù)量級(jí)的發(fā)展將推動(dòng)TransFormers模型的完善，驅(qū)動(dòng)數(shù)據(jù)級(jí)的感知算法進(jìn)一步優(yōu)化。特斯拉在2021年的AIDay上率先發(fā)布BEV+TransFormers算法，基于“輸入-提取-轉(zhuǎn)換-融合-時(shí)序-輸出”的思路，實(shí)現(xiàn)“2D-3D-4D”的轉(zhuǎn)換。2.2.1.3.人機(jī)交互AI大模型對(duì)機(jī)器人在人機(jī)交互層面的影響除了能實(shí)現(xiàn)更好的對(duì)話交流，讓機(jī)器人執(zhí)行語(yǔ)言任務(wù)外，更為重要的影響是在于能將人類(lèi)傳遞的自然語(yǔ)言轉(zhuǎn)化為執(zhí)行任務(wù)的指令，讓機(jī)器人能根據(jù)指令反饋物理操作。1）語(yǔ)言任務(wù)近年來(lái)，大型語(yǔ)言模型（LLM）在語(yǔ)言生成和理解方面取得了重大進(jìn)展，LLM的使用幫助機(jī)器人更好地理解和學(xué)習(xí)人類(lèi)語(yǔ)言，并根據(jù)人類(lèi)的意圖和語(yǔ)氣，進(jìn)行語(yǔ)音交流和反饋。比如，波士頓動(dòng)力將ChatGPT安裝到機(jī)器狗Spot中，Spot能根據(jù)工作人員的問(wèn)題作出相應(yīng)的回答，并且能根據(jù)機(jī)器狗自身的實(shí)際情況，將信息反饋給工作人員，例如當(dāng)被問(wèn)及下一次任務(wù)的檢查次數(shù)時(shí)，Spot能準(zhǔn)確回答次數(shù)。除了能反饋語(yǔ)音信息外，機(jī)器人還可以根據(jù)所表達(dá)的語(yǔ)言，傳遞面部表情，例如，EngineeredArts將GPT-4接入到Ameca中，Ameca不僅能流暢地和人類(lèi)進(jìn)行交流，還會(huì)根據(jù)聊天的內(nèi)容作出相應(yīng)的面部表情，包括皺眉、吃驚、生氣、眨眼等。2）物理任務(wù)更進(jìn)一步而言，我們其實(shí)不僅希望LLM在機(jī)器人中的角色僅僅作為一個(gè)“語(yǔ)音助手”，對(duì)外界輸入的信息作出包括語(yǔ)言、圖片甚至表情等的輸出反饋，更是希望輸入的語(yǔ)音信息如何轉(zhuǎn)化為能使機(jī)器人主體在現(xiàn)實(shí)世界中作出物理行為。簡(jiǎn)單來(lái)說(shuō)，我們希望LLM幫助機(jī)器人實(shí)現(xiàn)與人的對(duì)話互動(dòng)，以及更為重要的動(dòng)作互動(dòng)。如何實(shí)現(xiàn)機(jī)器人與環(huán)境的物理交互，谷歌在今年推出的視覺(jué)語(yǔ)言模型PaLM-E給出了答案。PaLM-E作為一個(gè)具備5620億個(gè)參數(shù)，集成了視覺(jué)和語(yǔ)言，用于機(jī)器人控制的視覺(jué)語(yǔ)言模型（VLM），與LLM不同之處在于其對(duì)物理世界的感知。PaLM-E能驅(qū)動(dòng)機(jī)器人執(zhí)行任務(wù)，比如當(dāng)人類(lèi)給機(jī)器人一個(gè)高級(jí)指令，PaLM-E可以為機(jī)器人將這一指令生成行動(dòng)規(guī)劃，然后讓機(jī)器人親自執(zhí)行。為什么PaLM-E能實(shí)現(xiàn)這樣的功能？具體來(lái)說(shuō)，PaLM-E是基于谷歌現(xiàn)有的大型語(yǔ)言模型PaLM，通過(guò)添加感官信息和機(jī)器人控制而迭代生成的。因此：一方面，它具備大型語(yǔ)言模型的功能。通過(guò)語(yǔ)言模型將指令分解為一系列文本步驟，同時(shí)訓(xùn)練人員會(huì)為機(jī)器人預(yù)先提供一個(gè)基礎(chǔ)技能庫(kù)，這個(gè)技能庫(kù)包含了一系列的“原子”技能，每個(gè)“原子”技能對(duì)應(yīng)執(zhí)行一個(gè)短任務(wù)。因此當(dāng)機(jī)器人接受到高級(jí)指令時(shí)，會(huì)通過(guò)LLM將其拆分為多個(gè)簡(jiǎn)單動(dòng)作，而且這些簡(jiǎn)單動(dòng)作已經(jīng)存在于訓(xùn)練集中，機(jī)器人只需要把對(duì)應(yīng)的動(dòng)作從訓(xùn)練集中摘取出來(lái)，組成一套行為步驟即可。另一方面，它具備分析圖像和傳感器數(shù)據(jù)的能力。通過(guò)分析機(jī)器人相機(jī)收集的數(shù)據(jù)，PaLM-E可以將這些圖像、語(yǔ)音之類(lèi)的數(shù)據(jù)，編碼成一系列與語(yǔ)言標(biāo)記大小相同的向量，類(lèi)似語(yǔ)言模型處理語(yǔ)言數(shù)據(jù)一樣處理感官數(shù)據(jù)。最后，通過(guò)神經(jīng)網(wǎng)絡(luò)對(duì)機(jī)器人實(shí)現(xiàn)控制。簡(jiǎn)而言之，要實(shí)現(xiàn)機(jī)器人的動(dòng)作互動(dòng)，一是要通過(guò)LLM使機(jī)器人理解人類(lèi)的自然語(yǔ)言，二是通過(guò)VLM使機(jī)器人實(shí)時(shí)理解周?chē)沫h(huán)境以便后續(xù)的任務(wù)操作。因此，在未來(lái)，“LLM+VLM”將成為機(jī)器人作為一個(gè)智能體能夠推理環(huán)境、任務(wù)，并完全根據(jù)語(yǔ)言采取行動(dòng)的核心框架。但是，上述的做法存在一個(gè)較大的問(wèn)題，萬(wàn)一拆分出來(lái)的短任務(wù)并沒(méi)有出現(xiàn)在數(shù)據(jù)集中，那如何處理？即當(dāng)面對(duì)沒(méi)有預(yù)訓(xùn)練樣本的行為動(dòng)作，機(jī)器人該如何執(zhí)行相應(yīng)任務(wù)。針對(duì)這一問(wèn)題，學(xué)術(shù)界最近也提出了新的解決方案，2023年7月12日，李飛飛團(tuán)隊(duì)發(fā)布最新成果展示：通過(guò)大模型的接入，能直接將復(fù)雜指令轉(zhuǎn)化為具體行動(dòng)規(guī)劃，而無(wú)需額外的數(shù)據(jù)和訓(xùn)練。換句話來(lái)說(shuō)，當(dāng)人類(lèi)通過(guò)自然語(yǔ)言向機(jī)器人發(fā)出指令后，機(jī)器人通過(guò)視覺(jué)系統(tǒng)識(shí)別物體并進(jìn)行行動(dòng)規(guī)劃，然后在沒(méi)有預(yù)訓(xùn)練的基礎(chǔ)上執(zhí)行了任務(wù)。2.2.2.硬件端：零部件有待優(yōu)化人形機(jī)器人的執(zhí)行系統(tǒng)由多個(gè)執(zhí)行器組成，而執(zhí)行器主要安裝在機(jī)器人的雙臂和雙腿，幫助機(jī)器人實(shí)現(xiàn)手部操作和腿部移動(dòng)的兩個(gè)主要功能，因此機(jī)器人的硬件端問(wèn)題主要集中在上肢的手部和下肢的腿部?jī)蓚€(gè)部位。2.2.2.1.下肢：行走穩(wěn)定性雖然已經(jīng)有以Atlas為代表的機(jī)器人能實(shí)現(xiàn)十分炫酷的奔跑、跳躍等動(dòng)作，但其實(shí)目前對(duì)于大部分雙足人形機(jī)器人而言，行走穩(wěn)定性仍然難以保證，特別是針對(duì)非直線平面的環(huán)境，機(jī)器人因?yàn)楦兄?、?guī)劃等問(wèn)題仍會(huì)出現(xiàn)失去平衡等現(xiàn)象，而且使用雙足行走的機(jī)器人目前行走緩慢，最高行走速度也只有1-2m/s，比如Optimus最高時(shí)速為5英里/小時(shí)、Atlas時(shí)速為2.5m/s、CyberOne時(shí)速為3.6km/h等。因此，對(duì)于人形機(jī)器人而言，首要問(wèn)題仍是使機(jī)器人“像人一樣行走”---在各種環(huán)境中平穩(wěn)行走甚至奔跑，同時(shí)還擁有較快的速度。而目前看來(lái)，從腳部的傳感器、驅(qū)動(dòng)器的方案到控制器的算法規(guī)劃，都有待進(jìn)一步完善的地方。下面我們主要討論硬件端的問(wèn)題及解決方案，即驅(qū)動(dòng)器和傳感器的情況。1）驅(qū)動(dòng)器存在的問(wèn)題：反射慣性大。為了實(shí)現(xiàn)動(dòng)態(tài)任務(wù)，機(jī)器人的驅(qū)動(dòng)系統(tǒng)需要發(fā)揮出與機(jī)器人總重量相匹配的力，換句話來(lái)說(shuō)，就是機(jī)器人的下肢需要較高的力密度。一般而言，增加執(zhí)行器的轉(zhuǎn)矩密度比較常用的方案是增加減速器的傳動(dòng)比，但這樣做的缺點(diǎn)是增加傳動(dòng)比的同時(shí)會(huì)增加關(guān)節(jié)中的摩擦力和轉(zhuǎn)子的反射慣性，從而降低肢體的反向驅(qū)動(dòng)能力及其調(diào)節(jié)和減輕沖擊的能力。而且更為重要的是，傳動(dòng)比不能無(wú)限地增加，因?yàn)榉聪蝌?qū)動(dòng)性能的下降速度是要明顯快于扭矩密度的增加速度。簡(jiǎn)單來(lái)說(shuō)，目前常用的高齒輪減速比的方案（比如諧波減速器+力矩傳感器）可以使得機(jī)器人的扭矩密度在有限范圍內(nèi)增大，但同時(shí)由于其摩擦力增大和脆弱性提高，機(jī)器人只能比較緩慢地行走。2）力矩傳感器存在的問(wèn)題：負(fù)載能力不足。安裝在機(jī)器人腳部的力矩傳感器是最基本的傳感器，他的作用是測(cè)量施加在其腳上的地面反作用力和力矩，進(jìn)而用于計(jì)算零點(diǎn)矩點(diǎn)，作為控制機(jī)器人行走穩(wěn)定性的重要參數(shù)。但是基于傳感器中的彈性體設(shè)計(jì)等因素，六維力矩傳感器在剛度、測(cè)量精確性、靈敏度等存在不足。特別是剛度問(wèn)題，根據(jù)數(shù)據(jù)統(tǒng)計(jì)，目前六維力矩傳感器的最大力負(fù)載一般僅為機(jī)器人重量的1-2倍（當(dāng)面臨外部干擾或者變化復(fù)雜的地面環(huán)境時(shí)，載荷也隨之下降），一旦承受超出這一范圍的沖擊力（機(jī)器人奔跑時(shí)的負(fù)載范圍較步行時(shí)更小），傳感器或出現(xiàn)故障并影響機(jī)器人的行走。另外，傳感器中的扭矩范圍也受到機(jī)器人重量和腳部尺寸的限制，一般而言，腳踝扭矩要求不大于機(jī)器人重量和腳部尺寸的乘積。解決方案：為了避免傳感器在意外情況下受到損壞，目前業(yè)界一般采用過(guò)載保護(hù)機(jī)制+安裝沖擊吸收部件的組合方案，一是過(guò)載保護(hù)機(jī)制，通過(guò)制動(dòng)器來(lái)實(shí)現(xiàn)斷開(kāi)保護(hù)，二是在傳感器中安裝沖擊吸收部件以減輕機(jī)器人接觸地面時(shí)的反作用力，比如安裝阻尼器、記憶材料、液壓減震器、彈簧等。在《DesignofaHighlyDynamicHumanoidRobot》中也提到，使用定制的足部傳感器僅測(cè)量腳趾和腳跟的垂直反作用力，附加一個(gè)六維的IMU用于測(cè)量地面的接觸狀態(tài)，這樣能減少傳感器的受力負(fù)載，同時(shí)使用線切割來(lái)作為過(guò)載保護(hù)?？傮w而言，目前針對(duì)傳感器載荷能力的問(wèn)題，要么采用減少維度的方式降低受力（比如使用三維力矩傳感器），要么采用增加結(jié)構(gòu)件的方式緩沖受力，這兩種方法雖然一定程度上彌補(bǔ)了傳感器剛度不足的問(wèn)題，但同時(shí)導(dǎo)致測(cè)量精度下降和腿部關(guān)節(jié)模組集成難度增大等問(wèn)題，因此如何根據(jù)人形機(jī)器人的足部特點(diǎn)定制適合的傳感器，最大程度保證行走穩(wěn)定性仍然需要學(xué)術(shù)界和業(yè)界的進(jìn)一步探討。2.2.2.2.手部：零部件集成如果說(shuō)實(shí)現(xiàn)雙腿的平穩(wěn)行走是人形機(jī)器人的第一功能和要求，那么將機(jī)器人推向商業(yè)化的核心就是如何通過(guò)機(jī)器人的雙臂執(zhí)行任務(wù)來(lái)實(shí)現(xiàn)機(jī)器人的商用價(jià)值。人形機(jī)器人的雙臂是實(shí)現(xiàn)大部分工業(yè)操作的工具，因此對(duì)雙臂的要求主要集中感知物體和承載物體兩個(gè)維度，前者幫助機(jī)器人在執(zhí)行任務(wù)前識(shí)別所需要操作的目標(biāo)，后者幫助機(jī)器人在工業(yè)流程中應(yīng)對(duì)各種任務(wù)。具體到硬件端，基于工業(yè)機(jī)械臂的成熟工藝，機(jī)器人在手部構(gòu)成上可借鑒機(jī)械臂的技術(shù)，而區(qū)別在于人形機(jī)器人對(duì)于精細(xì)化操作要求更高，因此需要在傳感器上進(jìn)一步優(yōu)化。目前機(jī)器人的主要問(wèn)題體現(xiàn)在傳感器上，雖然和腿部的硬件類(lèi)似，但是手部對(duì)于傳感器的要求與上述談到的腿部部分有所不同。1）傳感器人形機(jī)器人的靈巧手安裝有多個(gè)不同的傳感器，以騰訊的TRX-Hand為例，手指就結(jié)合了視覺(jué)、接近覺(jué)、觸覺(jué)和力覺(jué)傳感器，而其中觸覺(jué)和力矩傳感器是大多數(shù)靈巧手都會(huì)配置的，用以在接觸物體時(shí)，獲取物體的位置、形狀和受力等信息，使機(jī)器人能感知物體的狀態(tài)并在物體交互時(shí)更為輕柔和自然。存在的問(wèn)題：集成難度大。相對(duì)于腿部而言，手部對(duì)傳感器的集成有更高的要求。比如手部一般具有10-12個(gè)自由度，這就意味著需要將10-12組關(guān)節(jié)模組（包括驅(qū)動(dòng)器、傳感器和結(jié)構(gòu)件等零部件）都集成到手掌，這大大提高了對(duì)零部件的體積和重量的要求。進(jìn)一步而言，光是將觸覺(jué)傳感器集成到手指和指尖就存在不少問(wèn)題，比如機(jī)器人的手和人類(lèi)指骨有所不同，前者的手指近端和中端的距離要比人類(lèi)的短，接觸面積的縮小導(dǎo)致連接困難，而且由于靈活性的原因，觸覺(jué)傳感器不能完全覆蓋手指鏈接之間的空白區(qū)域。又比如，觸覺(jué)傳感器的觸覺(jué)元件增多會(huì)導(dǎo)致讀取和傳輸數(shù)據(jù)的導(dǎo)線增多，導(dǎo)線數(shù)量越多集成難度越大，而將并行連接改為串行連接可以減少導(dǎo)線數(shù)量，但會(huì)導(dǎo)致傳輸速率變慢，等等。解決方案：針對(duì)集成問(wèn)題，目前逐漸被市場(chǎng)所接受的是通過(guò)3D打印技術(shù)將傳感器嵌入機(jī)器人的手指，傳感器之間的緊湊性、堅(jiān)固性以穩(wěn)定性也因此得到提高，常用的材料包括TPU、炭黑、CNT等。另外，研究人員也提出使用欠驅(qū)動(dòng)運(yùn)動(dòng)（underactuatedmovements，當(dāng)致動(dòng)器數(shù)量小于自由度時(shí)，機(jī)器人系統(tǒng)就被稱為欠驅(qū)動(dòng)系統(tǒng)）,通過(guò)減少致動(dòng)器數(shù)量并簡(jiǎn)化結(jié)構(gòu)來(lái)實(shí)現(xiàn)自適應(yīng)抓取，將驅(qū)動(dòng)力傳遞給欠驅(qū)動(dòng)關(guān)節(jié)，從而簡(jiǎn)化了機(jī)械手的組裝，以降低集成難度和成本，等等。3.未來(lái)：應(yīng)用場(chǎng)景&市場(chǎng)空間人形機(jī)器人的應(yīng)用場(chǎng)景會(huì)是哪里？為什么在過(guò)去十年各家科技企業(yè)紛紛染指機(jī)器人賽道，并且花費(fèi)大量的時(shí)間、成本和人力進(jìn)行數(shù)次的試驗(yàn)和測(cè)試。雖然現(xiàn)在基于高昂的成本和不成熟的技術(shù)，人形機(jī)器人的應(yīng)用場(chǎng)景有限，短期也難以激起大量的市場(chǎng)需求，但是我們認(rèn)為，正如馬斯克所說(shuō)，當(dāng)人形機(jī)器人成熟后，機(jī)器人的需求將遠(yuǎn)超汽車(chē)等產(chǎn)品，屆時(shí)機(jī)器人的作用將作為人類(lèi)的“替代工具”，替代人類(lèi)在工業(yè)、家庭、商業(yè)中的部分功能，特別是成本、安全、健康等因素導(dǎo)致人類(lèi)無(wú)法勝任的工種，機(jī)器人的應(yīng)用場(chǎng)景也遍布人類(lèi)生活和工作的多個(gè)地方。比如，人工智能機(jī)器人公司Figure制造通用類(lèi)人形機(jī)器人的目的就是為了解決勞動(dòng)力短缺、人口老齡化、外太空探索等問(wèn)題。因此，考慮到成本、需求以及容錯(cuò)率等因素，我們認(rèn)為，人形機(jī)器人將率先在工業(yè)場(chǎng)景，特別是工廠中落地，隨后經(jīng)過(guò)技術(shù)優(yōu)化和成本下降，場(chǎng)景將逐步滲透到家庭和商用。3.1.工業(yè)場(chǎng)景：替代傳統(tǒng)工業(yè)機(jī)器人和人類(lèi)勞動(dòng)力3.1.1.性能+成本優(yōu)勢(shì)凸顯在人形機(jī)器人中，未來(lái)率先應(yīng)用的大概率會(huì)在工業(yè)場(chǎng)景，去取代重復(fù)、無(wú)聊、危險(xiǎn)的工作，替代傳統(tǒng)工業(yè)機(jī)器人和人類(lèi)勞動(dòng)力。性能優(yōu)勢(shì)下，機(jī)器人將部分替代傳統(tǒng)工業(yè)機(jī)器人?，F(xiàn)階段傳統(tǒng)工業(yè)機(jī)器人基本上能覆蓋工業(yè)制造中大部分的使用場(chǎng)景，那人形機(jī)器人取代的是哪部分工種呢？傳統(tǒng)工業(yè)機(jī)器人存在靈活性較差的問(wèn)題。對(duì)于工業(yè)機(jī)器人而言，按照應(yīng)用場(chǎng)景來(lái)分類(lèi)，可以分為搬運(yùn)、碼垛、分揀、焊接、裝配、噴涂、切割、檢測(cè)等用途，目前主要以搬運(yùn)和焊接為主，其他場(chǎng)景由于工業(yè)機(jī)器人的可移動(dòng)性較差、安裝條件要求較高等原因無(wú)法較好地使用機(jī)器人。按照作業(yè)方式進(jìn)行劃分，可以分為直角坐標(biāo)、圓柱坐標(biāo)、SCARA、多關(guān)節(jié)、協(xié)助機(jī)器人，除了協(xié)助機(jī)器人外，前4種屬于傳統(tǒng)工業(yè)機(jī)器人，這些傳統(tǒng)工業(yè)機(jī)器人存在的問(wèn)題是，雖然可以按照需求開(kāi)發(fā)新的功能，但是需要專業(yè)人員進(jìn)行編程、測(cè)試、開(kāi)發(fā)等一系列流程，靈活性較差，而協(xié)助機(jī)器人雖然操作簡(jiǎn)單、編程方便，但是只適合用在任務(wù)簡(jiǎn)單的工種，且屬于輕量級(jí)機(jī)器人，負(fù)載能力相對(duì)較弱。因此，歸納起來(lái)可以發(fā)現(xiàn)，傳統(tǒng)工業(yè)機(jī)器人的靈活性、易用性較差，難以滿足一些長(zhǎng)尾和靈活性要求較高的工業(yè)需求。人形機(jī)器人將作為傳統(tǒng)工業(yè)機(jī)器人的重要補(bǔ)充。人形機(jī)器人的優(yōu)勢(shì)在于，在運(yùn)動(dòng)方面能像人一樣靈活移動(dòng)，快速移動(dòng)到工廠中各種場(chǎng)景，在任務(wù)執(zhí)行中基于大模型訓(xùn)練迭代后形成的自主決策能力，能針對(duì)各種工作和場(chǎng)景做出實(shí)時(shí)的反饋。簡(jiǎn)單而言，人形機(jī)器人在工業(yè)場(chǎng)景中，依靠更高階的自主決策能力和更靈活的移動(dòng)方式，能較好地填補(bǔ)傳統(tǒng)工業(yè)機(jī)器人的不足、替代原本由人工操作的工作。成本優(yōu)勢(shì)下，機(jī)器人將部分取代人類(lèi)勞動(dòng)。海外高昂的勞動(dòng)力成本使得機(jī)器人替代人工的優(yōu)點(diǎn)越發(fā)凸顯。以美國(guó)為例，用工成本除了基本薪酬外，還包含稅收、福利、保險(xiǎn)、培訓(xùn)費(fèi)用以及各種法律法規(guī)風(fēng)險(xiǎn)造成的潛在成本。首先只粗略對(duì)比基本薪酬，根據(jù)美國(guó)勞工統(tǒng)計(jì)局?jǐn)?shù)據(jù)，2023年5月美國(guó)所有員工的實(shí)際平均工資為28.83美元/小時(shí)，聯(lián)邦規(guī)定的最低工資標(biāo)準(zhǔn)也達(dá)到7.25美元/小時(shí)，我們假設(shè)人形機(jī)器人的初期售

人人文庫(kù)> 全部分類(lèi)> 行業(yè)資料 > 管理策劃

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

人形機(jī)器人行業(yè)分析1

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

人形機(jī)器人行業(yè)分析1

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔