2025年末,具身智能行業(yè)正在同時(shí)被兩股力量推著往前走。
一面是久違的資本熱浪。人形機(jī)器人被視作“下一個(gè)萬(wàn)億終端”,資本熱度持續(xù)升溫。第三方數(shù)據(jù)機(jī)構(gòu)IT桔子數(shù)據(jù)顯示,今年前三季度國(guó)內(nèi)機(jī)器人融資額已達(dá)386.24億元,是2024年全年總量的1.8倍。11月以來,原力靈機(jī)、星塵智能、加速進(jìn)化等公司相繼完成新一輪融資,投資人也從投概念轉(zhuǎn)向更關(guān)注商業(yè)化速度和可驗(yàn)證價(jià)值。這種熱度,也延伸到企業(yè)端。新品迭出、頭部廠商頻頻宣布獲得上千臺(tái)“商業(yè)化大單”,“量產(chǎn)元年”的說法反復(fù)出現(xiàn)。
另一面卻是不容忽略的風(fēng)險(xiǎn)。硅谷明星公司K-Scale Labs資金鏈斷裂、百余臺(tái)預(yù)購(gòu)訂單被迫退款;國(guó)內(nèi)創(chuàng)業(yè)公司一星機(jī)器人解散。這兩家公司均成立不到1年,且拿下多輪融資。這些現(xiàn)象讓行業(yè)意識(shí)到,“量產(chǎn)元年”并不等同于行業(yè)拐點(diǎn),反而更像一次集體的生死考驗(yàn)。
這兩股力量共同指向一個(gè)核心事實(shí),具身智能正在快速增長(zhǎng),但距離真正意義上的“ChatGPT時(shí)刻”,還有相當(dāng)距離。多位具身賽道投資人對(duì)經(jīng)濟(jì)觀察報(bào)表示,接下來可能出現(xiàn)“寒冬”,出現(xiàn)融資收緊等情況,熱度之后將迎來一次對(duì)商業(yè)模式和技術(shù)路線的全面篩選。怎么活下來,或?qū)⒊蔀榫呱碇悄芷髽I(yè)的共同難題。
1、量產(chǎn)要先辨別是真需求還是偽需求
過去一年,人形機(jī)器人的能力提升幾乎到了“肉眼可見”的程度。2024年還在穩(wěn)定站立的機(jī)器,現(xiàn)在已經(jīng)能連續(xù)空翻、跑完數(shù)小時(shí)馬拉松,甚至現(xiàn)場(chǎng)拖動(dòng)車輛。
但所有這些令人驚嘆的動(dòng)作,都并不等同于可用。幾乎所有受訪者都表達(dá)了類似判斷:具身智能距離真正進(jìn)入強(qiáng)強(qiáng)度、長(zhǎng)周期、可復(fù)購(gòu)的實(shí)際場(chǎng)景,仍有相當(dāng)距離。
在智源具身2025 OpenDay現(xiàn)場(chǎng),智源研究院院長(zhǎng)王仲遠(yuǎn)給出了一個(gè)典型案例,他們采購(gòu)了某款機(jī)器人10臺(tái),僅一兩個(gè)月就壞了5臺(tái)?!坝布€(wěn)定性依然停留在科研階段?!彼a(bǔ)充說,實(shí)驗(yàn)室里,機(jī)械臂因過熱保護(hù)頻繁停機(jī),有的機(jī)器人甚至需要旁邊放電風(fēng)扇,“像給它配一個(gè)保姆”。在他看來,“機(jī)器人滿街跑”的景象未來兩三年都不可能出現(xiàn)。這是硬件側(cè)的現(xiàn)實(shí),也是距離規(guī)模化部署最直接的障礙。
模型側(cè)的瓶頸同樣明顯。具身大模型在控制精度、跨環(huán)境泛化、操作一致性等方面仍處于早期階段,工具鏈不完善,部署標(biāo)準(zhǔn)不統(tǒng)一。在一個(gè)真實(shí)場(chǎng)景中讓機(jī)器人連續(xù)執(zhí)行兩個(gè)小時(shí)流程,遠(yuǎn)比在展臺(tái)完成一次性的動(dòng)作要困難得多。
因此,王仲遠(yuǎn)提醒,行業(yè)必須分辨當(dāng)前的量產(chǎn)究竟來自真實(shí)需求,還是由政策補(bǔ)貼和投資熱度推動(dòng)的偽需求。如果場(chǎng)景方發(fā)現(xiàn)機(jī)器人無法達(dá)到預(yù)期,熱度會(huì)迅速退潮,甚至可能出現(xiàn)階段性泡沫與低谷?!拔腋鷦?chuàng)始人經(jīng)常說的一句話是‘先活下來,熬過可能出現(xiàn)的寒冬,才能迎來真正具身智能未來’?!?
在資本、技術(shù)和企業(yè)共同加速的2025年,行業(yè)呈現(xiàn)出一種井噴,多家企業(yè)發(fā)布模型、整機(jī)硬件、開出高薪招攬人才。
原力靈機(jī)聯(lián)合創(chuàng)始人唐文斌稱今年是“涌現(xiàn)之年”――公司、技術(shù)與資金在同一時(shí)間大量涌出,進(jìn)展遠(yuǎn)超預(yù)期。但他同時(shí)觀察到行業(yè)中的另一面,出現(xiàn)了許多“神奇的訂單”。一些項(xiàng)目金額不小,看上去像是商業(yè)化大單,但拆開來看,卻很難解釋它們真實(shí)解決了哪些問題、能否形成復(fù)購(gòu)、是否能真正幫助企業(yè)降低成本或提升效率。他提醒,量產(chǎn)不能靠堆設(shè)備,而要靠問題是否被解決。
在判斷一個(gè)場(chǎng)景是否值得進(jìn)入時(shí),他提出了三條標(biāo)準(zhǔn):首先,技術(shù)不能過早鎖死。為了搶占第一波訂單,一些企業(yè)急著讓機(jī)器人適配某個(gè)高度定制的垂直場(chǎng)景。但這種路徑往往犧牲模型泛化能力,導(dǎo)致后續(xù)難以拓展其他應(yīng)用。
其次,從容錯(cuò)率高、對(duì)時(shí)間不敏感的場(chǎng)景做起。早期機(jī)器人無法做到“0失誤”。跨環(huán)境操作更需要時(shí)間優(yōu)化,因此行業(yè)更應(yīng)選擇容忍度高的場(chǎng)景,通過真實(shí)部署把可用性從90%逐步提升到95%、100%。
最后,需求必須足夠大且強(qiáng)烈,才能驗(yàn)證價(jià)值、攤薄成本,并形成真實(shí)的商業(yè)閉環(huán)。否則,再大的訂單量也可能只是階段性堆積,難以持續(xù)。
在需求側(cè),采購(gòu)方的判斷更直接。一位大型企業(yè)的具身智能項(xiàng)目負(fù)責(zé)人稱,他們只看三個(gè)指標(biāo):是否解決高復(fù)雜度、高危險(xiǎn)性、高成本的問題。此外,機(jī)器人必須能實(shí)現(xiàn)7×24小時(shí)穩(wěn)定運(yùn)行,具備連續(xù)工作、防水防塵、環(huán)境適應(yīng)等基礎(chǔ)能力?!拔覇栠^不少?gòu)S家,很多還沒有真正考慮這些指標(biāo)?!彼f。在他看來,這些看似基礎(chǔ)的工程指標(biāo),才是機(jī)器人能否進(jìn)入可復(fù)購(gòu)階段的關(guān)鍵。
2、高質(zhì)量數(shù)據(jù)極度稀缺
從Demo(演示視頻)走向規(guī)模應(yīng)用,最終都指向同一個(gè)難題:高質(zhì)量數(shù)據(jù)仍然極度稀缺。
與大語(yǔ)言模型誕生前夕擁有海量文本、圖像數(shù)據(jù)不同,具身智能走的是另一條路:每一份關(guān)鍵數(shù)據(jù)都來自機(jī)器人與真實(shí)世界的交互,而這種數(shù)據(jù)比文本稀缺得多、成本也更高。
今年年初,不少人判斷具身智能行業(yè)大致處在類似大語(yǔ)言模型GPT-1到GPT-2的階段,直至目前臨近機(jī)器人GPT-3時(shí)刻,模型能力有明顯提升,但離真正理解世界還有很長(zhǎng)距離。
銀河通用創(chuàng)始人王鶴給出一個(gè)關(guān)鍵事實(shí):全球今天真正運(yùn)行在人類工作場(chǎng)景里的機(jī)器人,可能還不到1000臺(tái)。這個(gè)數(shù)量遠(yuǎn)不足以支撐一個(gè)行動(dòng)優(yōu)先的模型體系。銀河通用的策略是,短期內(nèi),仿真模擬與合成數(shù)據(jù)仍將承擔(dān)更多探索任務(wù);長(zhǎng)期來看,必須讓機(jī)器人真實(shí)部署量級(jí)成百上千倍增長(zhǎng)。
智元機(jī)器人合伙人、首席科學(xué)家羅劍嵐提到,未來的數(shù)據(jù)生態(tài)應(yīng)該依靠機(jī)器人自己生產(chǎn)。他的設(shè)想是,把規(guī)?;臋C(jī)器人投放到真實(shí)環(huán)境,讓它們與世界持續(xù)交互,由此生成覆蓋廣、時(shí)序長(zhǎng)、結(jié)構(gòu)復(fù)雜的真實(shí)物理數(shù)據(jù),再用這些數(shù)據(jù)反哺模型訓(xùn)練,形成一個(gè)自我進(jìn)化的閉環(huán)。
自變量創(chuàng)始人王潛則提醒,行業(yè)對(duì)數(shù)據(jù)的認(rèn)知正在發(fā)生變化。并不是數(shù)據(jù)越多越好,而是“越有效越好”。語(yǔ)言模型時(shí)代已證明,高質(zhì)量、結(jié)構(gòu)一致的數(shù)據(jù)往往比堆量更有作用。而在物理世界中更是如此,這里充滿接觸、摩擦、碰撞等細(xì)節(jié),很難用語(yǔ)言或圖片描述。如果模型無法理解這些基礎(chǔ)物理過程,就無法建立對(duì)世界的可靠預(yù)期。因此,他判斷,未來真正主導(dǎo)多模態(tài)方向的,可能是由具身智能推動(dòng)的新型物理世界基礎(chǔ)模型。這將是一條與大語(yǔ)言模型不同的發(fā)展路徑。
復(fù)盤大語(yǔ)言模型的發(fā)展,可以看到三個(gè)條件缺一不可――算法、算力、數(shù)據(jù)同時(shí)達(dá)到臨界點(diǎn)。在具身智能領(lǐng)域,這三個(gè)條件尚未同時(shí)成熟,算法仍處在可用性探索階段;訓(xùn)練具身智能的算力體系仍薄弱;數(shù)據(jù)規(guī)模和數(shù)據(jù)質(zhì)量遠(yuǎn)未達(dá)到臨界點(diǎn)。
換句話說,具身智能的未來正在加速到來,但它仍處在黎明前的階段。熱度很高,能力很強(qiáng),但離真正的產(chǎn)業(yè)化黃金時(shí)期,還有一段漫長(zhǎng)的距離。