今日熱文:從實驗室到真實場景 數據為具身智能落地關鍵
在近期具身智能企業的發布活動中,數據成為高頻詞匯。隨著具身智能從實驗室走入真實場景,數據成為影響具身智能落地部署的關鍵。近日,覓蜂科技、帕西尼發布具身智能數據與數據服務平臺,多家企業發布更低成本的數據采集方案,圍繞物理AI數據規模、質量與成本的競賽全面開啟。
數據成為模型能力關鍵
(資料圖片)
“機器人其實硬件到位了,但是大腦沒有跟上,就像空有一身漂亮的肌肉?!弊宰兞繖C器人CEO王潛在4月21日舉辦的發布會上說。
如今,業內普遍認為具身智能數據是提升機器人“大腦”能力的關鍵,這種能力對應著更強的具身模型能力,通常指機器人執行任務的泛化性。自變量機器人CTO王昊將具身智能模型訓練所用的數據分為“糖水數據”和“牛奶數據”:“糖水數據”來自實驗室,與現實世界有較大差距,難以提升模型的泛化性;“牛奶數據”來自真實環境,充滿隨機性,對模型訓練更有益。
為了獲得高質量的“牛奶數據”,自變量機器人將機器人部署到100個志愿者的真實家庭中進行訓練?!罢鎸嵉幕靵y和不可預測的場景、畫面,這些才是能驅動數據飛輪真正轉起來的因素。”王昊稱,以實驗室數據打底,真實環境的數據提質,自變量機器人發布新一代基于世界統一模型架構的具身智能基礎模型WALL-B。公司還宣布,今年5月25日,部署WALL-B模型的新一代機器人將入駐真實家庭,邊做邊學。
具身數據已經成為今年行業發展的關注焦點?!皺C器人的跑跳等運動能力,前兩年已經很大程度得到解決,下一步要解決機器人能干活的問題,這需要機器人‘大腦’能感知、能做規劃,需要數據來訓練模型。”祥峰投資管理合伙人夏志進對記者表示,對具身模型和數據的高關注度,正是當前行業推動機器人落地部署的真實需求。
覓蜂科技董事長姚卯青認為,2026年是具身智能產業數據元年,具身智能是萬億元級賽道,但行業面臨數據荒漠?!拔谋敬竽P驼Z料規模達百億小時級,具身智能高質量數據規模僅為50萬小時級,差距巨大?!彼硎?,百億小時是通用智能的基礎門檻。阿里云高級算法專家張民英也表示,要讓具身智能模型能力實現突破,需要100億小時數據量級。
頭部企業積極布局
4月16日,帕西尼聯合京東云、騰訊云、百度智能云共同推出全模態具身智能數據云商城,即日起全面對外開放。同日,智元機器人控股的具身智能數據平臺公司覓蜂科技在上海發布一站式物理AI數據服務平臺,并上線覓蜂數據商城,公司計劃到2026年和2030年,分別實現千萬小時級、百億小時級數據產能。今年3月光輪智能宣布完成近10億元融資,成為首個具身數據領域的“獨角獸”企業,并宣布在今年一季度獲得5.5億元訂單。
“當下處于數據‘軍備競賽’的起點?!币γ啾硎荆袠I頭部數據需求方,普遍有全年百萬小時的數據需求。
此前,北京、上海、天津、武漢、無錫等多地已經建立起大規模的具身智能數據采集工廠,行業探索發現,傳統數據采集模式依賴大量機器人本體,由人工遙操作采集,采集成本高、花費時間長。如今,更多企業開始探索更低成本的數據采集方式。
夏志進介紹:“近期比較受關注的是采用UMI(通用操作接口)方案,通過人類穿戴采集設備采集數據,再將采集到的數據部署至機器人?!比缃衲?月鹿明機器人發布FastUMI無本體數采產品,該方案將單條數據采集時間從傳統遙操作所需的50秒縮短至10秒,效率大幅提升,同時將綜合成本降至原來的五分之一。
今年4月,覓蜂科技發布MEgo系列無本體采集硬件,包括夾爪造型的手持輕量化采集設備MEgo Gripper,以及穿戴在頭部、手部的MEgo View采集終端。這些搭載著傳感器、攝像頭的采集設備會將穿戴者的周圍環境與動作軌跡采集、還原?!半S著無本體采集方案普及,預計采集效率會達到真機采集的兩三倍,數據成本也將下降?!币γ喾Q。
專家認為,另一個降低數據采集成本的方案是使用部分視頻數據與仿真合成數據,與真實數據相印證,幫助降低模型訓練成本、提升效率。例如極佳視界2025年12月發布并開源的具身世界模型GigaWorld-0,將世界模型生成數據在VLA訓練中的占比提升至90%。千尋智能聯合創始人高陽介紹,公司選擇基于海量人類互聯網視頻進行預訓練,通過自研設備將數據采集成本降低了90%。
夏志進表示,目前市場上,具身智能相關數據仍存在較大缺口,與此同時,關于具身智能數據的選用標準、用量規模以及采集方式,行業內尚未形成統一共識,企業仍處于探索階段。另有業內投資人表示,當下資本更看好具備低成本、高效率的數據獲取方式的企業。
需盡快建立標準
在提升具身數據規模的同時,具身數據標準、質量問題成為行業挑戰?!笆紫仁切袠I標準缺失,各家企業生產數據的格式、標注都自成體系,難以互通和復用;二是數據質量參差不齊,數據標注不規范、數據質量粗糙問題普遍存在。”姚卯青表示,大模型由數據驅動,如果輸入“垃圾數據”,產出的就是“垃圾模型”。
為解決數據標準問題,行業企業正在各自探索。如覓蜂科技通過數據治理引擎對采集到的數據進行處理,其中包括數據預處理、空間感知信息提取、數據質量評估等?!皬臄祿布用娴耐?、標定,再到語義的標注,再到采集操作的規范,以及數據場景、任務的多樣性,這些都構成了高質量數據的必要元素。”姚卯青稱。
帕西尼則建立了一套標準化的數據全生命周期閉環管理系統,降低數據清洗成本,確保數據的一致性與高質量。北京人形機器人創新中心設立的具身智能機器人數據與訓練基地也建立了標準化項目管理體系,制定數據采集、標注、質檢等系列規范,實現全流程的質量把控。
光輪智能創始人兼CEO謝晨表示,具身智能數據呈現為“真機數據、仿真數據、互聯網視頻數據”三層金字塔結構,三類數據都是實現行業泛化的必要條件。除了數據的缺失,當前行業痛點還在于缺少模型評價體系。謝晨說:“如果沒有評價體系,大家就不知道用什么樣的數據能夠使模型表現得更好。”從業者普遍認為,行業需要建立統一的數據采集標準和模型評價體系。
您可能也感興趣:
為您推薦
中國紅APP正式上線發布
第十二屆東亞地方政府會議將在山東臨沂召開 促進東亞地區交流合作
(鄉村行·看振興)山西柳林依托“數商興農”打造鄉村e鎮 電商交易9個月達3.5億元
排行
最近更新
- 今日熱文:從實驗室到真實場景 數據為具身智能落地關鍵
- 李金羽:英博外援能力非常突出,通過個人能力決定了比賽走勢
- 巴薩隊史出場最多的荷蘭球員,德容獲贈紀念球衣并與科庫合影
- 俞敏洪官宣:邀請10名東方甄選會員共赴南極_焦點訊息
- 現貨黃金漲0.41%,報4739.31美元/盎司
- 一組數據看懂中國制造新動能
- 帝奧微:一季度虧損2465.23萬元 同比由盈轉虧 百事通
- 焦點訊息:圖解財報:四創電子全年歸母凈利潤-2.88億元,上年...
- 2026年3月不銹鋼凈出口總量為15.48萬噸|速看料
- 阿根廷對華鞋類產品作出反傾銷情勢變遷復審終裁 今日訊
- A股總市值達117萬億元,創歷史新高|前沿熱點
- 每日消息!江蘇省鎮江技師學院 2026 年 “閱讀悅美” 讀書節啟幕
- “喜”從何來?
- 快報:中國航空工業集團等在成都新設智譜科技公司
- 4月22日恒天海龍粘膠短纖價格快訊-消息
- ?第三屆海南國際游艇設計大賽頒獎典禮閃耀消博會,全球創意...
- 中國綠發發布6818好房子產品體系
- 即時焦點:河北寧晉舉辦世界讀書日暨迎“五一”主題讀書分享會
- 體驗為王 TATA木門服務升級首站落地天津南京
- 快資訊丨南昌一宗宅地溢價18.75%成交
- 今日精選:中銀證券給予佰仁醫療"買入"評級:Q1業績快速增長,...
- 青年市集聚煙火,寶堰 “堰” 上青年 “廟” 趣橫生 五...
- 【每周之星】揚子晚報蘇州小記者工作室2026年第16周“作文之...
- 2026年智能云倉托管服務推薦指南:全托管模式如何選到靠譜伙伴
- 泰安高新區稅務局:秀城春正好 稅宣進街巷 焦點熱文
- 分布式生態的“解耦”革命:ant.fun 純界面架構的技術合規性分析
- AAV艾艾薇:“美式高階情趣”定義全新愉悅體驗
- 午評:創業板指低開高走漲0.63% CPO、光纖等算力硬件股集體...
- 中廣核風電、遠景能源在內蒙古成立新能源公司
- 快播:用雨花石“講”南京地史,地質遺跡保護與利用研討會舉行
今日要聞
- 2026年3月不銹鋼凈出口總量為15.48萬噸|速看料
- ?第三屆海南國際游艇設計大賽頒獎典禮閃耀消博會,全球創意錨定綠色智能新航向
- 中國綠發發布6818好房子產品體系
- 體驗為王 TATA木門服務升級首站落地天津南京
- 中廣核風電、遠景能源在內蒙古成立新能源公司
- 狄耐克 3·21 腦機發布會:推出"1+4+N"方案,重塑非侵入式腦機健康新范式
- “春啟新程 智馭先機”--山東神光2026春季投資策略會在滬圓滿舉行
- 4月21日創業板ETF易方達基金份額減少4.83億份,重倉股寧德時代、中際旭創、新易盛
- 中國3D打印鞋品牌星世線亮相米蘭設計周:以設計為橋,讓中國科技與文化走向世界中心
- 滾動:視頻丨第六屆亞沙會準備工作就緒 海南自貿港靜待四方賓朋


