开云app 具身智能数据战:群核建谈场,百度铺管谈,京东搭舞台

发布日期:2026-04-27 03:39    点击次数:133

开云app 具身智能数据战:群核建谈场,百度铺管谈,京东搭舞台

文 | 奇点讨论社,作家|孟雯

最近具身智能的数据战情投意合。

前有腾讯发布 Tairos 具身智能绽开平台,后京东又上线了具身智能数据往返平台,还要发动 60 万东谈主采集 1000 万小时。

不久前,百度也推出具身智能数据超市,想要责罚困扰行业已久的数据质料杂沓不皆、形状措施不一、使用本钱高档痛点。

上周亦庄的东谈主形机器东谈主马拉松大赛,更是把具身智能的热度推向激越。

荣耀机器东谈主「闪电」跑完 21 公里,净用时 50 分 26 秒,冲破了东谈主类须眉半马天下记载。一时期,指摘区振奋,"历史性时刻","部署态元年"到来!

但仔细讨论会发现这更像一场"机械能力"的突破,而非" AI 能力"的突破。「闪电」之是以能跑出这个得益,靠的是 0.95 米大长腿、自研液冷系统、电机联系从 420Nm 普及到 600Nm。

这些都是工程能力的蕴蓄,是荣耀把曩昔十几年耗尽电子里的轻量化和结构遐想能力,移动到了机器东谈主上。若是把归并套算法塞进另一台机器东谈主,大约率跑不出这个得益。

问题不在算法,而在"具身智能"这个词,装了太多含义。

连气儿跑 21 公里是一件事;能帮你干活,是另一件事;能在产线上连气儿责任 8 小时握住机,又是竣工不同的一件事

而这三件事,对应的是三种竣工不同的数据需求。

"缺数据"喊了三年,但没东谈主说清到底缺什么

"通盘互联网上能考研的数据一共就莫得若干 T,当今照旧快不够用了。"国内某头部大模子厂商首创东谈主在采访中说,"当今全球更多是用检索增强来落地 B 端,C 端如故需要基座模子的进化才能突破。"

这是大模子(LLM)规模的真实狂躁。

如今,LLM 的"数据狂躁"正推广到具身智能。去任何一场机器东谈主关联的论坛,简直悉数东谈主都在说,数据不够,是最大的瓶颈。

但若是再往下追问,到底缺的是什么数据?谜底却天悬地隔。

LLM 之是以能够跑通范畴定律(Scaling Law),有一个不行疏远的大前提:互联网文本本人就是一个"闭环系统"。

一句话里同期包含意图、语义、致使隐含的推理旅途。模子要作念的,即是无间从这些闭环中索要规定。

是以你只需要"多喂",模子"悟"得越多,能力就会自然清爽。

但具身智能莫得这么的闭环。

你不错采集 100 万小时的东谈主类活命视频,但内部并莫得机器东谈主应该如何截止要津的信息;你不错构建 1000 万个仿真场景,但它们常常枯竭真实天下里的噪声与长尾分散;你也不错通过遥操作蕴蓄 10 万条任务数据,但一朝更换机器东谈主内容,移动完了就会明显打折。

具身智能的数据,不是"被集聚"的,而是在物理天下中被"制造"的。

况兼不同类型的数据,对"范畴"的响应也竣工不同。是以把 LLM 的那一套逻辑葫芦依样搬过来,本人就是一种误判。

若是把具身智能的数据隔断来看,会更了了一些。它梗概不错分为三类:通顺截止、场景富厚与任务决策。

通顺截止数据告诉机器东谈主"怎么动",比如要津角度、力矩、通顺轨迹等,这类数据高度绑定特定内容,自然不具备范畴化复用能力。

场景富厚数据告诉机器东谈主"看到了什么",比如视觉、空间、物体识别等,因为东谈主看到的天下,和机器东谈主看到的天下,在统计趣味趣味上是相似的,是以这类数据是咫尺独一有可能跑通 Scaling Law 的层级。

最难的是任务决策数据,它要告诉机器东谈主"该怎么办",这是通盘体系里最稀缺的一类数据,因为它条目三件事同期成立:感知、判断、履行,况兼必须同步标注。

这三类数据,有些不错靠堆量责罚,有些则竣工行欠亨,换言之,在具身智能规模,Scaling Law 不是"失效了",而是"分层成立"。

行业里其实照旧有东谈主刻画过这个问题。戴盟机器东谈主采选媒体采访时,称具身智能的数据供给存在一个金字塔结构。 

顶层是机器东谈主内容数据,最精确,但最难扩展;中层是可部署采集数据,在精度和范畴之间作念均衡;底层是东谈主类视角的大范畴数据,最容易放量。

底层数据,不错靠"范畴化"堆出来,崇拜考研"通晓"。顶层的数据,必须贴着内容打磨,崇拜考研"履行"必须精湛打磨,不存在"多多益善"。

这亦然为什么,单纯谈"数据范畴"照旧不再专门想,重要在于"你在放大哪一层"。

沿着这个想路,学术界也启动尝试给出新的解法。中山大学发表的开源姿色 PHYAgentOS,把通晓层与履行层解耦,即大模子作念通晓进口,不作念最终履行者。

这背后对应的,是一套新的数据单干姿色:底层数据考研通晓能力,不错跨内容泛化;顶层数据考研履行能力,遥远绑定具体内容。

一朝这一结组成立,数据的使用遵守会发生质变:不同层的数据,不再被强行塞进归并个模子里消化。

责罚了"数据从何而来",还要看数据如何"被消化",这就触及到现时行业里的几条主流的时期阶梯。

VLA 最常见,也最主流,它把视觉、讲话、动作全部压进一个模子,输出截止信号,代表玩家是 RT-2 和 π 0,这一起线需要"图像 + 教唆 + 动作"三者同期存在的数据,统筹兼顾,采集本钱很高,也最难范畴化。

第二条旅途,是分层大模子。用 LLM 作念高层谈判,再调用 VLA 或传统截止算法履行。它殉国了一部分端到端的一致性,但换来了更高的数据哄骗遵守。典型代表包括谷歌的 Gemini Robotics、北大的 RoboOS,以及前边提到的 PHYAgentOS。

第三种是现时最受温煦的天下模子阶梯,如 DreamDojo、PAR/PhysGen,强调平直从视频里"悟"出物理规定,以及零动作预考研,代表如国际的英伟达,国内的拓元机灵。

但不同玩家对归并起线也有着不同的富厚。拓元机灵遴荐在隐层空间(而非视频画面)作念天下推演。

拓元机灵结伙首创东谈主陈添水在采选奇点采访时提到:"英伟达的 One Action Model 主要指建模 action(动作),拓元同期建模 action 和 physical,隐层特征(几千维)比视频像素(200 万像素)更高效,且能更好地相沿 action 量度。"

物理 token 自纪念的运作姿色:量度将来的帧与动作结伙体,开云app在线下载与真实环境同步演化

图灵奖得主杨立昆提倡的 JEPA 相同属于这一范式,但它更偏向"量度式学习",即在详细空间里推演将来景象,学习因果联系。

写到这里,咱们会发现,在具身智能规模,脱离模子架构去谈"高质料数据",本人并莫得太大趣味趣味。

零次方结伙首创东谈主马晓龙采访中的话,精确点出了推行:"数据有莫得用,推行是匹配问题。对你的模子有用,对我的架构可能毫无趣味趣味,第三方换了场景又可能竣工没用。"

群核建谈场,百度铺管谈,京东搭舞台

带着这么想路再来看最近大厂的数据之争,就会发现他们自然都在"抢数据",但抢的,根柢不是一个东西。

互异不在"量",而在"层"。

最底层,是群核科技。群和科技占据的是 Scaling Law 最可能成立的那一层:"物理正确"的空间数据。

把柄招股书,群核照旧蕴蓄了 5 亿个 3D 室内场景、4.8 亿个 3D 模子,这些数据并非"采集",而是来自真实生意使用中被反复调用、修改、考据的完了。

群核科技推出的 InteriorNet 数据集(包含约 1 亿 3 千万图像数据)

基于这些数据构建的 SpatialVerse,是一个"可谈判的物理空间":球被扔出去会着落,门被推开会有阻力,地板存在摩擦力。

物理正确性,意味着它不依赖任何具体模子架构的演进。不管将来是 Transformer、天下模子,如故其他范式,机器东谈主最终都必须在恰当真什物理规定的环境中完成学习和决策。

这意味着,一朝底层数据的 Scaling Law 成立,群核的价值会被指数级放大。它不需要押注"哪一个模子会赢",它押注的是悉数模子,都必须参加"谈场"。

若是说群核责罚的是"数据从那里来",那么往上一层,即是百度在作念的事情:回话"数据如何流动"。

百度具身智能数据超市,是一个中立的数据开通平台。它不参与机器东谈主内容,也不服直分娩数据,而是试图把分散在不同企业、不同场景中的数据"组织起来"。

把柄官方露出,咫尺具身智能数据超市照旧接入十余产物身智能企业的数据,总量跳跃 1000 万条。同期推出了"繁星目的",目的招募约 100 家场景方绽开真实空间。

更值得一提的是它的"重职业模式"。"百度数据超市上的数据需专科处理,暂无免费上传机制。咱们有高 T 工程师团队免费相沿客户,仅收取算力和存储用度。"百度智能云泛科技革命行业销售总监徐良在采访中提到。

这意味着,它并非一个浅近的撮合平台,而更像一个带有强加工能力的"数据代工场":数据需要被清洗、标注、结构化,才能参加可用景象。

与此同期,百度还在补另一块更底层的基础形状:数据真是开通。包括云网端安合座系,以及面向出海的合规能力。"咫尺百度结伙头部客户开荒的云网端安全有筹备,照旧被应用到出口欧洲的产品中。"徐良补充谈。

若是用一个更直不雅的类比,百度更像是具身智能时期的" Visa ":它不服直参与往返,但决定了数据这笔"往返",能不行发生、如何发生。

再往上走,是京东。

其实京东的价值有被严重低估。上线具身智能数据往返平台,发动 60 万东谈主采集 1000 万小时东谈主类真实场景视频数据,在亦庄马拉松机器东谈主赛事中,京东又行为 AI 科技计谋融合伙伴,提供了运载、解救、换电、维修等全周期保险。

赛事平直带动了跳跃 20 个机器东谈主品牌销售额翻倍,关联搜索量激增 300%。

名义看是一次品牌和供应链能力的展示,但它真是责罚的问题,其实在数据层。具身智能里,有一类数据自然无法复用:通顺截止数据。它高度绑定具体内容、具体结构,简直不具备跨平台移动能力,也就很难像互联网数据一样造成范畴化开通。

这恰正是 Scaling Law 最难成立的一层。京东作念的事情,是绕过"数据本人的可复用性",平直让这类数据在真实天下中产生生意价值:通过赛事、销售、职业,把机器东谈主推入高频使用场景,让每一次真实运行,都变成一次有用的数据蕴蓄。

当数据本人无法开通时,就用"往返"去放大它的价值。价值驱动需求,需求再反过来鼓励数据回流,这是在 Scaling Law 不成立的顶层,少数可行的生意闭环。

群核在最底层,提供"不错无尽扩展的谈场";百度在中间层,买通"数据如何被加工与开通的管谈";京东在最表层,搭建"让数据产生价值的真实舞台"。

三者辩认押注数据供给金字塔的不同层级,彼此错位,却又为德不终紊。

左券之争与结尾联想

PHYAgentOS 论文中有一句话让我印象很深:Docs as API,不是让 Agent 和硬件系统通过大量隐式音尘、临时景象和难以跟踪的接口平直耦合,而是通过结构化文档进行交互,中枢载体包括 Markdown 文献。

我认为这指向了具身智能数据之战的结尾联想:措施化左券,即不同数据层,如何被归并个系统富厚?

底层是空间与视觉,中层是任务与历程,顶层是具体内容的截止信号,它们的数据结构、抒发姿色、致使时期圭臬都竣工不同。

若是莫得一套融合的"解释机制",这些数据就只可各行其是。

问题的中枢从"数据供给",转向"左券聚拢"。不外近况是,全球都在作念我方的措施,构建我方的"局部最优"。

小鹏、阿里、腾讯接连发布了各自的天下模子,英伟达的 Cosmos 照旧在工业仿真上建立了壁垒,李飞飞的 Marble API 已对外绽开,杨立昆的 JEPA 自然还在科研期,但代表了最远期的颠覆可能。

各家有各自的数据形状、仿真环境与 API 体系,背后绑定的是不同的时期阶梯与产品假定。

短期看,这种分裂不可幸免,因为没东谈主会在早期阶段主动铲除对体系的截止权。同期也意味着,左券层的融合,会比联想中更难。

它不会是一蹴而就的措施落地,更可能是一个漫长的博弈,在遵守、截止力与生态绽开之间反复拉扯,直到某种"饱和好"的共鸣造成。

收尾

荣耀「闪电」用 50 分 26 秒证据了机器东谈主的"物理极限"照旧卓绝了东谈主类。

当将来有一天,咱们让机器东谈主去作念一件没在数据集里出现过的事,比如提起一个从没见过体式的杯子,用从没标注过的姿色,把它放进从没仿真过的架子里,它还能"像东谈主一样"完成,具身智能才算"走到了尽头。"

我确信开云app,那一天会比咱们联想的更近。

中国开云体育一站式服务入口



Copyright © 1998-2026 开云app在线下载入口™版权所有

ngdf666.com 备案号 备案号: 

技术支持:®开云app  RSS地图 HTML地图