你的位置:亚搏体育官方网站 - YABO > 亚搏app下载 > 亚博app 李飞飞的World Labs联手光轮智能,具身智能进入评测驱动时期!
亚博app 李飞飞的World Labs联手光轮智能,具身智能进入评测驱动时期!
发布日期:2026-02-19 15:36    点击次数:119

亚博app 李飞飞的World Labs联手光轮智能,具身智能进入评测驱动时期!

Jay 发自 凹非寺                                       量子位 | 公众号 QbitAI

最火天下模子,最火具身智能基建,联手了!

前者,是李飞飞旗下的World Labs;后者,是一家炙手可热的仿真合成数据公司——光轮智能。

具身智能生态中最受存眷的两家公司双刃合璧,原因无他,恰是对准困扰行业已久的「范围化评测」问题,发起一波攻势。

而跟着这波军号的吹响,也象征着具身智能放心迈入评测驱动时期。

在这个赛说念上,光轮智能基于全栈自研仿真期间体系所构筑的护城河,正在显现范围效应。

这次与AI教母李飞飞旗下World Labs的协作,自身亦然这一价值判断在计策层面的具象化体现,亦然一次「天下模子×仿真基础设施」的历史性交织:

World Labs治理的是「天下从哪来」,而光轮智能治理的,是「高出奈何被忖度」。

最火天下模子公司

李飞飞何许东说念主也?

斯坦福著名解说、ImageNet奠基者、前Google Cloud首席AI科学家……行业公认的AI教母。

而World Labs,恰是李飞飞的首个创业名目。

有这样一位分量级东说念主物镇守,World Labs当然是「诞生就含着金汤匙」。

更紧要的是,它从一开动就取舍了一条与LLM大相径庭的AGI阶梯——空间智能(Spatial Intelligence)。

这是一个极具联想力的倡导:

通过构建能够感知、生成、推理并与环境互动的天下模子,让AI像东说念主类一样,在与真实天下的捏续交互中,逐渐酿成更具泛化性、上限更高的心智模子。

这种理念,也与Yann LeCun的判断一辞同轨。尽管二者辞天下模子的具体已毕旅途上存在互异,但都肯定:唯独这种阵势,才调摧毁LLM的智能天花板。

2025年底,World Labs放心推出首款居品Marble。

仅需一句话、一张图片或一段视频,便可生成高保真实3D天下。

更紧要的,是其清晰的生意化后劲。

与LeCun阶梯不同,Marble走的是可视化天下模子地点,生成扫尾在视觉层面极具完成度。

Marble生成的是捏久、可下载的3D环境,能够显赫减少场景变形与细节不一致问题,并维持导出为高斯黑点、Mesh网格、视频等多种体式。

同期,Marble还内置了原生的AI天下剪辑器Chisel,用户只需一句教导,便可对天下进行定制化修改。

关于视觉殊效从业者或游戏开发者而言,「一句教导→生成3D天下→一键导出至Unity」的链路,已经是实打实的坐褥力器用。

也正因如斯,Marble也曾发布便广受好评,也让更多投资东说念主再行注视天下模子这一王人线的可行性。

在独创东说念主、理念与居品的多重加捏下,World Labs很快踏进为备受追捧的超等独角兽。

成就仅两年,World Labs已融资数亿好意思元,激动包括Andreessen Horowitz、英伟达、Databricks、Adobe等,险些串起了通盘顶级风投与AI生态收罗。

学术评测与真实评测,已无法跟上具身智能

诚然,天下模子确切的后劲,仍然在具身智能。

而这个鸿沟,正在遭受一个日益机敏的问题。

模子高出的速率,已经快到一种近乎失控的过程——

险些每隔一两周,就会出现令东说念主咫尺一亮的demo(演示),快到连现存benchmark都来不足跟上其进化节律。

这让全球顶尖AI Labs集体堕入窘境:

模子智商已经超越通盘学术基准,但却无法被准确评估。

具身智能,紧迫需要一把新的尺子。

直观上,最平直的秩序是进入真实环境测试。但这种阵势清高貌模化。

与自动驾驶不同,机器东说念主莫得「影子模式」的自然泥土。

车辆早已融入宽绰生涯,即便不开启自动驾驶,系统也能在后台同步作念决策推演,并与东说念主类驾驶举止对比。

但机器东说念主若想达到类似效力,必须畸形搭建实验环境,安装无数物理开垦,并承担高亢的留心与安全老本。

机械臂旅途磋议出错,可能导致减慢器受损;夹爪力度扫尾不妥,甚而可能平直损坏测试物体。

评测LLM,只需书面作答,角落老本极低;而要以同等范围评测具身智能,惟一可行的旅途唯独仿真。

这,也恰是李飞飞投身具身智能创业的中枢原因之一。

李飞飞屡次强调:数据与评测,是具身智能scaling的根底经管。

她所倡导的数据金字塔,将考试数据诀别为三类:真实遥操作数据、仿真合成数据、东说念主类视频数据。

这一框架,恰是出自她的学生、UT Austin解说、NVIDIA GEAR名目蚁集负责东说念主Yuke Zhu之手。

在这一金字塔中,仿真合成数据被视为最具可推广性、也最有后劲成为骨干的数据形态。

问题随之而来:若何让仿真确切已毕范围化?

在这一布景下,World Labs推出了Marble,但愿将天下模子动作机器东说念主的仿真考试场。

但Marble走的是可视化天下模子阶梯,试验上提供的是一个「天下载体」,并未内置触觉、重力等物理参数。

若要确切用于机器东说念主考试与评测,还需要物理引擎,以及无数与真什物理对王人的仿真金钱——这是一项极其繁密的长尾工程。

这,恰是World Labs与光轮智能协作的重要原因。

事实上,这并非李飞飞第一次系统性地推动机器东说念主评测。

早在Stanford时期,她便在2021年驾御启动并推动了BEHAVIOR系列相关,宗旨相配明确:为具身智能竖立ImageNet级别的恒久评测工程。

BEHAVIOR从一开动,就不是为了刷榜而生,而是一个恒久评测工程,旨在用可推广、可复现的阵势,系统形容机器东说念主在真实家庭场景中完成长程、多门径任务的智商。

其背后,已有两代博士生插足多年相关。

2025年的BEHAVIOR Challenge,恰是这一愿景的紧要节点。

该挑战在NeurIPS顶会期间放心授奖,被视为具身智能鸿沟少有的、兼具学术与产业泰斗性的评测事件。

本年BEHAVIOR Challenge的授奖关节中,光轮智能CEO谢晨受邀参与授奖。在一个以学术泰斗著称的评测体系中,这一安排自身,已经传递出明确的行业信号——

评测,正在从论文问题,演进为工程与基础设施问题。

{jz:field.toptypename/}

在这一体系中,参赛者需要在息争机器东说念主本色上,亚搏app官方网站于仿真家庭环境中完成烹调、清洁等50个长程任务,平均单任务捏续6.6分钟,评测维度涵盖任务完成率、时刻效力、旅途磋议等多个层面。

这一次,李飞飞但愿再次借助评测的力量,为具身智能指明地点,而光轮,恰是具身智能最重要的产业级基础设施之一。

World Labs×光轮智能

现时,大多数仿真系统仍在追求「数字孪生」——试图将真实天下一比一复刻进仿真系统。

这种阵势效力惊艳,却极其高亢:

高密度传感器扫描、东说念主工重建、长周期制作,险些等同于制作一部袖珍CG。

明显,这条阶梯清高貌模化。

World Labs与光轮智能,取舍了另一条旅途——Digital Cousin(数字表亲)。

这一倡导由斯坦福SVL提议,其中枢不雅点是:仿真最紧要的是物理与空间结构,只须结构委果,细节允许近似。

Marble恰是这一念念想的代表。

通过一张360°全景图像等轻量级输入,Marble便可生成可导航的3D高斯散射天下,将环境创建时刻从数周压缩到数分钟。

但关于具身智能评测而言,这一步仅仅着手。

确切的瓶颈在于:这些天下,是否能承载真实的物理交互,并用于清醒、可复现的评测?

这恰是光轮智能进入的位置。光轮并非肤浅为Marble「补物理引擎」,而是从一开动,就将具身智能视为一个天下—举止—评测高度耦合的系统。

在这次协作中,两边的单干相配清晰:Marble治理的是环境生成的范围问题,而光轮承担的是仿真中最难、最重、亦然最弗成替代的部分——与真什物理对王人的金钱,以及评测闭环。

其底层,是一套三位一体的仿真期间体系:

求解:自研GPU物理求解器,维持百万级摆脱度并行规划,清醒输出轨迹、战役力等可用于学习与考证的物理信号。

测量:构建全自动虚实对标物理测量工场,通过高精度开垦聚集材料、摩擦、战役等真什物理参数。

生成:将真实天下的物理特质范围化映射为可引申、可评测的SimReady金钱与场景。

在这一体系下,仿真不再是一次性的数据生成器用,而是一个可肖似运行、可捏续推广的数据坐褥系统。

天下、举止、评测,在这里酿成闭环。

范围化评测,第一次确切成为可能。

最火具身智能基建公司

这样多作念仿真合成数据的公司,李飞飞为何偏巧选中了光轮智能?

上头的得益单,便是最平直的复兴。

但如若要更深挖少量的话……光轮智能是现时最炙手可热的具身智能基建公司。

躬举止其戴上这一桂冠的,是英伟达。

光轮是英伟达亲密的AI生态伙伴,深度参与了英伟达仿真系统的底层共建,是Newton物理引擎的早期考证者和开发协作家。

旧年10月,黄仁勋男儿、英伟达Omniverse与物理AI高档总监Madison Huang初度公开亮相,相同是与光轮智能对谈。

其发言更是平直佐证了光轮智能的「强悍」之处:

英伟达里面有好多名目需要光轮智能的维持。

有需求的不啻英伟达。

量子位曾扒过光轮智能公开的客户名单,发现其市占率迥殊恐怖,险些袒护了AI生态中通盘仿真合成数据需求的公司,包括但不限于:

大模子公司:英伟达,谷歌,Genesis AI,阿里,字节…

机器东说念主本色公司:Figure AI,1X Technology,智元机器东说念主,星河通用…

行业公司:Toyota,BOSCH,比亚迪,祯祥…

据几位接近数据行业的资深东说念主士表示,光轮已经办事了全球前三的天下模子公司。海外主要具身团队的仿真金钱和合成数据,80%以上来自光轮。

这些数字弥散亮眼,但还有一个很容易被忽略的事实:光轮智能是除客户以外,最早能知悉机器东说念主智商短板的生态变装。

身处客户需求一线,光轮每天都会从不同模子团队赢得无数反映。这些衰竭的信息一朝汇聚起来,便酿成了一册干货满满的机器东说念主「病历」。

这和筹商行业是一个逻辑,看的案例多了,当然就知说念机器东说念主容易在哪些任务上翻车。

要点在于,光轮自身又是「大夫」。它能围绕这些「疑难杂症」,反向优化仿真与合成数据,提供更有针对性的「调和决策」。

这就酿成了一个闭环,推着具身智能像雪球一样滚起来。

归根结底,动作具身智能的行业基建公司,天生合适担任评测员。

事实也的确如斯。

旧年年底,光轮推出了RoboFinals评测圭臬。这是业内首个工业级、可范围化、真实委果的仿真评测平台,专为顶端机器东说念主基础模子评测而生。

阿里通义千问团队积极采取RoboFinals,通过捏续的压力测试和数据反映,助力RoboFinals成长为行业通用圭臬。

同期,光轮也和英伟达蚁集打造了Isaac Lab Arena,这是英伟达新一代的开源仿真评测框架。

具身智能进入评测驱动时期

具身智能的发展,迎来拐点。

跟着越来越多玩家的涌入,行业迎来全面爆发,每天都有无数令东说念主振奋的施展。

但这也意味着阶梯高度分叉,通晓日眉月异。

全球都在埋头拉车,但没东说念主知说念前哨是什么,这条路究竟能走多远。

具身智能,当下亟需新「路标」。

评测的意念念,诚然不仅限于各家模子轮替刷榜秀肌肉。好的评测,能够提前发现现时期间阶梯的瓶颈,甚而反过来塑造相关地点。

这是具身智能发展中弗成或缺的系统级智商,必须与模子同步推广。

{jz:field.toptypename/}

当评测自身成为基础设施,光轮智能的变装也随之发生变化。

不同于模子公司或机器东说念主本色厂商,动作仿真与评测基础设施,光轮处在通盘期间阶梯之上,而不是其中之一。

这亦然它最合适、也最有经历承担评测变装的原因。

在此布景下,World Labs和光轮智能,具身智能最炙手可热的这两块基建,将其串联到了一块。

这次重磅协作,约略也象征着一颗「北极星」的冉冉腾飞——具身智能,放心迈入评测驱动时期。

参考联贯:[1]https://drfeifei.substack.com/p/from-words-to-worlds-spatial-intelligence[2]https://developer.nvidia.com/blog/simplify-generalist-robot-policy-evaluation-in-simulation-with-nvidia-isaac-lab-arena/[3]https://www.ft.com/content/d8fec7b5-f64a-4c5b-8439-6b8fe557be95[4]https://mp.weixin.qq.com/s/fF4ePkwm_f9j6xE0B1vRlQ[5]https://drfeifei.substack.com/p/from-words-to-worlds-spatial-intelligence