更多精彩 >

智在无界发布隐式世界模型产品Being-H-Flash,完成全球首个端侧芯片实时部署

2026-06-04 12:24:45    来源:  作者: 

摘要:过去一年,行业从VLA逐步走向世界模型,但随着模型纸面能力不断提升,一个更现实的问题开始浮现:世界模型能否摆脱数据中心级GPU的窠巢,不再停留在实验室阶段,而是真正运行在机器人本体的端侧芯片上?

过去一年,行业从 VLA 逐步走向世界模型,但随着模型纸面能力不断提升,一个更现实的问题开始浮现:世界模型能否摆脱数据中心级GPU的窠巢,不再停留在实验室阶段,而是真正运行在机器人本体的端侧芯片上?只有做到这一点,世界模型才具备规模化落地的可能。

 

如今,这一门槛正在被突破。

 

具身通用基础模型创业公司智在无界BeingBeyond今日正式发布 Being-H-Flash 模型产品,不仅完成全球首个百 TOPS 级端侧芯片实时部署,并率先实现了国产芯片与英伟达平台双适配。

 

继两个月前 Being-H0.7 开创具身领域隐空间世界模型范式、将人类视频预训练规模推进至 20 万小时后,智在无界此次发布Flash 版本进一步证明:世界模型不仅可以做得更强,也能够真正跑在机器人端侧。

 

这也意味着世界模型的竞争正从纸面论文指标,逐步走向部署效率、芯片适配、运行成本以及工程交付能力。

 

世界模型的首个百TOPS端侧芯片实时部署纪录

 

在具身智能领域,世界模型的价值不难理解。

 

机器人要在真实环境中执行任务,不仅需要识别物体、理解指令,更需要预判物理世界的变化:球会滚向哪里、衣服如何变形、液体是否会溢出。相比单纯的感知与执行,这种对未来状态的判断能力,正是机器人迈向复杂任务的关键。

 

传统 VLA 模型受限于动作监督数据,更容易学习行为模式,而非真实的物理规律和任务演化过程。以英伟达 Cosmos-Policy 为代表的显式世界模型,则试图通过视频生成和未来画面预测来弥补这一不足。然而,像素级预测带来的训练与推理开销十分巨大,难以满足机器人实时控制对延迟、稳定性和成本的要求。

 

Being-H0.7 则开辟了另一条路线:隐式具身世界模型。

image.png

不同世界模型在训练级显卡、消费级显卡与端侧芯片上的推理速度对比(单位FPS,越大越好),×表示
芯片硬件受限

智在无界的测试结果显示,Being-H-Flash 的推理速度不仅在 A8004090 等高算力平台上达到了 30~45 FPS,更在百 TOPS 级端侧平台上实现了 接近 20FPS  的实时效果。相比之下,Cosmos-Policy 等世界模型在同类平台上大多停留在个位数 FPS,明显低于主流 VLA 模型,而多数显式世界模型甚至难以部署到 Orin NX 等百 TOPS 级端侧芯片上。

 

Being-H-Flash 的意义远不止于更快。它让世界模型摆脱了对高端 GPU 的天然依赖,不再局限于云端或工作站环境。对于机器人而言,端侧实时运行意味着更短的控制闭环、更低的通信依赖和更稳定的系统响应,也意味着世界模型能够真正参与动态抓取、流水线分拣、柔性物体操作、液体倾倒等复杂任务的实时决策,成为机器人在线控制系统的一部分。

 

开辟隐空间具身范式,引领规模与成本变革

 

Being-H-Flash 闪电般推理速度,源于其背后Being-H0.7 所开创的隐式具身世界模型路线。

 

传统显式世界模型通常依赖生成未来画面来理解未来状态。但智在无界研发团队认为,像素级预测并不是机器人控制真正需要的目标,反而会带来两方面问题:一方面,模型需要学习大量与动作决策无关的视觉细节,例如头发纹理、衣物褶皱或环境颜色等,这些信息几乎不会影响机器人动作,却会干扰模型对关键控制因素的学习;另一方面,未来画面的生成本身也会带来巨大的训练和推理开销。

 

因此,作为国内隐式世界模型的开创者,Being-H0.7 并不在训练和推理过程中逐帧生成未来图像,而是在多模态感知与动作生成之间引入一组可学习的 latent query,将当前观测、任务目标以及对未来交互的判断压缩到紧凑的潜空间中。通过这种方式,模型无需依赖像素级 rollout,依然能够保留世界模型对未来的预测能力。本质上,它将预测未来从像素空间转移到了潜空间。

 

image.png

有别于英伟达的显式路线,Being-H0.7首次开创了人类视频预训练”+“潜空间推理相结合的隐式世界模型路线

不过,放弃像素级监督并不意味着降低难度。恰恰相反,隐空间世界模型对数据规模和模型预训练管线提出了更高要求。为此,智在无界在 Being-H0.7 上使用了 超过 20 万小时第一人称人类视频和 1.5 万小时机器人示教数据。在此之前,Being-H0 Being-H0.5 已先后完成了 1000 小时和 1 万小时人类视频预训练的行业突破。智在无界将这三次数据规模跨越称为第一级跃迁,并围绕这一 Scaling Law 持续构建模型能力上限。

 

但对于机器人而言,仅有能力上限并不足以支撑大规模落地。除了数据与模型规模带来的第一级跃迁之外,智在无界还在持续推动另一条同样重要的路线——推理效率与部署能力的第二级跃迁。此次发布的 Being-H-Flash,正是第二级跃迁的集中体现:在保留世界模型预测能力的同时,实现了端侧实时部署,让世界模型真正具备走出实验室的可能。

 

国产/英伟达双芯适配,回应芯模协同战略需求

 

过去两年,机器人行业在很大程度上沿用了大模型的发展逻辑:更大的模型、更强的算力、更高性能的 GPU

 

但机器人终究不是云端服务,而是需要走向真实世界的硬件产品。成本、功耗、散热、供应链、空间尺寸以及量产一致性,都是无法回避的现实约束。即便世界模型在数据中心表现优异,一个现实的问题是:如果其须依赖高端算力平台才能运行,那么机器人规模化落地的成本就很难真正下降,也就难形成真正的商业闭环。

 

对于机器人而言,实时运行本质上是一个系统工程。隐式世界模型带来的效率优势,只是拿到了商业化落地的入场券。真正决定产品上限的,仍然是数据、模型、控制、硬件以及推理基础设施之间的协同能力。

 

正因如此,围绕 Being-H0.7,智在无界构建了一整套面向端侧部署的后训练与推理基础设施,以保证模型在有限算力条件下依然能够稳定、精准地输出动作,其中包括自研的 Universal Async ChunkingUAC)等多项核心推理优化技术。

 

Being-H-Flash是一套模型、系统与硬件协同优化的完整方案:模型侧通过隐空间推理避免像素级 rollout,系统侧通过异步动作块机制维持实时控制,芯片侧则针对不同平台进行推理图、算子调度和内存访问优化。最终实现了世界模型在百 TOPS 级端侧芯片上的实时运行。在极限条件下,Flash 版本甚至能够在保持模型能力基本不变的前提下,将单步推理延迟压缩至毫秒级。

image.png

Being-H-Flash产品矩阵,以隐式世界模型为基座,从auraventusprocella,逐级推进真实场景机器人的部署效率和性能

围绕不同部署需求,智在无界规划了完整的 Being-H-Flash 产品矩阵。该系列除了模型核心能力的逐级递增,更大的区别在于推理效率、部署优化程度以及场景适配深度。

 

其中,基础版 Being-H-aura 面向通用场景,提供隐式世界模型的标准推理能力,相较传统显式世界模型可获得约 23 倍的推理速度提升;

 

加速版 Being-H-ventus 则进一步融合自研推理加速技术,在不损失模型能力的前提下显著提升端侧运行效率;

 

旗舰版 Being-H-procella 则面向产业落地需求,能够结合具体机器人本体、芯片平台与业务场景进行深度定制化优化,在推理性能、资源利用率与部署效果之间取得最佳平衡,可面向百 TOPS 级芯片实现实时部署。

 

这也是国内首次以推理效率为核心能力推出世界模型产品方案,其背后的商业逻辑十分明确:世界模型不再只是实验室中的研究成果,而正在演变为一种可交付、可部署、可规模化复制的产品能力,能够根据不同硬件平台、应用场景和 SOP 要求进行灵活适配。

 

过去一年中,智在无界积累了丰富的世界模型工程化落地经验,对于全新的芯片架构或硬件环境,Being-H-procella可以在24周之内实现从零开始的定制化适配,并将性能差距控制在主流参考平台的 5% 以内,为国产芯片与行业应用的快速落地提供了现实路径。

 

Being-H-procella 已同时完成英伟达与国产芯片平台适配,并在国产百 TOPS 级端侧算力平台上实现有效运行。这意味着模型架构已经具备面向下一代国产机器人芯片的协同能力,也意味着国产世界模型+国产芯片开始从产业愿景走向可验证的工程实践。

 

这是国产世界模型首次在国产百 TOPS 级端侧芯片上实现实用化部署,智在无界在其旗舰产品Being-H-procella 中整合了多项自研推理加速算法、算子与部署模块,并针对国产芯片架构特点进行了深度优化,最终完成这一关键突破。它意味着在具身智能领域,国产模型与国产算力平台开始具备协同演进的能力,并有机会依托国内完整的产业链体系持续降低部署成本、加速产品迭代,推动世界模型真正走向规模化应用。

 

世界模型的商业破晓时刻,让机器人干活费用降至150/

 

机器人的商业化,最终都要回到一笔清晰的成本账。

 

在这一点上,机器人与自动驾驶有着相似的逻辑。两者都属于高频实时系统,无法依赖云端持续输出决策。哪怕只有一两秒的延迟或断连,也可能导致流水线机器人将螺丝拧穿电路板,或者在服务场景中失去稳定控制。同时,机器人要实现规模化普及,成本必须被控制在合理范围内,这意味着不可能长期依赖高性能 GPU 作为计算平台。

 

过去,世界模型往往被视为一条更聪明、也更昂贵的路线。它能够帮助机器人理解动态变化、物理规律和长时序后果,但显式视频预测带来的巨大算力开销,也让这类能力难以进入低成本机器人平台。

image.png

为了量化这一问题,智在无界以单台机器人日扫码2000件快递为例,对不同方案进行了月度算力成本测算。在同类任务下,由于难以摆脱对高性能GPU部署的依赖,NVIDIA Cosmos 及多种显式世界模型方案的月算力成本均在8000元以上,而 Being-H-Flash 的运行成本仅为约为150元,相较前者降低了98%,甚至显著低于VLA代表作π0.5

image.png

 

这组数据揭示了一个重要趋势:当世界模型从显式像素生成转向隐式潜空间推理,其部署成本曲线也将发生根本性变化。

 

 

过去两年,大模型行业已经反复证明,市场对成本极为敏感。无论能力多强,如果使用成本长期居高不下,就很难形成规模化应用。对于机器人而言,高昂的算力开销显然是难以持续的。

 

从这个角度看,Being-H-Flash 的意义正在于重新平衡世界模型的能力与成本。它既保留了世界模型对未来交互和物理过程的建模能力,又避免将推理过程变成昂贵的视频生成任务;既支持真实机器人的闭环控制,又能够在百 TOPS 级端侧芯片上实现实时运行。

 

对于用户而言,这意味着不必再在模型能力部署成本之间做极端取舍。一方面,端侧实时运行降低了对云端网络的依赖,使机器人能够在工厂、仓储、门店和家庭等复杂环境中保持稳定运行;另一方面,对国产芯片平台的支持也为整机厂提供了更灵活的供应链选择。

 

过去只有高端硬件才能运行的世界模型,开始具备进入更多机器人产品的可能。在仓储物流中,机器人可以更稳定地处理高速变化的包裹;在工业产线中,机器人能够根据物体运动轨迹和接触关系实时调整动作;在商超、家庭和服务机器人场景中,模型则能够更好地处理柔性物体、液体、工具使用以及多阶段任务。

 

当世界模型的端侧算力门槛下降,许多过去受限于成本和部署条件的场景也将被重新打开,从高成本智能可量产智能

 

关于智在无界:

 

智在无界BeingBeyond专注于具身通用基础模型的研发与应用,是国内率先提出以大规模人类视频数据训练通用模型框架的企业,也是国内首个推出原生隐式空间世界模型的AI初创公司。以“推动人形机器人从实验室走向日常生活”为使命,智在无界致力于解决具身智能的底层核心技术难题,引领人形机器人技术革命。

 

智在无界成立于20255月,已完成「海量人类视频训练」的多个重要里程碑:相继发布全球首个基于一千小时、一万小时、二十万小时人类视频预训练的具身模型 Being-H0H0.5H0.7。在多项国际性权威评测中,Being-H0.7综合排名全球第一,同时也是首个覆盖跨本体、跨场景、连续动态、流体、柔性物体、物理规律与上下文推理等七大关键维度的通用世界模型。

 

智在无界创始人卢宗青是北京大学计算机学院长聘副教授,国家级青年人才,智源学者,长期担任 ICMLNeurIPSICLR等顶级会议(高级)领域主席。公司核心技术开发人员占比超过70%,博士学历占比近60%,主要来自 北京大学、清华大学、中国人民大学、南洋理工大学、南加州大学等国内外知名高等院校。


2026年六大主流geo优化软件测评实录带你避开选型隐形陷阱

大消费geo优化软件

进入2026年,全球数字营销的底层逻辑已完成从“流量竞价”到“逻辑确权”的代际更替。

2026-04-15

2026年五家geo优化服务商能力解构护航年度选型价值突围

大消费geo优化服务商

在2026年,企业数字营销的顶层逻辑已发生根本性逆转:流量的分配权已从传统的“关键词竞价”转移到了大...

2026-04-15

2026 年外汇交易平台排行榜十大排名评测报告 - 多维度对比解析

金融科技外汇交易平台

根据《2024 全球外汇经纪商行业报告》显示,全球外汇市场日均交易量已达 7.5 万亿美元,同比增长...

2026-04-15

新疆“超级棉田”迈向全无人化,现存棉花相关企业超216.4万家

大消费天眼查

新疆“超级棉田”迈向全无人化,现存棉花相关企业超216.4万家

2026-04-15

中国电动汽车海外“狂飙”,国内现存电动车相关企业超180万家

大消费天眼查

中国电动汽车海外“狂飙”,国内现存电动车相关企业超180万家

2026-04-15

加中电动汽车合作前景广阔,国内现存新能源汽车相关企业超178万家

大消费天眼查

加中电动汽车合作前景广阔,国内现存新能源汽车相关企业超178万家

2026-04-15

物业“大撤退”,国内现存物业相关企业超402万家

大消费天眼查

物业“大撤退”,国内现存物业相关企业超402万家

2026-04-15

中国物流加速迈向智能化,现存物流相关企业超192万家

大消费天眼查

中国物流加速迈向智能化,现存物流相关企业超192万家

2026-04-15

“拼豆热”点燃手作热潮,现存体验经济相关企业超33.8万家

大消费天眼查

“拼豆热”点燃手作热潮,现存体验经济相关企业超33.8万家

2026-04-15

3月我国汽车产销显著回暖,现存相关企业超175.6万家

大消费天眼查

3月我国汽车产销显著回暖,现存相关企业超175.6万家

2026-04-15

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

ATFX:阿联酋突然退群背后:全球油价正被三重力量主导

ATFX:阿联酋突然宣布退出欧佩克,令其盟友措手不及。在加入欧佩克六十年后,阿联酋决定于下个月正式退...

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

优选空天科工在阿联酋设立总部,正式进入中东市场

中东已成为中国一些知名公司的投资热土。

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

2026年4月22日至24日,第20届中国投资年会·年度峰会于北京海淀盛大召开

第四届中国研究生金融科技创新大赛在南京收官

第四届中国研究生金融科技创新大赛在南京收官

12月28日,第四届中国研究生金融科技创新大赛在南京落幕。

京杭对话:杭州,凭什么吸引北京创新企业?

京杭对话:杭州,凭什么吸引北京创新企业?

从一张精准的产业蓝图,到一个敏捷的创新操作系统,再到一片丰沃的赋能土壤,杭州的生产性服务业正在这条路...

第19届中国投资年会·有限合伙人峰会在沪成功举办

第19届中国投资年会·有限合伙人峰会在沪成功举办

11月27日,由投中信息和投中网主办的第19届中国投资年会·有限合伙人峰会在上海举办。

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

在区域经济协同发展的大背景下,京杭两地的经济协作正以一种全新的姿态加速推进。