更多精彩 >

AI趋动自动驾驶的质变:来自世界模型开启的场景重建新纪元

2024-12-10 16:26:53   来源:i黑马  作者: 

摘要:在繁华都市的交通脉络中,自动驾驶技术正不断面临着复杂路况的考验。

在繁华都市的交通脉络中,自动驾驶技术正不断面临着复杂路况的考验。就拿北上广城市快速路的限时段公交车道来说,这一特殊场景犹如一道难题横亘在智能驾驶系统面前。

以往,AI系统依赖人类预设规则,在面对限时规则切换时显得僵化。而如今的端到端自动驾驶模型虽旨在自主学习适应,但对于“限时公交车道”这类特殊路况与场景的学习,仍需耗费大量时间,难以迅速达到理想的应对效果。

世界模型与视频生成:自动驾驶的关键拼图

在全球智能驾驶研发的前沿阵地上,基于Artificial General Intelligence(AGI通用人工智能)与世界模型(World Model)的仿真平台相较于传统的单一道路测试,具有显著优势。它能够更加精准地满足日益增长的模拟需求,大幅削减重复采集和分析工作,按照需求生成特定场景,有力提高算法精准度和迭代效率,是实现“端到端”智能驾驶方案的关键基石。

在自动驾驶领域,世界模型和视频生成技术无疑是两块关键拼图。世界模型旨在模拟真实世界环境动态,而视频生成模型则负责产出逼真视频序列,二者的整合对于提升自动驾驶汽车的态势感知和决策能力意义非凡。

早期的视频生成技术尚显稚嫩,难以制作出自然流畅且冗长的视频。那时的模型多在像素级别依据训练数据中的模式预测下一帧,或借助概率模型来优化数据分布近似值,缺乏标准化结构,如长短期记忆(LSTM)、Transformer和生成对抗网络(GAN)等架构都曾被尝试,通过对抗训练艰难提升生成质量。

反观世界模型,其在自动驾驶领域蕴含着巨大潜力。它能够构建完整的场景认知,精准理解各元素间的关联,提前预判整个场景的演变,深入理解意图和因果关系,进而基于整体认知做出决策,甚至预见潜在风险。当世界模型与视频生成模型无缝集成,便如同为自动驾驶汽车的“大脑”装上了更为敏锐的“感官”与更智慧的“思维”,大幅增强其态势感知与决策的准确性。

DriveDreamer4D:开启 4D 驾驶场景重建新纪元

随着大模型技术的蓬勃发展,世界模型技术成为行业瞩目的焦点,引发了自动驾驶领域的创新热潮。极佳科技去年率先提出DriveDreamer,这款全球首个真实世界驱动的自动驾驶世界模型,在工业界和学术界掀起了广泛而热烈的讨论,并成功被国际顶级计算机视觉会议ECCV 2024收录。

今年10月,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等一众实力单位,重磅推出DriveDreamer4D。这一创新成果首次利用世界模型增强4D驾驶场景重建效果,为行业发展开辟了新的路径。

DriveDreamer的功能丰富多样,令人瞩目。它能够生成符合交通结构化信息的视频,仿佛拥有交通规则的“内化知识”;还能依据文本描述轻松改变生成视频的天气、时间等要素,如同掌控着一个虚拟的“气候与时间魔法盒”;更可以根据输入的驾驶动作生成不同的未来驾驶场景视频,或者依据历史的驾驶动作和图像输入预测未来的驾驶动作,就像是一位经验丰富的“驾驶预言家”。

当下的传感器仿真方法,如NeRF与3DGS,存在着对训练数据分布过度依赖的短板。一旦训练数据不足,在面对复杂驾驶操作,如变道、加速或减速时,重建效果便大打折扣。而DriveDreamer4D的出现恰如其分地弥补了这一缺陷,它以世界模型作为强大的数据引擎,基于真实世界的驾驶数据合成新轨迹视频,例如在变道场景中表现卓越。

DriveDreamer4D在提升图像渲染质量方面成绩斐然,它能够显著提升多种重建算法(PVG、S3Gaussian、Deformable - GS)的效果,让驾驶前景(车辆)和背景(车道线)的时空一致性达到新的高度。其总体结构设计精妙,轨迹生成模块(NTGM)犹如一位智能“调度员”,灵活调整原始轨迹动作,如转向角度和速度,从而生成全新的轨迹。这些新轨迹就像是打开新世界的钥匙,为提取结构化信息(车辆3D框和背景车道线细节)提供了前所未有的视角。紧接着,凭借世界模型的视频生成能力,以更新轨迹后得到的结构化信息作为控制条件,顺利合成新轨迹的视频。最后,将原始轨迹视频与新轨迹视频巧妙融合,对4DGS模型进行优化,如同为模型注入了源源不断的活力,使其在user study实验中斩获超过80%的偏好投票,向着空间智能和4D世界模型昂首迈进坚实的一步。

回顾DriveDreamer系列,其发展历程亦是熠熠生辉。DriveDreamer作为首个面向真实驾驶场景的世界模型,具备根据不同控制条件生成自动驾驶周视视频的能力,如同给自动驾驶汽车装上了“千里眼”,有效提升了BEV感知的性能。DriveDreamer - 2则更进一步,创新性地引入大语言模型,摇身一变成为“驾驶场景定制大师”,能够生成用户自定义的驾驶数据,为长尾和corner case场景下的数据生成难题提供了巧妙的解决方案,进一步提升了数据生成能力。DriveDreamer4D充分利用DriveDreamer系列的技术积累,针对端到端自动驾驶和闭环仿真对场景重建的急切需求,生成新轨迹视频(如变道、加减速),成功大幅提升了多种4DGS算法的重建效果,让自动驾驶场景重建技术实现了质的飞跃。

极佳科技:自动驾驶创新浪潮中的领航者

作为DriveDreamer4D论文的牵头完成单位,极佳科技无疑是自动驾驶领域的一股强劲力量。这是一家专注于空间智能的先锋企业,以将视频生成提升到4D世界模型为使命,全力赋予AI大模型对4D空间的理解、生成、常识和推理能力,力求实现4D空间中的交互与行动,向着通用空间智能奋勇前行。

极佳科技在影视游戏、元宇宙等虚拟空间的内容创作领域,以及自动驾驶、具身智能等物理空间的数据生成与认知推理方面,都拥有不可估量的价值。它在国内率先踏上探索和布局世界模型和空间智能方向的征程,并在技术研发与商业拓展两方面都收获了累累硕果,赢得了行业的广泛赞誉与认可。

在近期举办的现代汽车集团创新计划颁奖典礼上,极佳视界凭借其在4D世界模型和视频生成领域的卓越创新表现,荣耀斩获现代集团“灯塔”创新开放计划“创新企业奖”。现代汽车作为全球汽车制造业的巨头,刚刚跨越全球产量1亿台的伟大里程碑(2024.09),极佳科技此次获奖,无疑为其进军海外市场,服务类似现代汽车的国际客户打造了一个极具说服力的成功案例,也标志着其在全球自动驾驶舞台上崭露头角。

如今,极佳科技的相关技术已经在智驾行业的头部客户中落地生根,已与近20家汽车厂家和智驾方案商建立了紧密的合作关系,充分展现出其广阔的应用前景。

以公司与全球出行科技企业亿咖通科技强强联手为例,双方致力于建设基于先进的生成式AI和视觉大模型的仿真模拟平台,旨在高效推动智能驾驶技术的发展验证及功能迭代。

通过此次合作,双方将精心打造融入真实道路环境和传感器特性的场景库,借助对AGI能力的持续建设与迭代升级,生成高度真实、丰富多样的虚拟驾驶场景与交通流。这些形成的空间场景具备多视角及多车型的泛化能力,并且能够针对特殊场景(corner case)进行量化生成,与测试车实测完美结合,共同构建起高效的模拟平台。这一平台将加速智能驾驶的场景仿真、预判和功能开发效率,显著提升有效道路验证公里数。

该仿真平台将率先聚焦ACC、AEB、NOA等相关功能,深入开展算法仿真和回灌工作,不断提升模拟精度,大幅提高道路和泊车场景验证效率,有效推动相关算法模型的迭代更新,助力核心技术的快速研发和能力提升,全方位满足未来行泊一体智驾能力的研发需求,最终打造出更安全、更自然、能够适配更多场景和车型的智能驾驶解决方案。

更为重要的是,除了将生成式AI大模型应用于感知能力的提升以及现有驾驶功能的测试和迭代之外,双方还将携手探索世界模型在下一代智能驾驶解决方案中的前瞻研发与落地应用。

在自动驾驶的漫漫征途中,极佳科技以DriveDreamer4D为利刃,以世界模型为核心驱动力,正与合作伙伴们并肩作战,划破技术的重重迷雾,驶向智能驾驶的未来新蓝海。有理由相信,在这样的创新力量推动下,自动驾驶的明天将更加安全、高效、智能,让我们拭目以待这一伟大变革的全面到来。


香港十大专业期货交易平台最新排名:交易灵活、体系完善!

金融科技期货交易平台

在全球经济波动加剧的背景下,期货交易凭借其高流动性、双向交易机制和风险对冲功能,成为投资者资产配置...

2026-01-22

原创

欢迎安哥拉钻石领导机构 ENDIAMA E.P. 与 SODIAM E.P. 正式加入天然钻石协会

大消费ENDIAMA E.P.SODIAM E.P.

上海,1 月 22日 —— 天然钻石协会(Natural Diamond Council,简称 ND...

2026-01-22

原创

东北第一个航天IPO,要来了

长光卫星

商业航天的风,终于吹到了东北。

2026-01-22

原创

股价暴涨!又一超级风口来了?

如果两大巨头的财报和财报电话会议传递出更积极、更超预期的信号,将对A股的CPU板块形成利好。

2026-01-22

美的与长安汽车签署战略合作 加速“人-车-家”生态价值释放

上市公司美的集团

近日,美的集团与长安汽车签署战略合作协议,双方将聚焦“人-车-家”智慧生态,共建智能家居与智能汽车的...

2026-01-22

大扫除逛京东家清送汽车!26辆埃安UT super、千元超市卡天天抽

京东大消费

随着春节临近,居家扫除焕新成为家家户户的“头等大事”。

2026-01-22

叮当健康加码AI研发及应用,承接蚂蚁阿福线上流量,叮当健康持续打造数字健康新标杆

上市公司叮当健康

近年来,随着人工智能技术的快速发展,AI与医疗健康的深度融合已成为行业重要趋势。

2026-01-22

持续领跑AI,浩鲸科技斩获钛媒体「最佳AI产业公司」

智能+浩鲸科技

近日,钛媒体2025 EDGE AWARDS全球创新评选成果重磅发布。

2026-01-22

康缘药业新药大突破,燃爆超800亿市场

上市公司康缘药业

近日,CDE官网显示,康缘药业的中药2.1类新药热毒宁颗粒提交NDA获受理,用于治疗流行性感冒(风热...

2026-01-22

2026年首场京东品酒会在广州举办,京东生鲜超级供应链让产地和农户增产又增收

京东大消费

1月20日,2026年首场京东品酒会在广州香格里拉大酒店成功举行。

2026-01-22

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

ATFX:阿联酋突然退群背后:全球油价正被三重力量主导

ATFX:阿联酋突然宣布退出欧佩克,令其盟友措手不及。在加入欧佩克六十年后,阿联酋决定于下个月正式退...

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

优选空天科工在阿联酋设立总部,正式进入中东市场

中东已成为中国一些知名公司的投资热土。

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

2026年4月22日至24日,第20届中国投资年会·年度峰会于北京海淀盛大召开

第四届中国研究生金融科技创新大赛在南京收官

第四届中国研究生金融科技创新大赛在南京收官

12月28日,第四届中国研究生金融科技创新大赛在南京落幕。

京杭对话:杭州,凭什么吸引北京创新企业?

京杭对话:杭州,凭什么吸引北京创新企业?

从一张精准的产业蓝图,到一个敏捷的创新操作系统,再到一片丰沃的赋能土壤,杭州的生产性服务业正在这条路...

第19届中国投资年会·有限合伙人峰会在沪成功举办

第19届中国投资年会·有限合伙人峰会在沪成功举办

11月27日,由投中信息和投中网主办的第19届中国投资年会·有限合伙人峰会在上海举办。

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

在区域经济协同发展的大背景下,京杭两地的经济协作正以一种全新的姿态加速推进。