更多精彩 >

从视觉生成到世界模型:智象未来HiDream-O1-Image-Pro亮相,资本持续加码

2026-05-21 23:25:11   来源:同花顺财经  作者: 

摘要:5月19日,智象未来在北京以“ImagingtheWorld”为主题举办首届技术开放日,正式发布基于原生全模态架构UnifiedTransformer(UiT)打造的图像大模型HiDream-O1-Image-Pro。

5月19日,智象未来在北京以“Imaging the World”为主题举办首届技术开放日,正式发布基于原生全模态架构Unified Transformer(UiT)打造的图像大模型HiDream-O1-Image-Pro。该模型参数规模超过2000亿,在多个基准测试中刷新SOTA纪录,标志着智象未来在图像、视频、文本、音频等多模态统一建模方向上迈出关键一步。

image.png

与此同时,智象未来宣布完成新一轮亿级融资,深创投、金浦投资、财鑫资本、复聚资本等机构参与。这是公司半个月内再次完成融资,资本市场对其原生全模态大模型方向及世界模型布局持续看好。

 

架构革新:从“单模态拼接”到“原生融合”

当前图像生成模型正从U-Net向扩散Transformer(DiT)演进,但主流的潜在扩散模型(LDM)仍存在图像与文本分离编码带来的语义理解、细节还原、文字渲染等瓶颈。智象未来此次发布的HiDream-O1-Image-Pro,将原始图像像素、离散文本标记和任务条件统一纳入连续共享标记空间,实现图像、文本与多任务条件在底层表征上的深度融合。

智象未来创始人兼CEO梅涛表示:“很多‘多模态大模型’本质仍是单模态拼接。原生多模态从一开始就把世界的规则刻进模型里——它知道物理定律、空间关系、因果逻辑,能真正理解、推理并重构世界,这是实现AGI的关键路径。”

image.png

智象未来联合创始人兼CTO姚霆介绍,此前采用同一架构的HiDream-O1-Image开源版本(8B参数)已在Artificial Analysis文生图榜单上登顶开源模型全球第一,超越Z-Image Turbo、Qwen-Image等主流模型,成为前20名中参数量最小的版本。此次发布的闭源Pro版本拥有超2000亿参数,在复杂文本渲染、指令编辑、多主体个性化等任务上全面树立新SOTA,验证了原生全模态架构的可扩展性。

image.png

 

行业共识:视觉生成是通往世界模型的关键阶梯

开放日圆桌论坛上,来自东方富海、微软亚洲研究院、阿里云等嘉宾围绕“从多模态到全模态,构建世界模型,走向AGI”展开对话。嘉宾认为,AI正从“生成视觉”走向“生成世界”,视觉生成、具身智能、Agent等方向的汇合,核心在于模型能否形成统一的跨模态世界表征。

原生全模态架构的价值,正是为图像、视频、文本、音频乃至动作和具身数据提供统一建模框架,使模型从单点能力走向完整的世界建模能力。这也是智象未来强调“Imaging the World”的深意——不只是生成视觉内容,而是让AI逐步具备理解、生成、构建世界的能力。

image.png

 

资本加速入场:半月内完成多轮融资,阵容日趋多元

不久前,智象未来宣布完成超5亿元融资,投资方包括安徽省产投、合肥产投、东方富海等。开放日上,公司透露融资持续提速,半月内再度完成新一轮亿级融资,深创投、金浦投资、财鑫资本、复聚资本加入。

至此,智象未来已形成由安徽、上海、湖南、杭州等多地产业基金持续跟进,深创投、东方富海、峰华资本、敦鸿资本等头部市场化VC参与的多元化资本阵容。

image.png

智象未来采用“模型+智能体”双轮驱动战略,形成“1+1+3”业务架构:底层HiDream系列大模型,中间HiHarness企业服务平台,上层覆盖商业营销、影视创作、社媒创作三大场景的智能体应用。

商业营销智能体HiBurst:覆盖跨境电商、内容营销等场景,已成为TikTok官方TOP5服务商,年生产电商营销视频超百万条。

影视创作智能体帧赞:支持电影级画质生成与“创意-分镜-成片”全流程,已累计制作短漫剧超5000分钟,入驻专业团队超千家。

社媒创作智能体vivago:近日完成升级,支持分钟级故事视频生成,登顶Product Hunt日榜第一,覆盖100多个国家及地区,服务超4000万用户。

开放日现场,智象未来还与上海电影集团上影新视野基金、蓝色光标、北京捷成世纪、倍尔健康等达成战略合作,推动大模型在影视、营销、跨境电商、医疗等行业的产业化落地。


猜你喜欢

最高评级!中关村科金通过信通院可信AI智能体平台和工具5级认证

智能+中关村科金

近日,中关村科金得助智能体平台正式通过中国信息通信研究院可信AI智能体平台和工具评估,获评最高等级5...

11小时前

上线一周冲进龙虾 MCP 热榜,AI 搜索产品正在从工具变成基础设施

智能+AI 搜索

2026 年的 AI 圈,一个看似反直觉的现象正在发生:当大模型能力不断跃升、参数规模持续膨胀时,开...

1天前

镜识科技金永斌受邀亮相韩国KBS纪录片《人才争夺战2》,机器人Bolt诠释中国科创硬实力

智能+镜识科技

2026年5月14日,韩国 KBS 1TV《洞察纪录片》栏目播出《人才争夺战 2:中国速度》,镜识科...

2天前

2025人形机器人行业报告:宇树出货量与市场占比双第一

智能+人形机器人

人形机器人产业在2025年达成了关键的一次跃升,正式告别了单纯的技术验证时期,步入了以初步商业化以及...

2天前

亚辉龙:2026年Q1营收3.98亿元,归母净利润同比增长76.89%

亚辉龙:2026年Q1营收3.98亿元,归母净利润同比增长76.89%

2026-04-29

贵金属投资哪个平台比较好?万洲金业以实力、服务铸就高口碑!

贵金属投资哪个平台比较好?万洲金业以实力、服务铸就高口碑!

2026-04-29

深圳典当行有哪些?2026十佳本土品牌

深圳典当行有哪些?2026十佳本土品牌

2026-04-29

GEO优化服务核心实力测评与优质机构深度盘点

2026年智能流量全域竞争解析|GEO优化服务核心实力测评与优质机构深度盘点

2026-04-29

2026年GEO服务商深度测评|六大核心评定标准

2026年GEO服务商深度测评|六大核心评定标准,十大垂直深耕型GEO服务机构盘点

2026-04-29

汇正财经深度参与WAIC CONNECT香港峰会

《引力点・超燃独角兽》启动!汇正财经深度参与WAIC CONNECT香港峰会,以专业投研赋能科创资本...

2026-04-29

石斛消费观察:紫皮石斛原浆、铁皮石斛原浆与霍山石斛原浆有何区别

五一石斛消费观察:紫皮石斛原浆、铁皮石斛原浆与霍山石斛原浆有何区别

2026-04-29

从Agent到数字人:SentiPulse推出SentiCat探索长期交互路径

从Agent到数字人:SentiPulse推出SentiCat探索长期交互路径

2026-04-29

2026年4月投资APP排行榜揭晓:基于权威官方全维测评,谁更胜一筹?

2026年4月投资APP排行榜揭晓:基于权威官方全维测评,谁更胜一筹?

2026-04-29

穿越“倒春寒”:从2025年报看天邦食品的真实底色与重整前景

穿越“倒春寒”:从2025年报看天邦食品的真实底色与重整前景

2026-04-29

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

ATFX:阿联酋突然退群背后:全球油价正被三重力量主导

ATFX:阿联酋突然宣布退出欧佩克,令其盟友措手不及。在加入欧佩克六十年后,阿联酋决定于下个月正式退...

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

优选空天科工在阿联酋设立总部,正式进入中东市场

中东已成为中国一些知名公司的投资热土。

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

2026年4月22日至24日,第20届中国投资年会·年度峰会于北京海淀盛大召开

第四届中国研究生金融科技创新大赛在南京收官

第四届中国研究生金融科技创新大赛在南京收官

12月28日,第四届中国研究生金融科技创新大赛在南京落幕。

京杭对话:杭州,凭什么吸引北京创新企业?

京杭对话:杭州,凭什么吸引北京创新企业?

从一张精准的产业蓝图,到一个敏捷的创新操作系统,再到一片丰沃的赋能土壤,杭州的生产性服务业正在这条路...

第19届中国投资年会·有限合伙人峰会在沪成功举办

第19届中国投资年会·有限合伙人峰会在沪成功举办

11月27日,由投中信息和投中网主办的第19届中国投资年会·有限合伙人峰会在上海举办。

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

在区域经济协同发展的大背景下,京杭两地的经济协作正以一种全新的姿态加速推进。