更多精彩 >

六项评测达到SOTA,智象未来原生全模态大模型登顶AA开源榜首

2026-05-18 15:39:17   来源:投中网  作者: 

摘要:近日,智象未来旗下图像大模型HiDream-O1-Image以匿名“Peanut”身份登上ArtificialAnalysis文生图榜单,最终以1187ELO分数登顶开源模型全球第一。

近日,智象未来旗下图像大模型HiDream-O1-Image以匿名“Peanut”身份登上Artificial Analysis文生图榜单,最终以1187 ELO分数登顶开源模型全球第一。该模型仅以8B参数规模,在GenEval、DPG、HPSv3、LongText-Bench、GEdit、UniSubject等6项公开评测中达到SOTA(最先进水平),并在长文本渲染、多主体保持、多分镜生成等真实生产场景中表现出显著优势。

image.png

开源即登顶,用户真实偏好验证

Artificial Analysis榜单通过匿名对比、用户投票和ELO动态排名,最大程度减少品牌认知影响,更接近真实用户偏好。HiDream-O1-Image在超过3000个样本对比中取得1187 ELO,超过Z-Image Turbo、Qwen-Image、FLUX.2 [dev]等主流开源模型。开源当日,模型即冲入Hugging Face模型趋势榜前三。

不仅在总榜领先,该模型在多项专业评测中同样位居第一梯队:GenEval、DPG、HPSv3、LongText-Bench、GEdit、UniSubject,均实现同量级领先,并在部分关键指标上超过Qwen-Image(27B)、FLUX.2 [dev]等更大参数模型。

长文本渲染:复杂版面与中英文混排轻松驾驭

在CVTG-2K和LongText-Bench评测中,HiDream-O1-Image展现出较强的长文本生成能力,尤其在中文场景下表现突出。不依赖传统VAE压缩路径,使模型在文本细节保留和字符结构还原上具备天然优势。以中文长文本测试为例,模型得分0.978,高于GPT Image 2的0.961。

这一能力使模型能够真正承担电商营销、品牌设计、媒体内容等图文一体化生产任务——直播带货画面中的商品名称、价格、促销标签、按钮文案,杂志封面中的大标题、副标题、刊期,游戏界面中的角色名称、概率说明、导航菜单等密集文字均可稳定、清晰地呈现。

image.png

(直播场景中,多类商品与互动信息可同时清晰呈现)

 

多主体保持:4-11个复杂组合稳定生成

在UniSubject等评测中,HiDream-O1-Image在多主体复杂组合场景(4-8个乃至9-11个主体)中持续保持稳定表现。人物、服饰、饰品、包袋、鞋履、道具等多种参考对象能够保留各自外观特征和相互关系,减少属性错位、元素丢失和身份混淆。该能力适用于商品组合展示、角色换装、IP形象扩展和个性化创作等真实场景。

image.png

image.png

(多参考图组合生成,风格、材质和组合逻辑上保持一致)

 

多分镜生成:从单图走向视觉叙事

HiDream-O1-Image不仅生成高质量单图,还可在一次推理中生成多宫格连贯故事板,支持人物远景、中景、近景、动作切换和不同视角变化。同一角色在不同画格中姿态变化自然,身份、服装、场景逻辑一致。

image.png

(多分镜画面中,角色形象、动作推进和场景逻辑保持连贯)

 

这一能力对视觉内容生产尤为重要。无论是短片创意、广告脚本、漫画分镜,还是视频前期策划,创作者都需要先有一组结构清晰、镜头明确、角色连贯的视觉方案。比如同一个角色从奔跑、停下、操作设备到再次移动,不同画格之间不仅要姿态变化自然,还要保持人物身份、服装结构和场景逻辑一致。HiDream-O1-Image 在这类任务中的表现,说明它已经开始从“图片生成工具”向“视觉生成工具”延展,具备进入故事板设计、内容策划、漫画制作和视频首帧生成等影视创作工作流的潜力。

此前,智象未来开源模型HiDream-I1上线24小时登顶Artificial Analysis榜单,图像编辑模型HiDream-E1.1进入图像编辑智能体第一梯队,相关开源模型全球下载量超200万次。本次HiDream-O1-Image,以原生全模态架构创新实现性能跃迁并登顶,进一步验证了智象未来在底层模型架构上的持续创新能力。


猜你喜欢

破解具身智能“大脑”进化新路径,“机器人幼儿园”探索自主学习新范式

智能+“机器人幼儿园”

具身智能浪潮奔涌至今,机器人“躯体”的硬件能力日益精进,但“大脑”如何真正理解物理世界、实现自主决策...

2天前

灵童机器人发布新一代桌面人形机器人,启动1000台全球共创计划

智能+灵童机器人

近日,上海灵童机器人(Figurobot)正式启动“你好·未来造物者”社区共创活动,宣布面向全球专业...

2天前

史河机器人率先落地具身智能特种机器人,高危作业场景打开产业化空

智能+史河机器人

2026年,"十五五"规划正式开局,"具身智能"被纳入未来产业方向。

2天前

天梁科技启动新一轮融资:脑机接口与AI内窥镜双驱并进,构建稀缺技术护城河

智能+天梁科技

人工智能与医疗器械的深度融合,正将两个千亿级赛道推向爆发前夜。

4天前

国内十大正规金融理财投资APP平台排名(2026版更新)

金融科技金融理财投资平台

金融理财指的是对财产和债务进行管理,以实现财务的保值、增值为目的。

2025-12-19

国际十大正规伦敦金交易平台排榜单(2026版公布)

金融科技伦敦金交易平台

由于拥有独特而恒久的物理特性,黄金一直被视为对抗通胀和金融市场风险的理想工具——每当法定货币的信用度...

2025-12-19

原创

宁德时代等成立国联芯材科技公司

天眼查宁德时代

【#宁德时代等成立国联芯材科技公司# 注册资本约1.7亿】

2025-12-19

原创

神工股份、国泰海通等在武汉成立创投基金

天眼查神工股份国泰海通

【#神工股份、国泰海通等在武汉成立创投基金# 出资额2亿】

2025-12-19

原创

奇瑞汽车等成立新产业投资合伙企业

天眼查奇瑞汽车

【#奇瑞汽车等成立新产业投资合伙企业# 出资额6.6亿】

2025-12-19

方直科技:AI+教育赛道稀缺标的,产品阳仔AI陪伴机表现亮眼,多维驱动打开成长天花板

上市公司方直科技

AI技术与教育场景的深度融合已成为确定性趋势,政策支持与消费升级共同催生教育智能硬件蓝海市场。

2025-12-19

靠谱炒黄金平台推荐!低手续费+低门槛,新手也能投

金融科技黄金交易平台

全球通胀压力持续和地缘政治局势的紧张,让黄金这一传统避险资产在2025年格外受到青睐。

2025-12-19

君佩珠宝级黄金「时来运转」上市:以匠心转动东方好运,重塑黄金佩戴美学

大消费君佩黄金

在东方文化的深厚底蕴中,“时来运转”不仅是一句吉祥话,更是一种植根于民族集体意识中的美好期盼。

2025-12-19

XR专利第一案:VITURE产品遭禁售,下架欧洲九国

大消费VITURE

近日,德国慕尼黑第一地区法院已作出一审裁决,认定VITURE公司旗下的VITURE Pro等产品侵犯...

2025-12-19

游族网络出席2025产业趋势发展论坛,分享三重驱动力引领价值增长

上市公司游族网络

12月18日,由中国音像与数字出版协会游戏出版工作委员会主办的2025产业趋势发展论坛成功举办,游族...

2025-12-19

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

ATFX:阿联酋突然退群背后:全球油价正被三重力量主导

ATFX:阿联酋突然宣布退出欧佩克,令其盟友措手不及。在加入欧佩克六十年后,阿联酋决定于下个月正式退...

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

优选空天科工在阿联酋设立总部,正式进入中东市场

中东已成为中国一些知名公司的投资热土。

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

2026年4月22日至24日,第20届中国投资年会·年度峰会于北京海淀盛大召开

第四届中国研究生金融科技创新大赛在南京收官

第四届中国研究生金融科技创新大赛在南京收官

12月28日,第四届中国研究生金融科技创新大赛在南京落幕。

京杭对话:杭州,凭什么吸引北京创新企业?

京杭对话:杭州,凭什么吸引北京创新企业?

从一张精准的产业蓝图,到一个敏捷的创新操作系统,再到一片丰沃的赋能土壤,杭州的生产性服务业正在这条路...

第19届中国投资年会·有限合伙人峰会在沪成功举办

第19届中国投资年会·有限合伙人峰会在沪成功举办

11月27日,由投中信息和投中网主办的第19届中国投资年会·有限合伙人峰会在上海举办。

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

在区域经济协同发展的大背景下,京杭两地的经济协作正以一种全新的姿态加速推进。