更多精彩 >

电商海报、IP三视图、分镜脚本:这款中国文生图模型正在抢设计师的“脏活累活”

2026-06-12 01:19:33    来源:亿邦动力  作者: 

摘要:当多数人还在用AI生成“好看但用不上”的图片时,一家中国公司已经悄悄把模型送进了广告公司、电商团队和影视分镜室。

当多数人还在用 AI 生成“好看但用不上”的图片时,一家中国公司已经悄悄把模型送进了广告公司、电商团队和影视分镜室。

日前,智象未来(HiDream.ai)的开源模型登顶全球文生图榜单;数周后,其商用版 HiDream-O1-Image-1.5 再进一步,在 Artificial Analysis 榜单上拿下中国第一、全球第二(ELO 1265),超过 Google、NVIDIA 和字节跳动的同类产品。但比排名更值得关注的,是它背后的一条核心信息:原生全模态架构首次通过“生产验证”。

image.png

image.png

什么叫做“生产验证”?

通俗地说,就是模型不仅能在评测集里拿高分,还能在真实的商业工作中稳定交付——比如一张电商海报、一组分镜图、一套 IP 三视图,甚至一块白板上的图文排版。

评测机构 Artificial Analysis 的 ELO 机制,本身就更接近真实用户的选择:匿名对比、随机抽样、偏好投票。但智象未来显然不满足于此。在官方展示的案例中,HiDream-O1-Image-1.5 刻意避开了“唯美但无用”的炫技图,而是拿出了电商海报、分镜设计、IP 形象多视角、复杂文字排版等直接对应商业场景的输出。

image.png

文字不再是“咒语”,而是画面的一部分

长久以来,文生图模型有一个致命短板:写不好字。中英文混排、多级标题、弯曲表面上的文字——几乎都是翻车重灾区。

HiDream-O1-Image-1.5 在这一项上表现出明显差异。在一项制作“高端白酒海报”对比测试(与 Google Nano Banana 2 同题竞技)中,模型成功在羊脂玉瓷瓶的曲面上浮雕出一整首八句古诗,文字内部还嵌入了金箔质感。更关键的是,它同时处理了黑板岩、浅水池、焦散光影、盆景松树等复杂元素——没有一处文字变形,没有一笔错位。

类似的能力也出现在“课堂白板”“数据看板”“直播界面”等生成任务中。这说明模型已经不再把文字当作“贴图补丁”,而是从一开始就将文本 Token 与视觉像素融合在同一个共享空间中。

image.png

image.png

image.png

image.png

image.png

从“单张美图”到“连续叙事”

另一个容易被忽略的能力是分镜与多宫格设计。在“儿童绘本”“冒险故事分镜”“任务推进流程图”等案例显示,模型能够一次性生成多格画面,且保持角色、场景、视觉风格的高度一致。对于需要快速产出脚本视觉稿的广告、动漫、短视频团队来说,这意味着可以从“一张一张抽卡”升级为“一次出一套”。

智象未来内部将这种能力归因于 UiT(Unified Transformer)原生全模态架构。与传统模型将文本、图像、视频分开处理不同,UiT 将所有模态映射到同一个 Token 空间,从底层“青梅竹马”式融合。这使得模型在多主体、多视角、多画面的任务中,天然具备一致性优势。

生产验证”意味着什么?

过去一年,文生图赛道的主旋律是“更大参数、更美画面”。但广告公司、电商运营、游戏美术的从业者普遍反馈:大部分 AI 图只能做灵感素材,很难直接交付给客户。原因集中在:文字乱码、排版不可控、多角色易崩、连续画面不连贯。

HiDream-O1-Image-1.5 的商用版,正是针对这些“最后一公里”问题。它面向的商用场景包括广告营销、品牌设计、电商视觉、游戏内容、影视分镜、IP 创作等——每一个都是高要求的付费场景。

智象未来没有透露具体的客户名单,但从其开放体验平台(vivago.ai / hiharness.ai)和开源版本(GitHub / Hugging Face)的快速迭代节奏来看,这家公司走的是一条“开源验证技术,商用兑现价值”的务实路线。

下一步:从图像生成到世界模型

智象未来的长期目标是构建原生全模态世界模型——图像只是入口,视频、动作、空间关系、音频将逐步整合进同一架构。如果 UiT 路线持续验证,那么未来的模型将不仅能生成一张好看的图,还能理解一个场景中的因果、运动和叙事。

对于内容创作者来说,这或许意味着:AI 不再是偶尔灵光一闪的助手,而是一个可以交付完整作品的生产线。

 


猜你喜欢

硅谷解禁Claude Mythos:AI“攻防战略重器”公开化,国版Mythos 谋乐Elliot已构筑对等防线

智能+Elliot

2026年5月底,全球大模型与安全巨头Anthropic宣布了一项震动行业的决定:此前因展现出极高网...

2天前

杭州启灵云机器人有限公司完成数千万元A轮融资 全栈自研破局康养AI理疗机器人行业痛点

智能+启灵云

近日,杭州启灵云机器人有限公司(以下简称启灵云)宣布完成数千万元A轮融资

2天前

全方位 GEO 排行榜正式发布!2026 年 GEO 服务商五强汇总,配套完整选型方案+行业分析

大消费GEO 服务商

艾瑞咨询数据显示,国内 GEO 产业市场规模逐年攀升,企业布局相关服务的渗透率持续走高。

2026-05-30

geo公司十强权威榜单2026年版:十强机构综合能力穿透分析

大消费geo公司

截至 2026 年 5 月,生成式引擎优化(GEO)已从企业数字营销的"可选动作"升级为"必选战略"...

2026-05-30

2026年五强geo优化软件多维体检报告及企业选型建议

大消费geo优化软件

根据易观《中国 GEO 行业发展报告 2026》显示,2026 年国内 GEO 市场规模已达 30 ...

2026-05-30

2026年六大GEO推广公司深度评测及企业选型实操指南针

大消费GEO推广公司

根据易观发布的《中国 GEO 行业发展报告 2026》显示,2026年国内 GEO 市场规模已达 3...

2026-05-30

2026年GEO服务供应商十强发布:选型决策与行业竞争格局

大消费GEO服务供应商

截至 2026 年 5 月,生成式引擎优化(GEO)已从企业数字营销的"可选动作"升级为"必选战略"...

2026-05-30

2026年geo供应商TOP10深度评测报告:十强机构综合能力穿透分析

大消费geo供应商

截至 2026 年 5 月,生成式引擎优化(GEO)已从企业数字营销的"可选动作"升级为"必选战略"...

2026-05-30

选择财富管理机构,不能只看“产品多不多”

金融科技财富管理机构

过去很多投资者理解财富管理,往往停留在“买哪只产品”“收益怎么样”“手续费多少”这些问题上。

2026-05-29

选择证券APP,不能只看功能多不多

金融科技证券APP

很多投资者选择证券APP时,第一反应是看行情快不快、下单顺不顺、功能全不全。这些当然重要,但在数字化...

2026-05-29

2026年GEO优化公司哪家专业性强?技术能力与效果数据对比解析

大消费GEO优化公司

在GEO行业从概念验证走向规模化落地的2026年,"专业性强"已不再是服务商自述的标签,而是需要技术...

2026-05-29

原创

千亿巨头爆雷!18.5亿天价罚单落地,净利暴跌超60%

消费

18.5亿天价罚单拖累业绩!富途控股净利暴跌超六成

2026-05-29

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

ATFX:阿联酋突然退群背后:全球油价正被三重力量主导

ATFX:阿联酋突然宣布退出欧佩克,令其盟友措手不及。在加入欧佩克六十年后,阿联酋决定于下个月正式退...

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

优选空天科工在阿联酋设立总部,正式进入中东市场

中东已成为中国一些知名公司的投资热土。

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

2026年4月22日至24日,第20届中国投资年会·年度峰会于北京海淀盛大召开

第四届中国研究生金融科技创新大赛在南京收官

第四届中国研究生金融科技创新大赛在南京收官

12月28日,第四届中国研究生金融科技创新大赛在南京落幕。

京杭对话:杭州,凭什么吸引北京创新企业?

京杭对话:杭州,凭什么吸引北京创新企业?

从一张精准的产业蓝图,到一个敏捷的创新操作系统,再到一片丰沃的赋能土壤,杭州的生产性服务业正在这条路...

第19届中国投资年会·有限合伙人峰会在沪成功举办

第19届中国投资年会·有限合伙人峰会在沪成功举办

11月27日,由投中信息和投中网主办的第19届中国投资年会·有限合伙人峰会在上海举办。

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

在区域经济协同发展的大背景下,京杭两地的经济协作正以一种全新的姿态加速推进。