更多精彩 >

MiniMax紧盯底层模型加速迭代,旗下海螺AI访问量全球居首

2025-02-20 18:44:29   来源:解放日报  作者: 

摘要:DeepSeek的走红,如同一颗超新星爆发,释放出巨大能量,瞬间照亮了中国的AI星系。

DeepSeek的走红,如同一颗超新星爆发,释放出巨大能量,瞬间照亮了中国的AI星系。在上海人工智能的群星中,稀宇科技(MiniMax)是颇为亮眼的那一颗。

5.png

DeepSeek以文字见长,MiniMax则在文本、视频、语音多模态技术领域保持领先。今年1月的全球AI视频产品榜中,MiniMax旗下海螺AI视频网站全球访问量位居榜首。截至2月上旬,MiniMax以每日生成数百万条视频占据全球第一宝座,每日生成语音量位居国内前二,文本处理量也位居国内前列。在全世界竞争最激烈的领域,这家上海公司如何一步步提升竞争位次,在细分赛道超越顶尖同行?

用一张照片“拍”出电影

用人工智能生成视频,是许多人乐于尝试的应用。但AI的技术缺陷也引来很多吐槽:“上一段视频中生成的是张三,下一段视频就变成了另一张脸。无论怎么调整,都无法让两段视频的主角变成同一人。”人物角色一致性的难题,让AI难以制作出同一人物角色、不同故事情节的短片,大大限制了AI生成视频的应用场景。直到今年1月MiniMax发布最新视频模型,将这一难题彻底化解。用户只需提供1张人物的正面照片,不论生成多少段风格迥异的视频,主角都是这个人。这让网友惊呼,一张照片就能做电影,这不是梦!在创业过程中,MiniMax始终坚持技术驱动。动态视频中如何保持人物面部多角度的真实度和稳定性,如何保持人物角色高度一致……痛点就是MiniMax攻关的重点。开发团队进行了大量技术探索,比选不同的技术路径,最后开发出S2V模型——只需传统方案1%的输入量和计算成本,“上传1张图片”的效果就足够好。在3年多时间里,一次次迭代升级,文生视频、图生视频、主体参考等功能持续优化。这些创新,让海螺AI视频在激烈竞争中杀出重围,使用量反超OpenAI的Sora,用户分布在全球超200个国家和地区。在文生语音等功能上,MiniMax也走出了差异化路线。网友发现,MiniMax的语音功能竟然带有情绪调节和效果器功能,AI生成的语音可以带上开心、难过、生气等情绪,这一创新让有声书和广播剧的生产力大幅提升。“通用人工智能不是简单的互联网流量变化,而是计算范式的颠覆式创新,将会引领生产力、社会分工以及产业结构的深刻变革。”MiniMax创始人闫俊杰说。

画自己的图纸建造大厦

算力、算法和数据是人工智能发展的“铁三角”。MiniMax创立之初,算力和数据十分有限,唯一选择就是在算法上求突破。从2023年夏天开始,公司将80%的算力与研发资源投入底层架构研发,这在外人看来就像一场豪赌。“我们在工程上遇到的很多问题,源于一片漆黑的未知。”公司技术团队在没有成熟经验可供借鉴的情况下,一次次试错,持续进行摸索。 一年后,公司成功推出国内首个基于MoE架构的模型,研发人员又向“注意力机制”难题发起冲击。今年1月,大规模实现线性注意力机制的MiniMax-01模型诞生。这是中国公司首次突破传统Transformer架构,并逐渐为行业广泛认可。

6.png

底层模型能力是决定大模型应用成功与否的首要因素。”MiniMax副总裁刘华告诉记者,虽然照着现成的图纸盖楼相对容易,但图纸的不足也会限制楼房的高度。我们选择用自己的图纸构筑大厦,一开始或许慢一些,但希望能更好应对未来的挑战。底层架构如同AI“新基建”,MiniMax-01模型突破了长文本处理瓶颈,可高效处理最长400万token(词元)的上下文。在工业领域,该模型可以快速解析百万字设备日志,辅助故障诊断;在医疗场景,它可连续跟踪患者数年病历,生成个性化治疗方案。最近两年,大模型技术快速迭代,国际国内AI行业都在白热化竞争。底层模型一次重大迭代对产品带来的优化效果,会远超在工程实现层面对产品进行“雕花”。这也是MiniMax始终紧盯模型本身,加速迭代升级的重要原因。

借助上海优势加快发展

作为上海人工智能高地孵化的代表性企业,MiniMax的成长离不开这座城市独特的文化和基因。上海汇聚了全球顶尖的AI人才,大量富有热情的年轻人才,为产业快速发展提供了支撑。在MiniMax上海总部大楼,研发人员持续增多。2023年6月,还只是一层楼坐了半个楼面,后来很快坐满两层楼。从人工智能行业发展看,成功的模型,就脱胎于科学的做事方法、数百人技术团队的有效组织、坦诚扎实的研发文化。不久前,上海推出人工智能“模塑申城”实施方案,在算力、场景、数据、人才方面推出一批有力举措。上海还积极推动大模型企业与场景企业对接。以MiniMax为例,他们与小红书合作打造生成式智能搜索,与阅文集团合作将数千本小说变成超自然、高保真的有声书等,通过相互赋能实现更快发展。闫俊杰相信,“真正有价值的事,不是当前做得怎么样,而是技术进化的速度。”一如多年前的移动互联网行业,在人工智能这个快速迭代的行业,民营科技企业展现出独特价值,那就是以技术驱动实现快速发展,以灵活机制捕捉前沿趋势,以务实创新解决产业痛点。上海人工智能产业规模已突破4000亿元,规模以上企业超350家。仅“模速空间”及周边,就已聚集255家大模型企业和34个备案大模型。上海的AI宇宙正在加速壮大,更多激动人心的故事正在续写。


猜你喜欢

名家评论之李奎:观音山事件——国企民企平等保护的试金石

创新创业观音山事件

李奎秘书长高度赞扬了观音山公园董事长黄淦波先生。

17小时前

正式亮相|鳍源x索尼水下机器人拍摄解决方案,引领影视产业水下拍摄发展

创新创业鳍源科技

2025年7月23日,第二十九届北京国际广播电影电视设备展览会(以下简称 “2025 BIRTV” ...

21小时前

游族网络与曦望Sunrise达成战略合作,共建AI算力底座赋能游戏研运

创新创业游族网络

7月25日,游族网络与曦望Sunrise正式签署战略合作协议。

22小时前

德兰明海荣膺国际零碳节双项殊荣,以创新储能技术引领绿色发展

创新创业德兰明海

在第四届国际绿色零碳节暨ESG领袖峰会上,深圳市德兰明海新能源股份有限公司凭借行业领先的可持续发展实...

1天前

入选国家级“伙伴计划”首批单位,闪回科技助推废旧手机循环利用规范化

创新创业闪回科技

2025年7月18日,中国循环经济协会与中国资源循环集团电子电器有限责任公司在北京联合举办了手机规范...

1天前

彭博社:贝恩资本旗下Bridge Data锁定创纪录的28亿美元贷款

金融科技彭博社

知情人士表示,这笔贷款的期限为五年,目前正在向更广泛的市场进行银团贷款分销。

2025-03-20

叮当健康O2O首发原研依苏帕格鲁肽a 7*24小时送药上门

医疗健康叮当健康

近日,国内糖尿病治疗领域迎来新突破。

2025-03-20

欢聚集团发布 Q4及全年财报:欢聚盈利水平连续第四年提升 致力全球业务可持续增长

创新创业欢聚集团

北京时间2025年3月20日,欢聚集团(NASDAQ:YY,简称“欢聚”或“集团”)发布2024年第...

2025-03-20

中免集团全球品牌商大会在三亚举行

创新创业中免集团

3月19至20日,以“无界 共振”为主题的中免集团2025全球品牌商大会在三亚举行。

2025-03-20

随牛AI上线观察:技术革新如何破解投顾服务“高冷”困局?

金融科技随牛AI

2025年3月21日,这款基于人工智能与大数据的智能投顾工具宣布全面开放下载,其“科技平权”理念引发...

2025-03-20

中科创星领投实时物理AI仿真平台松应科技

中科创星松应科技

去年下半年,松应ORCA进入公测期,其正式商业化开启于去年年底,满打满算只有3个月时间。

2025-03-20

原创

拟更名“珠免集团” 格力地产聚焦免税大消费新赛道

格力地产

3月18日,格力地产发布公告,拟将公司中文名称变更为“珠海珠免集团股份有限公司”,拟将证券简称变更为...

2025-03-19

顺丰控股:2月业务量9.16亿票 同比增长17.74% 正加速升级空中物流版图

上市公司顺丰控股

3月19日晚,顺丰控股(002352.SZ)披露了2月经营简报。

2025-03-19

原创

小米汽车公布自动紧急呼叫专利

小米汽车

【#小米汽车公布自动紧急呼叫专利# 可最大程度保证救援及时性】

2025-03-19

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

分化浪潮中的坚守与突破 | 第19届中国投资年会,即将启幕

分化浪潮中的坚守与突破 | 第19届中国投资年会,即将启幕

在时代的浩渺长河中,“分化”宛如一条隐匿的脉络,贯穿于万物的生长、发展与变迁。从生命的进化到文明的演...

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会将盛大启幕

第二届中匈可再生能源、新材料商业投资峰会于2025年4月9日在匈牙利布达佩斯盛大启幕。

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

雕刻耐心|第18届中国投资年会·有限合伙人峰会在沪召开

“中国投资年会”作为私募股权行业的年度盛会,已成功举办了18届,吸引了全国VC/PE领域从业者的广泛...