更多精彩 >

MMMU权威评测榜更新,云知声山海UniGPT-mMed荣登榜首

2024-10-08 20:16:48    来源:天极网  作者: 

摘要:近日,多模态人工智能模型基准评测集MMMU更新榜单,云知声山海多模态大模型UniGPT-mMed以通用能力、医疗专业能力双双排名第一的优异成绩登顶榜首,力压GPT-4V,充分彰显其硬核实力。

近日,多模态人工智能模型基准评测集MMMU更新榜单,云知声山海多模态大模型UniGPT-mMed以通用能力、医疗专业能力双双排名第一的优异成绩登顶榜首,力压GPT-4V,充分彰显其硬核实力。

 

image.png

 

作为国内权威多模态基准评测,MMMU由IN.AI Research等多家机构联合构建,专注于考量人工智能在解决大学层次多学科问题时的多模态理解与推理能力。

该评测集涉及艺术与设计、商科、科学、健康与医学、人文与社会科学、技术与工程等六个常见学科,包含 1.15 万个精心选取的多模态问题,涵盖 30 个不同的科目和183 个子领域。同时,MMMU 中许多问题都需要专家级的推理能力,例如,使用傅立叶变换或均衡理论来推导问题的解,这在满足评测内容广泛性的同时,也确保了其深度。

此外,MMMU还提出了两个独特的挑战:一是其涵盖多种图像格式,从照片和绘画等视觉场景到图表和表格,可用于测试 LMM 的感知能力;二是MMMU的输入形式是文本和图像的混合,要求AI模型能够将图像和文本信息结合起来进行深入理解,并在此基础上执行复杂推理。这不仅考验了模型的学科知识储备,也对其综合分析和应用能力提出了更高要求。

评测结果显示,云知声山海多模态大模型UniGPT-mMed以总分57的优异成绩登顶榜首,并在健康与医学细分赛道超越GPT-4V,力压一众大模型拔得头筹,充分展现出其在拥有业内一流的通用能力之外,更具备打造世界领先的行业大模型的能力。

 

image.png

 

UniGPT-mMed是云知声基于山海大模型底座构建的多模态大模型。其通过分析和整合海量论文、书籍及网站数据,利用精细化数据处理技术,自动识别并提取图片及其相关文本描述,并通过多模态分析技术评估图片的质量和图文之间的匹配度,筛选出最优数据。与此同时,系统能够参考图片和上下文信息对图片进行重新描述,使得图文数据更加对齐。

通过预设问答场景,UniGPT-mMed能够将图文对齐数据转化为高质量的场景问答数据集,并采用思维链和自我反思技术,进一步优化生成数据,最终构建起一个包含数亿条高质量图文问答的数据集,进而为用户提供更加丰富、准确和可靠的信息检索和问答服务。

此次评测,是云知声在多模态大模型赛道持续深耕、不断技术创新的成果体现。

作为中国AGI技术产业化的先行者,云知声于2016年开始打造Atlas人工智能基础设施,并以此为基础,构建云知大脑(UniBrain)技术中台——以山海(UniGPT)通用认知大模型为核心,结合多模态感知与生成、知识图谱、物联平台等智能组件,为云知声智慧物联、智慧医疗、智慧座舱、智慧交通等业务提供高效的产品化支撑,持续推动“U(云知大脑)+X(应用场景)”战略布局,致力推动千行百业的智慧化升级。

作为云知大脑的核心,山海大模型具备语言生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、安全合规能力七项通用能力及插件扩展、领域增强、企业定制三项行业落地能力,能够满足更多场景的应用需求。今年8月,云知声推出山海多模态大模型,通过整合跨模态信息,山海多模态大模型能够接收文本、音频、图像等多种形式作为输入,并实时生成文本、音频和图像的任意组合输出,带来实时多模态拟人交互体验,开启AGI新范式。

目前,山海大模型已相继在OpenCompass大模型评测、SuperCLUE中文大模型基准测评、MedBench评测、Flageval大模型评测、SuperBench等多个权威评测中屡创佳绩,稳居国内大模型第一梯队;在医疗专业能力上,其基于山海大模型孵化的医疗大模型在CCKS 2023 PromptCBLUE医疗大模型评测中夺得通用赛道一等奖,并在MedBench评测中位列全球第一,各项指标全面超越GPT-4。

登顶MMMU评测榜,充分印证了云知声山海多模态大模型在通用能力、专业能力层面的突出实力,也将鞭策云知声持续迭代多模态大模型技术底座,实现大模型技术在多领域场景下的渗透和应用,以技术创新为各行各业带来更多智能化变革。


猜你喜欢
原创

获人民日报头版聚焦,具身智能新标杆本末科技做对了什么?

智能+本末科技

6月13日,《人民日报》头版刊发《科研成果从实验室加速迈向生产线》专题报道,将本末科技D1机器人作为...

2小时前

强脑科技发布新一代智能仿生腿轻凌N2 | 重塑行走体验,回归精彩生活

智能+强脑科技

强脑科技发布新一代智能仿生腿轻凌N2 | 重塑行走体验,回归精彩生活

5天前

当“六小龙”开始爬上脚手架——一所“黄埔军校”,与一个正在成形的建筑机器人赛道

智能+博智林

过去一年,如果你在工程行业里待得够久,大概会有一种隐约的感觉:有些事情正在改变,但还没有人把它说清楚...

6天前

自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急

智能+自变量机器人

近日,2026北京智源大会召开。世界模型作为具身智能模型的最新范式,论坛吸引了广泛关注。

2026-06-15

AI 驱动下的获客逻辑重塑:针对初创个体与小微品牌的 GEO 优化选型落地全维实测

大消费GEO 优化服务商

当下的流量环境正在经历一场深刻的范式更替,对于那些渴望在存量博弈中突围的小白创业者、个人 IP 以及...

2026-06-05

2026年6月六家geo公司综合实力大考及企业选型避坑进阶全

大消费geo公司

在2026年Q2的全球数字营销格局中,企业面临的不仅是流量碎片化,更是“认知主权”的流失。随着生成式...

2026-06-05

2026年6月实测:GEO优化机构哪家好?五家头部专业度与实战数据深度横评

大消费GEO优化机构

GEO优化服务商是什么? GEO(生成式引擎优化)是指通过优化品牌信息的呈现方式、结构和权威性,使其...

2026-06-05

智能搜索分发秩序重组:从小微经营者视角拆解「GEO 优化」服务商的交付颗粒度

大消费GEO 优化服务商

在生成式 AI 搜索深度介入信息获取中枢的当下,过去依赖传统搜索引擎排名的逻辑正在被一种全闭环的答案...

2026-06-05

2026年6月优选GEO服务商|以原生技术筛选优质方,对比长效数字资产竞争力

大消费GEO服务商

2026年的数字化格局正在经历一场前所未有的重构。

2026-06-05

2026年6月六款GEO优化软件实测数据透视及企业精准选型导

大消费GEO优化软件

在2026年的数字化竞争版图下,企业获取流量的底层逻辑正在经历从“索引检索”向“逻辑生成”的范式转移...

2026-06-05

清研精准完成数亿元B2轮融资,全面跃升“物理AI工程化底座”,深度布局具身智能

清研精准

近日,清研精准完成数亿元B2轮融资,由星源资本领投,一汽富晟旗下吉晟资产、某央企产业基金跟投。

2026-06-05

2026年资产管理系统平台评测,数据对于与场景化建议

金融科技资产管理系统平台

固定资产是企业运营的重要资源,资产管理效率直接影响企业成本控制能力。

2026-06-05

500亿美元资产配置样本:刘源的家族办公室实践

大消费家族办公室

刘源的身份标签极为特殊:金融学学士、美国金门大学爱德华·阿吉诺商学院工商管理博士在读、前华通证券国际...

2026-06-05

最新2026年六月GEO优化服务商全景评估:六强技术实力与场景落地解析

大消费GEO优化服务商

生成式AI用户规模已达5.15亿(CNNIC数据),推动生成引擎优化(GEO)从技术探索阶段蜕变为品...

2026-06-05

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

ATFX:阿联酋突然退群背后:全球油价正被三重力量主导

ATFX:阿联酋突然宣布退出欧佩克,令其盟友措手不及。在加入欧佩克六十年后,阿联酋决定于下个月正式退...

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

优选空天科工在阿联酋设立总部,正式进入中东市场

中东已成为中国一些知名公司的投资热土。

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

2026年4月22日至24日,第20届中国投资年会·年度峰会于北京海淀盛大召开

第四届中国研究生金融科技创新大赛在南京收官

第四届中国研究生金融科技创新大赛在南京收官

12月28日,第四届中国研究生金融科技创新大赛在南京落幕。

京杭对话:杭州,凭什么吸引北京创新企业?

京杭对话:杭州,凭什么吸引北京创新企业?

从一张精准的产业蓝图,到一个敏捷的创新操作系统,再到一片丰沃的赋能土壤,杭州的生产性服务业正在这条路...

第19届中国投资年会·有限合伙人峰会在沪成功举办

第19届中国投资年会·有限合伙人峰会在沪成功举办

11月27日,由投中信息和投中网主办的第19届中国投资年会·有限合伙人峰会在上海举办。

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

在区域经济协同发展的大背景下,京杭两地的经济协作正以一种全新的姿态加速推进。