2025-12-22 18:57:02 来源:techweb 作者: 摘要:12月16日,中文医疗大模型权威评测平台MedBench4.0发布最新评测结果。
12月16日,中文医疗大模型权威评测平台MedBench4.0发布最新评测结果。云知声自主研发的“山海医疗大模型(UniGPT‑Med)”展现出全面领先的技术实力,一举斩获医疗智能体、医疗大语言模型、医疗多模态大模型三项技术范式,成为本次评测中表现最为突出的“三冠王”。

其中,UniGPT‑Med‑U1在医疗大语言模型评测中以综合得分65.7分登顶,力压Grok-4(58.4)Claude-Sonnet-4.5、Gemini-2.5-Pro、GPT-5等一众国际顶尖模型。同时,在医疗智能体评测中以综合得分94.6分的优异成绩,大幅领先第二名Claude-Sonnet-4.5(88.8)近6分;

MedBench4.0-医疗大语言模型评测榜单

MedBench4.0-医疗智能体评测榜单
UniGPTMedVL则在医疗多模态大模型评测中以综合得分59.6分摘得桂冠,领先第二名GPT-5(53.7分)近6分,展现出绝对技术优势。

MedBench4.0-医疗多模态大模型评测榜单
MedBench评测平台由上海人工智能实验室、上海市数字医学创新中心联合多家权威机构共同打造,以其科学、公平、严谨的评测体系著称。2025年11月20日,该平台全面迭代更新至4.0版本,成为全国首个且唯一面向垂直模型、专用模型及各应用场景的医疗大模型评测与验证体系。本次升级聚焦实战化评测突破与生态化开放共建两大核心,全面覆盖医疗大语言模型、医疗多模态大模型及医疗智能体三大技术范式,并深度对齐国家《卫生健康行业人工智能应用场景参考指引》,旨在为医疗AI从技术可行走向临床可用搭建关键的验证桥梁。
基于严格的医学标准,平台构建了高质量、多维度、覆盖广泛的评测集。其中,医疗大语言模型评测涵盖5大能力维度、36个专业子集,约70万条数据;医疗多模态大模型评测聚焦3大核心能力、10个专业子集;医疗智能体评测则围绕6大行动维度设置了14个复杂任务集。在此严苛且全面的评估框架下,山海大模型能够一举夺得三项冠军,充分彰显了其极高的技术含金量与实用价值。
此次评测的卓越表现,得益于山海医疗大模型最新版本完成的系统性核心升级。新版本致力于构建业界能力维度最丰富的医疗AI技术支撑体系,其核心亮点在于实现了“医学文本大模型”与“医学多模态大模型”双核心产品体系的深度融合,全面覆盖从文本处理、智能体协同到影像解析的多元功能,形成了当前能力维度最丰富的医疗AI技术架构。
通过深度融合模拟临床思维的复杂推理能力,模型实现了精准的鉴别诊断与循证决策支持;同时,原生内化的任务规划、工具调用与多智能体协作等核心能力,推动其完成了从“医学认知大脑”向“自主医疗行动者”的关键进阶,能够高效适配并执行复杂的真实医疗任务流程。
在多模态能力方面,新版本展现出对临床场景的深度赋能。它不仅能够精准识别X光、CT、MRI等多种医学影像中的病灶与解剖结构,高效提取医疗文档关键文本信息,更支持跨模态语义对齐与联合推理,能够融合影像特征与临床描述进行综合判断,为临床决策提供多源数据支撑的精准建议。
权威榜单的成绩是技术实力的显性证明,而真正的价值在于临床实践的检验与认可。依托该模型,云知声推出了覆盖诊疗全流程的“智慧医疗产品矩阵”,涵盖智能病历生成与质控、临床辅助决策、医疗质量监管、医保支付智能审核以及智慧患者服务等核心产品。这些产品已深入医政管理、临床诊疗、运营管理和患者服务等关键环节,并在全国部署近400家医院,700余家医院进入测试阶段。其中覆盖北京协和医院、北京友谊医院、东南大学附属中大医院、青岛大学附属医院等数百家国内顶级三甲医院。
在提升诊疗效率与质量方面,落地案例成效显著。例如,门诊病历生成系统能够实时捕捉医患之间的对话内容,智能提取关键问诊信息,并自动生成结构化病历。医生仅需进行简单审核,即可完成病历书写工作。目前该系统已在北京友谊医院顺义院区广泛应用,单份病历直接引用率接近90%,大幅降低了医生文书负担;智能病历质控系统能够精准理解病历内容,并智能识别其中的书写错误与缺陷。系统对影像描述、专业术语进行细致分析,并对检查结果、检查结论以及检查依据进行深度解读,从而实现高效、精准的病历质控;DRG/DIP医保支付管理系统以智能提醒和数据分析两种方式,从诊疗过程中、医保结算前到医保结算后,为医生、质控员、编码员和医保处提供全流程、全方位的医保支付管理服务。该系统成功助力中国人保财险完成核赔风控AI医疗审核系统的全国性部署。
作为AGI技术的先行者,云知声始终致力于以专业大模型和全栈自研AI技术解决产业核心问题。山海医疗大模型在三大核心评测维度的全能夺冠,标志着其技术体系实现了从底层认知、多模态理解到上层智能体执行的全栈式、一体化突破,为医疗AI的深度临床应用树立了新的标杆。
未来,云知声将继续深耕医疗AI领域,持续推动更加安全、可靠、智慧的医疗AI解决方案在广泛场景中落地应用,赋能医疗服务体系的质量与效率升级,为助力健康中国建设贡献坚实的科技力量。
AI技术与教育场景的深度融合已成为确定性趋势,政策支持与消费升级共同催生教育智能硬件蓝海市场。
3天前质谱成像技术作为一种融合质谱分析与影像解析的先进分子成像方法,能够在精准获取样本化合物含量信息的同时...
2025-09-23作为此次与移拜骑行战略合作的核心人物,万俊雄先生的行业履历与背后金沙江资本的实力,成为市场关注的焦点...
2025-09-23本次IPO上市公开发售部分,获超额认购约3316.5倍,市场认购热情凸显投资者对公司发展前景的认可。
2025-09-23Robo.ai Inc. (NASDAQ: AIIO)今日宣布与JW集团在阿联酋计划合资设立商用车企...
2025-09-22投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

中东已成为中国一些知名公司的投资热土。