MedBench最新评测：山海大模型医疗各项指标力压GPT-4

2024-06-14 09:55:41 来源：天极网作者：　

摘要：MedBench致力于打造一个科学、公平且严谨的中文医疗大模型评测体系及开放平台，其基于医学权威标准，不断更新维护高质量的医学数据集，全方位多维度量化模型在各个医学维度的能力。

近日，由上海AI实验室和上海市数字医学创新中心联合推出的MedBench评测更新榜单，继4月份夺冠后，云知声山海大模型医疗行业版（UniGPT-Med）再次以综合得分82.2的优异成绩位列全球第一，各项指标全面超越GPT-4，充分展现出山海大模型在拥有业内一流的通用能力之外，更具备打造世界领先的行业大模型的能力。

MedBench致力于打造一个科学、公平且严谨的中文医疗大模型评测体系及开放平台，其基于医学权威标准，不断更新维护高质量的医学数据集，全方位多维度量化模型在各个医学维度的能力。

MedBench的五大评测维度——医学语言理解、医学语言生成、医学知识问答、复杂医学推理、医疗安全和伦理，构成了其专业评测框架的核心。这一框架吸纳了海量医学知识库和医院医学专家的丰富经验，涵盖8个公开数据集和12个自建数据集，总计约30万道中文医疗专业测评题目，覆盖了从医学考试题库到患者服务、医学问诊、病例分析以及病历生成等广泛的医学任务，致力为中文医疗大模型提供客观科学的性能评测参考。

今年5月，MedBench平台全面升级，不仅引入API评测方式，丰富了参评途径，还优化了开放域问答的评估指标。通过医学专家的精准标注，平台进一步提升了评测结果的公正性和专业性。同时，平台在数据集、评测方法和系统功能等方面也进行了升级，旨在为医疗大模型评测构建一个更加完善的社区环境，并提供更加丰富、真实的实践场景。

此次评测，云知声山海大模型医疗行业版（UniGPT-Med）通过API提交方式，不仅以82.2的综合得分刷新了MedBench评测记录，更是在各个维度上力压GPT-4，排名全球第一。这一成绩的取得，是山海大模型医疗专业能力的集中展现，也标志着其技术迭代和创新发展达到了一个新的高度。

目前，山海大模型通用能力已超越GPT-3.5，并在SuperCLUE 4月评测中跻身国内大模型Top10；与GPT-4的对战中，山海综合胜率与和率为75.55%。

在医疗专业能力上，山海大模型于2023年6月的MedQA任务中超越Med-PaLM 2，取得87.1%的优异成绩；在临床执业医师资格考试中以523分（总分600分）的优异成绩，超过99%的考生水平；其基于山海大模型孵化的医疗行业版大模型，也在CCKS 2023 PromptCBLUE医疗大模型评测中夺得通用赛道一等奖。

随着医疗行业对智能化、精准化服务需求的不断增长，云知声山海大模型医疗行业版（UniGPT-Med）有望在医疗健康领域扮演更加关键的角色，为提升医疗服务效率、优化患者体验、推动医疗科技进步提供强有力的支持。

上一篇： 上海市民在叮当快药小程序购药可使用在线医保支付
下一篇： 情景模拟生动再现，趣味科普反诈知识！《蛋仔派对》时刻在守护

精彩阅读原创资讯投资人物专栏

煜邦电力业绩领跑：三驾马车驱动超预期增长

上市公司煜邦电力

作为拥有近三十年电力智能化研发经验的高新技术企业，煜邦电力始终肩负着行业革新使命。

2025-03-31

广大特材2025年第一季度业绩预告：增长势头强劲，未来可期！

上市公司广大特材

根据公告，广大特材2025年第一季度预计实现营业收入约11.20亿元，与上年同期相比，增加约2.28...

2025-03-31

为都市生活注入无限生命力上海时装周GORE-TEX品牌空间限时开启

创新创业 GORE-TEX

自诞生以来，GORE-TEX品牌凭借对科技创新的不竭探索，开发出满足户外、运动、休闲等场景细分性需求...

2025-03-31

世茂服务（873.HK）2024年报：聚焦高质量发展路径多个核心指标逆势上涨

上市公司世茂服务

2025 年3月 28 日，世茂服务控股有限公司（873.HK）发布2024年全年业绩报告。

2025-03-31

中复神鹰披露2024年年报：技术领跑加固产业护盾，降本增效夯实发展势能

上市公司中复神鹰

近日，中复神鹰碳纤维股份有限公司(以下简称“中复神鹰”或“公司”)发布了2024年年度报告。

2025-03-31

深创投投资钜瓷科技C轮

钜瓷科技

深创投投资钜瓷科技C轮

2025-03-30

安迈特完成数亿元B1轮融资

安迈特

安迈特完成数亿元B1轮融资

2025-03-30

科新机电（300092.SZ）2024年实现净利润1.69亿元现金流大涨886% 印证高质量发展

上市公司科新机电

3月28日晚间,科新机电(300092.SZ)披露2024年年度报告。

2025-03-30

顺丰控股：稳健增长，创新驱动，布局未来 2024年利润突破100亿元

上市公司顺丰控股

3月28日晚，顺丰控股（002352.SZ）披露了2024年年报。

2025-03-29

促销费专项行动发布海南自贸港免税业务将深度受益

创新创业海南发展

当前，免税消费已成为我国扩大内需、促进消费升级的重要引擎。

2025-03-29

投资家网（www.investorscn.com）是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务，包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流，并可加入微信群参与官方活动，赶快行动吧。