更多精彩 >

山海大模型迎来新一轮迭代,医疗能力超越Med-PaLM2

2023-06-25 19:53:31   来源:  作者: 

摘要:5月24日,云知声山海大模型正式发布,交出其在AGI领域的第一份答卷,并进入有序迭代阶段。

5月24日,云知声山海大模型正式发布,交出其在AGI领域的第一份答卷,并进入有序迭代阶段。时隔一个月,山海大模型迎来了又一次比较大的升级——各项性能持续优化,且在核心能力上实现三大升级:通过迭代实现了在特定领域内的专业知识积累,诗词创作能力、数学计算能力实现突破。

技术加码,性能持续优化

 

● 吞吐效率接近理论上限60% 

UniScale通过引入全新的Attention高效计算方式和相关底层算子的优化来提高浮点运算效率,另外,也进一步优化了训练框架中的通信策略,进一步提升了多机多卡的吞吐效率。UniScale目前在多机多卡大模型训练计算效率接近理论上限的60%,而当前公开的主流框架训练效率约45%左右,因此所提方法能够吞吐量在原有基础上提升了15个点。在推理部分,通过解码策略优化、量化和高效算子适配,相对原始推理性能翻倍,并适配了不同性能的显卡推理部署。这意味着训推一体框架UniScale 具有出色的并行计算能力,能够同时处理多个任务,大大提高了模型的训练速度。也表明在相同的时间内,UniScale可以完成更加高效的计算任务,降低推理部署成本。

image.png

 

● 微调速度提升15倍 

UniScale通过集成QLoRA微调(Dettmers et al., 2023)技术,不仅极大地减少了微调所需的硬件资源,还提高了微调速度。QLoRA是在LoRA微调(Hu et al., 2021)基础上结合了4位量化、双量化和统一内存分页技术,是一种高效的模型参数微调方法,不仅可以在普通消费级GPU上完成大规模语言模型的微调,还能够在较少的迭代次数内快速收敛。与此同时,我们实现了一种多指令统一微调技术,能够进一步减少模型的计算和通信开销,加快微调的速度。我们经过实验验证,UniScale在使用QLoRA微调和统一微调技术之后,微调速度提升了约15倍。

这一改进对于微调任务非常重要,特别是当资源有限的情况下在大规模数据集上进行微调的场景。传统的微调方法需要耗费较长的时间来逐步调整模型参数,而QLoRA微调能够通过多种量化方法显著减少显存占用,大大减少了微调所需的内存,同时性能几乎与标准微调相当。与此同时,微调后的模型可以直接用于模型部署,符合UniScale训练与推理一体化的设计理念,这项改进使得UniScale成为一个非常有效的深度学习平台,提供了更快速、高效的微调实验方案。

image.png

能力突破,效果加速提升

● 医疗能力超越Med-PaLM 

山海大模型实现了在特定领域内专业知识的快速积累,通过语料的不断迭代升级,专业能力持续突破。以医疗领域为例,山海大模型学习了大量教材、百科等高质量医学文献,使其能够提供更加全面、专业的医疗信息支持。在扩展了医疗大模型的领域知识的同时,山海大模型仍旧保持原有的高性能、高准确率等特点。医疗大模型的改进为医生们提供更强大的支持和指导,以提高医疗效果。目前该模型在MedQA任务上提升到了87.1%,超越Med-PaLM 2,临床执业医师资格考试提升到了523(总分600分),超过了99%的考生水平。

image.png

● 诗词创作能力升级 

在诗词创作方面上,山海大模型不仅在预训练阶段增加了7万多首古诗词数据,补充诗词相关的知识,在指令学习阶段,也精心设计近40种不同的指令,基本覆盖日常对诗词数据相关知识考察的内容,充分发掘大模型的潜力,进一步提升创作能力。通过指令学习的方法,山海大模型学会了运用类似的修辞手法和表达方式,使其创作效果更富诗意、更具情感温度。不仅如此,山海大模型还能够根据主题和情感要求进行定制化创作——这一突破不仅得益于诗词相关的指令学习数据的引入,也归功于山海大模型自身强大的计算和学习能力。

● 数学能力提升 

山海大模型的数学计算能力主要依赖预训练阶段扎实、系统的数学理论体系和指令学习阶段基于插件的具体题型的求解能力。为了进一步提升山海大模型的数学能力,我们主要针对以下两方面进行优化:

a)  我们在预训练阶段提供人工和模型精心挑选的高质量预训练数据,其中包括从小学到大学所有数学学科的教材、练习册等,通过这些数据的学习,模型就具备了系统的数学理论体系和解决各种数学问题的基础。

b)   基于 react 思想的指令学习是大模型数学能力的必要步骤。在此阶段,对每一种题型,我们给出具体的解题思路,包括 reasoning and acting,教会大模型解决各种问题的能力。解题过程中,为了解决大模型无法做精确数值计算的问题,将数值运算移交给插件完成,插件完成数值计算或者方程求解之后,将答案返回大模型,大模型继续问题求解,直到给出最终答案。

从5月24日正式发布以来,山海大模型始终在不断训练、调优,致力通过自身不断的迭代进化兑现AI应用价值;保持高速演进的同时,也在探索与具体场景深度融合的更多可能。

目前,云知声山海大模型已深入到智慧医疗、智慧教育、知识管理、智慧营销、智能客服等具体场景中,基于山海大模型打造的场景应用正不断丰富、不断拓展。

7月6日-7月8日,云知声将携山海大模型及其医疗、银行、车载、客服等最新场景应用亮相2023世界人工智能大会,欢迎大家届时莅临云知声展位参观交流。

从能力升级到场景应用,基于多年技术积累,云知声正加速推进山海大模型的迭代演变。未来山海会有怎样的惊喜和亮点,值得你的期待。


猜你喜欢

再获资本市场认可!云知声荣膺格隆汇“金格奖”年度卓越创新力IPO

上市公司云知声

12月22日,格隆汇“金格奖”年度卓越公司评选结果公布,云知声(股票代码:09678.HK)凭借上市...

2025-12-31

实力认证!云知声山海·知医大模型入选MedAIBench优秀国产医疗大模型榜单

上市公司云知声

12月20日,国家人工智能应用中试基地(医疗)·浙江正式发布《MedAIBench测评榜(优秀国产医...

2025-12-22

云知声山海医疗大模型问鼎MedBench4.0三项榜首,以“三冠王”战绩树立医疗AI新标杆

上市公司云知声

12月16日,中文医疗大模型权威评测平台MedBench4.0发布最新评测结果。

2025-12-22

刚刚,云知声发布了医疗领域专家大模型“山海·知医大模型5.0”:真正走向严肃临床!

上市公司云知声

刚刚,云知声正式推出医疗领域专家级大模型全新力作——“山海・知医大模型5.0”。

2025-12-22

云知声(9678.HK)2025年中期业绩:营收同比增加20.2%,大模型收入飙涨457%

上市公司云知声

8月28日,云知声(9678.HK)发布截至2025年6月30日止六个月的中期业绩公告。

2025-08-29

国内黄金投资渠道有哪些?2026正规渠道全盘点

金融科技黄金投资平台

在2026年,黄金投资凭借其24小时交易、双向操作、杠杆机制等优势,成为高风险偏好者的热门选择。

2026-01-30

手机炒黄金软件哪个好/十大手机炒黄金app排名

金融科技黄金投资平台

在当今投资热潮中,黄金投资凭借其独特的避险属性和保值功能,成为众多投资者的心头好。

2026-01-30

现货白银交易平台哪个好?国内十大正规白银投资平台推荐

金融科技白银交易平台

近年来,白银凭借其独特的金融属性与工业刚需价值,成为全球投资者资产配置的重要选项。

2026-01-30

炒黄金开户赠金是真实的吗?哪些平台能够领取?

金融科技黄金投资

在投资黄金的征途上,每一位投资者都渴望以最少的成本获取最大的收益。

2026-01-30

国际金价涨破5500美元,现在投资黄金在哪开户?

金融科技黄金投资平台

2026年1月29日,国际金价以5568.77美元/盎司的惊人涨幅(+5.77%)刷新历史高位,黄金...

2026-01-30

国际行业十大正规期货交易平台独家排名(综合版)

金融科技期货交易平台

期货交易是以现货交易为基础,以远期合同交易为雏形而发展起来的一种高级的交易方式。

2026-01-30

光大信用卡星光俱乐部丨邀您闪耀升级,“益”起领取

金融科技光大信用卡

手机中的各类活动、订阅内容多了,自然会变得异常繁琐。

2026-01-30

综合分析:香港十大主流炒外汇交易app软件精选排名

金融科技外汇交易平台

在如今瞬息万变的国际投资市场中,黄金交易以其独特的全球联动性和避险属性,吸引了众多投资者的目光。

2026-01-30

平安分红险御享分红26获年度畅销奖,匹配财富传承与稳定增值需求

金融科技平安分红险

在“十四五”收官、“十五五”谋篇的关键节点,金融业高质量发展成为经济转型的重要支撑。

2026-01-30

穿越“交付谷底”:北摩高科2025年净利预增10倍背后的行业共振

上市公司北摩高科

在经历了2024年的行业性交付节奏放缓后,国内航空起降系统龙头北摩高科(002985.SZ)交出了一...

2026-01-30

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

ATFX:阿联酋突然退群背后:全球油价正被三重力量主导

ATFX:阿联酋突然宣布退出欧佩克,令其盟友措手不及。在加入欧佩克六十年后,阿联酋决定于下个月正式退...

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

优选空天科工在阿联酋设立总部,正式进入中东市场

中东已成为中国一些知名公司的投资热土。

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

2026年4月22日至24日,第20届中国投资年会·年度峰会于北京海淀盛大召开

第四届中国研究生金融科技创新大赛在南京收官

第四届中国研究生金融科技创新大赛在南京收官

12月28日,第四届中国研究生金融科技创新大赛在南京落幕。

京杭对话:杭州,凭什么吸引北京创新企业?

京杭对话:杭州,凭什么吸引北京创新企业?

从一张精准的产业蓝图,到一个敏捷的创新操作系统,再到一片丰沃的赋能土壤,杭州的生产性服务业正在这条路...

第19届中国投资年会·有限合伙人峰会在沪成功举办

第19届中国投资年会·有限合伙人峰会在沪成功举办

11月27日,由投中信息和投中网主办的第19届中国投资年会·有限合伙人峰会在上海举办。

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

在区域经济协同发展的大背景下,京杭两地的经济协作正以一种全新的姿态加速推进。