更多精彩 >

智谱AI大模型GLM-4在SuperCLUE-Fin中文原生金融大模型基准测评中荣获A级评价

2024-04-25 21:01:16   来源:搜狐网  作者: 

摘要:近日,SuperCLUE-Fin(SC-Fin)中文原生金融大模型测评基准正式发布,对国内外金融大模型的发展水平进行了全方位、多角度评估。

近日,SuperCLUE-Fin(SC-Fin)中文原生金融大模型测评基准正式发布,对国内外金融大模型的发展水平进行了全方位、多角度评估。智谱AI自主研发的新一代基座大模型GLM-4脱颖而出,跻身国内首批获得A级评价的模型之列,依据模型表现,GLM-4位列第一梯队,在国内大模型中排名第一。

本次测评涵盖金融知识百科、金融理解认知、金融数理计算、合规与风险管理、投研应用以及投顾应用六大领域共计二十五项细分任务。测评人员通过模拟真实用户与模型互动,采用单轮问答、多轮交互等多种形式,对模型的专业知识掌握、逻辑分析能力、语言表达清晰度、计算效率以及企业综合业务分析、风险预测与管控等能力进行了详尽检验。

测评结果显示,在六类应用场景的二十五项细分任务中,GLM-4斩获了一项A+及多项A级评价,彰显出其在国内金融智能解决方案领域的领先技术水平与广泛应用潜能。

总等级榜单

任务大类等级榜单

各任务等级榜单

金融知识百科榜单

金融数理计算榜单

合规与风险管理榜单

投顾应用榜单

根据测评榜单,从模型等级角度看,目前仅有GPT-4 Turbo在总成绩中达到了A+的级别,国内的GLM-4与MoonShot-v1-128k等级达到A。从六类具体任务得分角度来看,各模型各类任务得分较为均衡,其中GLM-4表现较为优异,获得了一项A+、三项A与两项B,且与GPT-4 Turbo各任务等级相差较小。

测评结论指出,从金融大模型综合能力上看,国内外头部模型差距较小,体现了国内大模型在金融领域综合能力上有一定的竞争力。在本次金融测评中,依据模型表现,GLM-4位列第一梯队,其等级为A,仅低于GPT-4 Turbo,国内排名第一。从金融大模型专项能力上来看,真正实现大语言模型在金融领域的高度专业化水准仍然有一定的距离,提高金融大模型数据库质量、完善模型对于金融学问题的解释标准(尤其是依据国内标准),亦或为提升金融大模型性能的关键路径。

关于智谱AI

智谱AI致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司于2020年底研发GLM预训练架构,2021年训练完成百亿参数模型GLM-10B,同年利用MoE架构成功训练出收敛的万亿稀疏模型,2022年合作研发了中英双语千亿级超大规模预训练模型GLM-130B并开源。2023年,智谱 AI 推出千亿基座对话模型ChatGLM并两次升级,开源版本的 ChatGLM-6B 让大模型开发者的本地微调和部署成为可能,在开源社区受到广泛欢迎。

2024年1月,智谱AI推出新一代基座大模型GLM-4,整体性能相比上一代大幅提升,比肩世界先进水平。它支持更长上下文,具备更强多模态能力,推理速度更快,支持更高并发,大大降低推理成本。同时,GLM-4的智能体能力得到大幅提升,可根据用户意图,自动理解、规划指令以完成复杂任务。GLMs 个性化智能体定制功能亦同时上线,用户用简单提示词指令即能创建属于自己的 GLM 智能体,由此任何人都能实现大模型的便捷开发。

基于全自研基座大模型的强大能力,智谱 AI 构建了极具竞争力的AIGC模型产品矩阵,包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。

践行Model as a Service市场理念,智谱AI致力于打造高效率、通用化的“模型即服务”开发新范式,通过大模型链接物理世界的亿级用户,为千行百业带来持续创新与变革,加速迈向通用人工智能的时代。


猜你喜欢

智谱AI张鹏亮相央视《对话》解读AI趋势:AGI仍有很多问题值得探索,尚未看到天花板

智谱AI

近期,智谱AI首席执行官张鹏受邀做客中央广播电视总台财经节目中心《对话》栏目,与360集团创始人周鸿...

2024-04-14

智谱AI首席执行官张鹏会见西门子股份公司董事会主席博乐仁

西门子智谱AI

3月26日,智谱AI 首席执行官张鹏在智谱AI 北京总部会见西门子全球董事会主席、总裁兼首席执行官博...

2024-03-27

智谱AI已完成超25亿元融资

智谱AI

近日,北京智谱华章科技有限公司(以下简称“智谱AI”)宣布今年已累计获得超25亿元人民币融资,参与方...

2023-10-20

壹沓科技与智谱AI达成战略合作:大语言模型赋能,共同推动企业生产力跃迁

壹沓科技智谱AI

近日,为加速大模型创新落地,壹沓科技与智谱AI达成战略合作。

2023-10-18

海尔消金第二期ABS成功发行,力推够花品牌

海尔消金第二

今年10月,海尔消费金融发布关于未来两年“海鑫”系列个人消费贷款资产支持证券的注册申请报告,注册总金...

2023-11-13

总规模20亿,海尔消费金融第二期ABS发行成功

海尔消费金融

11月10日,海尔消费金融成功发行了海鑫2023年第二期个人消费贷款资产支持证券,发行总规模为20亿...

2023-11-13

珀莱雅双11完美收官:天猫、抖音美妆行业第一,树立国货典范

珀莱雅

2023年双十一落下帷幕,珀莱雅再传捷报。在多个口碑大单品加持下,珀莱雅蝉联多平台美妆国货第一,首次...

2023-11-13

全球最高能效液流电池电堆通过权威机构检测,星辰新能再创纪录

星辰新能

日前,北京星辰新能科技有限公司(以下简称“星辰新能”)新一代超高效率42kW电堆产品通过北京鉴衡认证...

2023-11-13

海信家电荣获2023上市公司董事会“最佳实践案例”奖

海信家电

11月11日,由中国上市公司协会主办的2023中国上市公司企业家年会在深圳召开,会上重磅发布了“20...

2023-11-13

原创

股价暴涨!华为概念“大妖股”,大搞高溢价收购

华为

总之,软通动力目前的热度前所未有之高,它对同方股份的巨额收购,也有众多疑点需要回复监管部门和股民!...

2023-11-13

科镁信完成数千万元Pre-A轮融资

科镁信

11月13日,专注于下一代递送系统开发的生物医药公司科镁信宣布完成数千万人民币Pre-A轮融资。

2023-11-13

领博生物完成近亿元A轮融资

领博生物

近日,领博生物科技(杭州)有限公司(以下简称“领博生物”)完成近亿元A轮融资,本轮融资由磐霖资本领投...

2023-11-13

世瞳微电子完成数千万元Pre-A++轮融资

世瞳微电子

近日,SPAD dtof光电传感器芯片设计商世瞳(上海)微电子科技有限公司(以下简称“世瞳微电子”)...

2023-11-13

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

避免卡脖子,硬科技如何“逆境”突围?

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

VC/PE眼中的“专精特新”

2024年1月10日,由投资家网主办,财经锐眼、有时间协办,北京微金科技有限公司承办的“第十二届股权...

国内首次!可重复使用技术验证火箭复用飞行成功!

星际荣耀双曲线二号可重复使用验证火箭第二次飞行试验圆满成功

坚守17年,AI“老兵”要上市了

科创板即将迎来一名新成员。

金山云旗下公司增资至4亿美元

金山云旗下公司增资至4亿美元

2024汽车科技创新与成果转化大会在常州成功召开

2024汽车科技创新与成果转化大会在常州成功召开

4月12日,2024汽车科技创新与成果转化大会在常州经开区成功召开。

不响不辍 | 第18届中国投资年会·年度峰会即将启幕

不响不辍 | 第18届中国投资年会·年度峰会即将启幕

2024年5月8-10日,由投中信息、投中网主办,以“不响不辍”为主题的第18届中国投资年会·年度峰...

投资家网协办:首届深圳湾资本市场年会隆重举行

投资家网协办:首届深圳湾资本市场年会隆重举行

12月20日,由南山区资本市场协会主办,投资家网、桐鹏汇财金高管俱乐部协办的资本巿场年会随即举行。

“投资家网·2023中国价值企业榜”重磅发布

“投资家网·2023中国价值企业榜”重磅发布

身处百年未有之大变局,中国经济这艘万吨巨轮,早已屹立于世界舞台中央。

朱民对话瑞•达利欧:2024全球政治风险大于经济与金融风险|和讯财经2023年会

朱民对话瑞•达利欧:2024全球政治风险大于经济与金融风险|和讯财经2023年会

在全球经济经历了激进加息、经济增速放缓、地缘冲突、石油减产等种种事件之后,全球经济增长的态势继续放缓...