更多精彩 >

智谱AI大模型GLM-4在SuperCLUE-Fin中文原生金融大模型基准测评中荣获A级评价

2024-04-25 21:01:16   来源:搜狐网  作者: 

摘要:近日,SuperCLUE-Fin(SC-Fin)中文原生金融大模型测评基准正式发布,对国内外金融大模型的发展水平进行了全方位、多角度评估。

近日,SuperCLUE-Fin(SC-Fin)中文原生金融大模型测评基准正式发布,对国内外金融大模型的发展水平进行了全方位、多角度评估。智谱AI自主研发的新一代基座大模型GLM-4脱颖而出,跻身国内首批获得A级评价的模型之列,依据模型表现,GLM-4位列第一梯队,在国内大模型中排名第一。

本次测评涵盖金融知识百科、金融理解认知、金融数理计算、合规与风险管理、投研应用以及投顾应用六大领域共计二十五项细分任务。测评人员通过模拟真实用户与模型互动,采用单轮问答、多轮交互等多种形式,对模型的专业知识掌握、逻辑分析能力、语言表达清晰度、计算效率以及企业综合业务分析、风险预测与管控等能力进行了详尽检验。

测评结果显示,在六类应用场景的二十五项细分任务中,GLM-4斩获了一项A+及多项A级评价,彰显出其在国内金融智能解决方案领域的领先技术水平与广泛应用潜能。

总等级榜单

任务大类等级榜单

各任务等级榜单

金融知识百科榜单

金融数理计算榜单

合规与风险管理榜单

投顾应用榜单

根据测评榜单,从模型等级角度看,目前仅有GPT-4 Turbo在总成绩中达到了A+的级别,国内的GLM-4与MoonShot-v1-128k等级达到A。从六类具体任务得分角度来看,各模型各类任务得分较为均衡,其中GLM-4表现较为优异,获得了一项A+、三项A与两项B,且与GPT-4 Turbo各任务等级相差较小。

测评结论指出,从金融大模型综合能力上看,国内外头部模型差距较小,体现了国内大模型在金融领域综合能力上有一定的竞争力。在本次金融测评中,依据模型表现,GLM-4位列第一梯队,其等级为A,仅低于GPT-4 Turbo,国内排名第一。从金融大模型专项能力上来看,真正实现大语言模型在金融领域的高度专业化水准仍然有一定的距离,提高金融大模型数据库质量、完善模型对于金融学问题的解释标准(尤其是依据国内标准),亦或为提升金融大模型性能的关键路径。

关于智谱AI

智谱AI致力于打造新一代认知智能大模型,专注于做大模型的中国创新。公司于2020年底研发GLM预训练架构,2021年训练完成百亿参数模型GLM-10B,同年利用MoE架构成功训练出收敛的万亿稀疏模型,2022年合作研发了中英双语千亿级超大规模预训练模型GLM-130B并开源。2023年,智谱 AI 推出千亿基座对话模型ChatGLM并两次升级,开源版本的 ChatGLM-6B 让大模型开发者的本地微调和部署成为可能,在开源社区受到广泛欢迎。

2024年1月,智谱AI推出新一代基座大模型GLM-4,整体性能相比上一代大幅提升,比肩世界先进水平。它支持更长上下文,具备更强多模态能力,推理速度更快,支持更高并发,大大降低推理成本。同时,GLM-4的智能体能力得到大幅提升,可根据用户意图,自动理解、规划指令以完成复杂任务。GLMs 个性化智能体定制功能亦同时上线,用户用简单提示词指令即能创建属于自己的 GLM 智能体,由此任何人都能实现大模型的便捷开发。

基于全自研基座大模型的强大能力,智谱 AI 构建了极具竞争力的AIGC模型产品矩阵,包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。

践行Model as a Service市场理念,智谱AI致力于打造高效率、通用化的“模型即服务”开发新范式,通过大模型链接物理世界的亿级用户,为千行百业带来持续创新与变革,加速迈向通用人工智能的时代。


猜你喜欢

招商银行联手智谱AI,探索大模型赋能金融科技人才培养新模式

招商银行智谱AI

AI大模型正在重新定义金融领域人才选拔和培养标准。

2024-07-17

智谱AI与君龙人寿在京达成战略合作,共同推动保险数智化转型

智谱AI君龙人寿

7月10日上午,北京智谱华章科技有限公司(以下简称“智谱AI”)与君龙人寿保险有限公司(以下简称“君...

2024-07-12

国内大模型商业化步伐加快

智谱AI大模型

据《中国大模型中标项目监测报告》最新统计,今年1-4 月,国内大模型应用落地增速显著,项目数量再创新...

2024-05-09

君佩珠宝级黄金「时来运转」上市:以匠心转动东方好运,重塑黄金佩戴美学

大消费君佩黄金

在东方文化的深厚底蕴中,“时来运转”不仅是一句吉祥话,更是一种植根于民族集体意识中的美好期盼。

2025-12-19

XR专利第一案:VITURE产品遭禁售,下架欧洲九国

大消费VITURE

近日,德国慕尼黑第一地区法院已作出一审裁决,认定VITURE公司旗下的VITURE Pro等产品侵犯...

2025-12-19

游族网络出席2025产业趋势发展论坛,分享三重驱动力引领价值增长

上市公司游族网络

12月18日,由中国音像与数字出版协会游戏出版工作委员会主办的2025产业趋势发展论坛成功举办,游族...

2025-12-19

海南供销大集控股有限公司董事长韩玮:生态共建已是行业共识,也是企业长期可持续发展的核心路径

大消费海南供销大集

12月11日至13日,“2025第十四届上市公司发展年会暨海南自贸港开放机遇交流大会”在海口举行。

2025-12-18

灵犀智能全球首款星座AI潮玩亮相乌镇青少年科技嘉年华

创新创业灵犀智能

2025年乌镇青少年科技嘉年华·燃冬季于12月5日在乌镇互联网之光博览中心正式启幕。

2025-12-18

餐厅小便事件频发,商家陷劝阻与投诉“两难”困境

文化传媒公共文明

近年来,一系列在餐厅内发生的随地便溺事件,经社交媒体曝光后持续发酵,引发公众对公共空间文明的广泛讨论...

2025-12-18

十大国际现货黄金交易平台大揭秘:看看选哪个交易所平台投资更优

金融科技黄金交易平台

在全球通胀压力与地缘风险交织的背景下,黄金作为避险资产的配置需求持续攀升。

2025-12-18

国内十大优质炒伦敦金交易软件独家排名(新版本)

金融科技伦敦金交易平台

香港作为亚洲投资市场的重要代表,其市场内的投资项目众多,黄金正是其中主要的投资种类。

2025-12-18

深度智能,与你共进:霓星AI电摩正式发布,开启城市骑行新纪元

大消费霓星

2025年12月14日,中国浙江桐乡——霓星科技(NAXEON)于此间被誉为“电摩之都”的桐乡濮院时...

2025-12-18

外联出国:欧洲圣诞狂欢!有人掐准申根签90天返程,有人却不给假期设限···

大消费外联出国

随着圣诞季欧洲游热潮持续升温,朋友圈里晒出的异国风光照片着实让人眼馋···

2025-12-18

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

ATFX:阿联酋突然退群背后:全球油价正被三重力量主导

ATFX:阿联酋突然宣布退出欧佩克,令其盟友措手不及。在加入欧佩克六十年后,阿联酋决定于下个月正式退...

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

优选空天科工在阿联酋设立总部,正式进入中东市场

中东已成为中国一些知名公司的投资热土。

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

2026年4月22日至24日,第20届中国投资年会·年度峰会于北京海淀盛大召开

第四届中国研究生金融科技创新大赛在南京收官

第四届中国研究生金融科技创新大赛在南京收官

12月28日,第四届中国研究生金融科技创新大赛在南京落幕。

京杭对话:杭州,凭什么吸引北京创新企业?

京杭对话:杭州,凭什么吸引北京创新企业?

从一张精准的产业蓝图,到一个敏捷的创新操作系统,再到一片丰沃的赋能土壤,杭州的生产性服务业正在这条路...

第19届中国投资年会·有限合伙人峰会在沪成功举办

第19届中国投资年会·有限合伙人峰会在沪成功举办

11月27日,由投中信息和投中网主办的第19届中国投资年会·有限合伙人峰会在上海举办。

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

在区域经济协同发展的大背景下,京杭两地的经济协作正以一种全新的姿态加速推进。