更多精彩 >

aiXcoder全新推出代码变更应用模型aiX-apply-4B,推理效率提升15倍

2026-03-28 00:16:25   来源:钛媒体  作者: 

摘要:一款“反直觉”的产品,往往最能折射一个产业的真实需求。

一款“反直觉”的产品,往往最能折射一个产业的真实需求。

 

3月25日,硅心科技(aiXcoder)发布了一款专为「代码变更应用」场景设计的高性能、轻量级模型aiX-apply-4B。

 

基准测试结果显示,在20多种主流编程语言及Markdown等多类型文件格式的测试中,aiX-apply-4B的平均准确率达到93.8%,超越Qwen3-4B基座模型62.6%的准确度,甚至高于千亿级大模型DeepSeek-V3.2。同一任务场景下,aiX-apply模型算力成本约为DeepSeek-V3.2的5%,推理速度则提升15倍,仅需一张消费级显卡即可在企业部署。

 

image.png

同一代码变更应用任务场景下,

对比aiX-apply模型与DeepSeek-V3.2推理速度

 

当全行业还在卷参数、卷通用能力时,这家北大系AI Coding赛道创企早已将目光投向了更深水区的问题——在企业研发算力有限的背景下,AI到底该如何赋能智能化软件开发?

 

为什么是4B小模型?因为企业的算力“就这么多”

 

随着 OpenClaw 等智能体框架的普及,企业 AI 应用正从单次模型调用走向多智能体协作。一个复杂任务的完成往往需要10到50次模型调用,并发场景下的Token消耗更是达到传统模式的数倍甚至数十倍。

 

这一变化直接加剧了企业的算力压力。尤其对于金融、通信、能源、航天等关键领域企业来说,私有化部署的算力“就这么多”且极其宝贵——每一次额外的模型调用,都在消耗本就紧张的算力资源,推高延迟的同时挤占并发能力。当多智能体协作成为常态,如何控制算力成本成为企业面临的核心挑战之一。

 

公有云“烧”Token的模式无法满足企业数据安全需求,私有化部署千亿级、万亿级大模型成本高昂且容易导致算力空转浪费。如何将有限算力实现最优配置,让每一份算力都能落到最需要的研发场景中去,是行业亟待解决的核心问题。

 

正是在这样的行业背景下,aiXcoder推出更适合企业私有化部署的aiX-apply-4B轻量级模型,服务于代码变更应用场景。这一场景的核心挑战在于,需要将模型生成的不规整、碎片化的代码片段,精准、无损地应用到原始文件中,同时严格保持缩进、空白符、上下文的一致性,不牵动其他代码、避免引入新问题。

image.png

aiX-apply-4B模型架构

 

据了解,为了贴合真实企业研发应用场景,确保模型应用效果,aiXcoder结合真实企业场景下的代码提交记录构建了aiX-apply-4B模型的训练数据集,基于高性能强化学习框架开展模型训练,并纳入了对各种边界情况的考虑。

 

在统一的测试方法与多维度评估体系下,这个4B参数小模型凭借一系列的创新训练方法,在代码变更应用这一场景中实现了超越千亿级大模型的表现:

在准确率方面,测试结果显示,在覆盖20余种编程语言及文件类型的 1600 余条测试集上,aiX-apply表现优于同量级模型Qwen3-4B(准确率62.6%),更与参数规模相差一百多倍的 DeepSeek-V3.2(准确率92.5%)比肩。

image.png

基准测试对比

在推理效率方面,aiXcoder引入自适应投机采样技术,极大压缩了端到端延迟。企业级生产环境实测显示,aiX-apply-4B推理速度每秒可达 2000 tokens,在单张 RTX 4090 消费级显卡上即可高效运行;而对比模型DeepSeek-V3.2则需要八卡 H200 高端集群部署。综合不同的硬件部署成本与推理速度综合对比,aiX-apply-4B仅用DeepSeek-V3.2约5%的算力成本,实现了15倍的效率提升。

在泛化能力方面,aiX-apply模型展现出了媲美DeepSeek V3.2的准确性和稳定性。无论是面对超长代码文件的精确编辑,还是在训练数据中占比极低甚至未显式出现的编程语言场景下,aiX-apply模型都保持了良好的范式泛化能力,充分验证了其在真实企业级开发环境中的实用价值。

image.png

泛化性能力测试对比

 

大模型+小模型”协同,最大化释放有限算力价值

 

事实上,aiX-apply-4B模型并不是aiXcoder发布的针对研发场景定义的第一款小模型,早在2024年aiXcoder 团队就已推出参数量为7B的代码补全小模型,能够精准预测开发者意图,专为开发者日常编码的高频场景设计。

 

据介绍,基于“场景定义模型”这一理念,aiXcoder已构建起覆盖多个研发关键环节的小模型矩阵,并创新提出“大模型+小模型”协同架构,让“通才”大模型与“专才”小模型各司其职、优势互补:通用大模型聚焦复杂意图理解、代码逻辑分析、修改方案制定等需要深度推理的工作,发挥其智能优势;而垂直场景小模型则承接高频工程任务,以轻量化特性实现快速、精准执行。

 

这种架构设计可以让企业的有限算力得到分层利用:小模型支持专项场景任务的高效完成,节约出更多算力用于大模型的复杂推理。由此,避免了高端算力的浪费,充分释放企业有限算力价值。


猜你喜欢

未来智能完成亿元级A+轮融资,与传音合作打造下一代AI Agent硬件

智能+未来智能

2026年5月8日,AI硬件公司「未来智能」完成亿元级A+轮融资,传音参与该轮投资。

2天前

中国智造登陆硅谷,追觅三大创新重构全球庭院养护生态

智能+追觅科技

美国旧金山,于旧金山艺术宫重磅开启Dreame NEXT:Autonomous Outdoors旗舰...

2026-04-29

小雨智造与北航共建实验室,创始人乔忠良:工业落地比人形奇观更具正义性

智能+小雨智造

2026年4月26日,由北京小雨智造科技有限公司与北京航空航天大学共同成立的“工业具身智能联合实验室...

2026-04-27

「Hi, I'm KAI」——超维动力发布全球最高自由度人形机器人

智能+超维动力

4月26日,具身智能公司超维动力Kinetix AI(KAI)举办「降临GIFTED」发布会,正式发...

2026-04-27

中关村科金得助大模型平台及全栈产品接入DeepSeek-V4系列模型

智能+中关村科金

2026年4月24日,DeepSeek全新系列模型DeepSeek-V4预览版正式上线并开源。

2026-04-24

哪个黄金行情软件好?如何下载黄金走势软件?

金融科技黄金交易平台

近期国际金价连创历史新高,破5500美元、盎司,成为国际黄金行情历史最高记录,所以在黄金投资领域,了...

2026-02-02

大家炒黄金用什么软件?十大手机炒金软件速来get!

金融科技黄金交易平台

在数字化金融浪潮的推动下,黄金投资已不再局限于传统的实物购买或银行柜台操作,而是越来越多地通过手机...

2026-02-02

外联出国:2026 日本移民政策更新!永住、入籍门槛升级,家属也将受影响!

大消费外联出国

日本政府在2026年1月23日发布了《关于外国人接收及实现有序共生社会的综合应对措施》,核心思路是从...

2026-02-02

“隐形冠军”乐欣户外(2720.HK)启动招股,预计2月10日香港上市

大消费乐欣户外

全球钓鱼装备行业龙头乐欣户外即将迎来资本市场的关键时刻,在为上市做最后准备。

2026-02-02

原创

零的突破:首款拥有国际自主知识产权的国产POC正式获FDA批准上市

创新创业深圳哈维生物医疗

美国食品药品监督管理局(FDA)正式批准深圳哈维生物医疗科技有限公司(Shenzhen Harvey...

2026-02-02

原创

比亚迪押注,85后学霸要IPO

伯镭科技

无人矿卡赛道,还是太疯狂。

2026-02-02

原创

OPPO、vivo等入股广东步步高教育发展公司

OPPO天眼查vivo

【#OPPO、vivo等入股广东步步高教育发展公司#】

2026-02-02

原创

蔚来资本等入股合光光掩模科技公司

天眼查蔚来资本

【#蔚来资本等入股合光光掩模科技公司#】

2026-02-02

原创

百度等入股北京人形机器人创新中心

百度天眼查

【#百度等入股北京人形机器人创新中心# 后者增资至约6亿】

2026-02-02

数字华夏创始人沈健获评“2025江苏财经新闻人物”,为人形机器人注入“中国温度”

数字华夏

2026年1月31日,以“向新向优,笃行致远”为主题的第四届江苏财经年会在南京举行。

2026-02-02

投资家网(www.investorscn.com)是国内领先的资本与产业创新综合服务平台。为活跃于中国市场的VC/PE、上市公司、创业企业、地方政府等提供专业的第三方信息服务,包括行业媒体、智库服务、会议服务及生态服务。长按右侧二维码添加"投资哥"可与小编深入交流,并可加入微信群参与官方活动,赶快行动吧。

ATFX:阿联酋突然退群背后:全球油价正被三重力量主导

ATFX:阿联酋突然宣布退出欧佩克,令其盟友措手不及。在加入欧佩克六十年后,阿联酋决定于下个月正式退...

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

精微视达完成新一轮超亿元融资,国产高端内镜领跑精准诊疗全球前沿

优选空天科工在阿联酋设立总部,正式进入中东市场

中东已成为中国一些知名公司的投资热土。

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

第20届中国投资年会圆满闭幕!K型曲线下,寻找穿越分化的确定性

2026年4月22日至24日,第20届中国投资年会·年度峰会于北京海淀盛大召开

第四届中国研究生金融科技创新大赛在南京收官

第四届中国研究生金融科技创新大赛在南京收官

12月28日,第四届中国研究生金融科技创新大赛在南京落幕。

京杭对话:杭州,凭什么吸引北京创新企业?

京杭对话:杭州,凭什么吸引北京创新企业?

从一张精准的产业蓝图,到一个敏捷的创新操作系统,再到一片丰沃的赋能土壤,杭州的生产性服务业正在这条路...

第19届中国投资年会·有限合伙人峰会在沪成功举办

第19届中国投资年会·有限合伙人峰会在沪成功举办

11月27日,由投中信息和投中网主办的第19届中国投资年会·有限合伙人峰会在上海举办。

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

“京杭聚势,共启新篇”:招商新路径,奏响区域协同发展强音

在区域经济协同发展的大背景下,京杭两地的经济协作正以一种全新的姿态加速推进。