嘉银科技登上国际BIRD榜单,14B参数量大模型同级别第一

用户头像
嘉银科技
 · 上海  

近日,嘉银科技自主研发的大模型在NL2SQL全球最难榜单BIRD-Bench评测中斩获佳绩——不仅在所有参赛大模型中排名全球第六、国内第三,更以14B参数量登顶该量级全球第一,成为榜单中“高性能、轻量化、低成本”的技术新标杆,充分彰显嘉银科技在大模型技术与行业应用融合上的领先实力。

图片来源:BIRD-Bench官网

在数据智能领域,作为业界公认的自然语言生成结构化数据查询SQL代码(NL2SQL) 的“权威考场”,BIRD-Bench以高难度和贴近真实业务场景著称,被誉为“NL2SQL全球最难榜单”。其数据集覆盖金融、电力、医疗、零售等37个核心行业,总规模达33GB,包含超1万条高复杂度真实业务查询任务,不仅要求模型精准将自然语言转化为语法正确的SQL语句,更需在多表关联、复杂函数运算、动态过滤条件等生产级应用场景中稳定输出结果,堪称全球顶级AI团队技术实力的 “竞技场”。目前,包括Google、Databricks、Snowflake等国际顶尖大数据AI科技公司,以及阿里、字节、腾讯等国内知名企业团队均参与到BIRD-Bench评测中。

“小参数大能力”

此次嘉银科技大模型的突围,凸显了其在技术路径上的独特优势。不同于传统大模型依赖 “堆参数量、堆算力” 提升性能的思路,嘉银科技创新采用强化学习算法进行模型训练——通过设计多种可验证奖励函数组合以及多阶段的训练迭代,让大模型在自我迭代中增强自然语言理解和复杂SQL生成能力,这一技术路径不仅显著提升了模型在复杂数据查询任务中的准确率与鲁棒性,也避免了大参数量模型带来的高算力成本,实现了“小而精”的性能突破。从评测结果来看,该模型不仅超越了14B同参数量级的所有竞争对手登顶第一,更在与32B和更大参数量级模型的同台竞技中稳居全球前六、国内第三,成为榜单中“轻量化高性能”的典型代表。

技术突破行业痛点

对于高度依赖数据查询的金融科技行业而言,嘉银科技此次的技术突破具有重要的实践价值。一方面,14B参数量的模型可更轻松地部署于企业本地服务器或边缘设备,降低了企业引入AI的门槛与成本;另一方面,强化学习带来的高准确率与稳定性,能直接提升业务人员的数据分析效率——无需专业SQL技能,只需通过自然语言描述需求,即可快速获取精准数据结果,为企业决策提速、降本增效提供了新的技术支撑。

此次登榜BIRD-Bench,既是嘉银科技在数据智能领域技术实力的印证,更是其深耕 “实用型AI”的重要里程碑。未来,嘉银科技将持续优化大模型强化学习训练框架,进一步拓展模型在金融风控、智能客服、经营分析等场景的应用,以更高效、更易用的AI技术,为行业数字化转型注入新动能。