WAIC抢先爆料:金融黑马大模型超DeepSeek刷新SOTA,论文已上线

用户头像
量子位
 · 上海  

又到了一年一度“中国AI春晚”WAIC,各家大厂动作频发的时候。

今年会有哪些看点?你别说,我们还真在扒论文的过程中,发现了一些热乎线索。

比如蚂蚁数科的金融推理大模型,发布会还没开,技术论文已悄咪咪上线。

金融领域的推理大模型,你可以理解为金融领域的DeepSeek,带着SOTA的刷榜成绩来了。

同样是“杭州”背景科技公司,蚂蚁数科。

不仅在各项金融测评集上刷新SOTA,在MATH、GPQA等通用推理基准中,也有比肩DeepSeek R1,GPT-o1等超大尺寸推理模型的水平。

而且论文也把技术细节全部公开讲清楚了。

嘿嘿嘿,留给蚂蚁数科自己发布会上当新闻来讲的东西,不多了。

模型出厂即专家

新模型名为Agentar-Fin-R1,一共有两个不同参数版本:8B32B

蚂蚁数科的研究出发点很务实,就是要突破大模型应用在实际金融业务场景中遇到的行业问题

与通用场景不同,金融应用在数据、幻觉和合规方面,有着

点击查看全文