又到了一年一度“中国AI春晚”WAIC,各家大厂动作频发的时候。
今年会有哪些看点?你别说,我们还真在扒论文的过程中,发现了一些热乎线索。
比如蚂蚁数科的金融推理大模型,发布会还没开,技术论文已悄咪咪上线。
金融领域的推理大模型,你可以理解为金融领域的DeepSeek,带着SOTA的刷榜成绩来了。
同样是“杭州”背景科技公司,蚂蚁数科。
不仅在各项金融测评集上刷新SOTA,在MATH、GPQA等通用推理基准中,也有比肩DeepSeek R1,GPT-o1等超大尺寸推理模型的水平。
而且论文也把技术细节全部公开讲清楚了。
嘿嘿嘿,留给蚂蚁数科自己发布会上当新闻来讲的东西,不多了。
新模型名为Agentar-Fin-R1,一共有两个不同参数版本:8B和32B。
蚂蚁数科的研究出发点很务实,就是要突破大模型应用在实际金融业务场景中遇到的行业问题。
与通用场景不同,金融应用在数据、幻觉和合规方面,有着