来源:新智元

新智元报道
编辑:Aeneas 好困
【新智元导读】今夜,整个AI圈震动了。全球最难AGI测试ARC-AGI-3一上线,就把全球顶尖AI打到集体失声,人类满分通关,最强模型Opus 4.6得分仅0.2%,还不到1%。AI这是一夜被打回「原始人」了。
就在今天,这条消息把整个AI圈给震了。
众望所归的,全球唯一尚未饱和的智能体基准测试ARC-AGI-3出炉了,直接血洗了全球顶尖大模型。
在这个测试中,人类得分100%,AI的得分普遍低于1%。

这个差距,比珠穆朗玛峰还高。
最惨烈的是,在上一代测试中还能拿下69.2%高分的「模范生」Opus 4.6,在ARC-AGI-3面前直接现了原形,得分仅为0.2%。

这位曾经横扫各大榜单的「学霸」,连蒙带猜都拿不到1分。
这面镜子,照出了当前AI能力中最深的裂缝。

在最近的采访中,老黄认为我们已经实现了AGI。但是ARC-AGI-3显示,或许如今的AI连