阿里发布千问最强推理模型Qwen3-Max-Thinking，性能媲美GPT-5.2、Ge...

华尔街见闻

2026-01-27 00:30 · 上海

阿里巴巴1月26日正式发布千问旗舰推理模型Qwen3-Max-Thinking，在多项权威评测中刷新全球纪录，成为迄今最接近国际顶尖模型的国产AI大模型。这标志着中国大模型从“追平”到“领跑"的关键突破。

据阿里云发布的信息，该模型总参数量超万亿，预训练数据量达36T Tokens，是目前阿里规模最大、能力最强的千问推理模型。在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19项公认基准测试中，Qwen3-Max-Thinking整体性能可媲美GPT-5.2-Thinking、Claude Opus 4.5和Gemini 3 Pro等国际顶尖模型。

该模型采用全新的测试时扩展机制，实现推理性能大幅提升的同时更具经济性。在启用工具的HLE（Humanity's Last Exam）评测中，千问得分58.3，大幅超过GPT-5.2-Thinking的45.5

点击查看全文