阿里巴巴1月26日正式发布千问旗舰推理模型Qwen3-Max-Thinking,在多项权威评测中刷新全球纪录,成为迄今最接近国际顶尖模型的国产AI大模型。这标志着中国大模型从“追平”到“领跑"的关键突破。
据阿里云发布的信息,该模型总参数量超万亿,预训练数据量达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19项公认基准测试中,Qwen3-Max-Thinking整体性能可媲美GPT-5.2-Thinking、Claude Opus 4.5和Gemini 3 Pro等国际顶尖模型。
该模型采用全新的测试时扩展机制,实现推理性能大幅提升的同时更具经济性。在启用工具的HLE(Humanity's Last Exam)评测中,千问得分58.3,大幅超过GPT-5.2-Thinking的45.5