用户头像
入夜42
 · 湖北  

在今年开始之前,问题已经酝酿了数月。在 2024 年下半年的大部分时间里,OpenAI 都在开发一个内部代号为“Orion”(猎户座)的模型,该模型原计划成为 GPT-5。据参与该项目的人士透露,Orion 的目标是实现比当年 5 月发布的现任旗舰模型 GPT-4o 更大的性能飞跃。
但 Orion 项目最终未能产出更优的模型,公司不得不在今年 2 月将其作为 GPT-4.5 发布。 此后,它便淡出了人们的视线。
失败的部分原因在于预训练的局限性。预训练是模型开发的第一阶段,模型在此阶段处理来自网络和其他来源的数据,以便建立概念之间的联系。
据两位知情人士透露,OpenAI 不仅面临着高质量网络数据日益枯竭的问题,研究人员还发现,他们对模型进行的调整在模型规模较小时有效,但随着模型规模的扩大却失效了。

@入夜42 :GPT-5 在驱动 AI 智能体(AI agent)方面也比其前辈更胜一筹,这些 AI 智能体能在极少的人工监督下处理复杂任务。 例如,它能遵循复杂的指令,比如根据一系列规则来判断自动化客服 AI 智能体何时应该批准退款。
这位人士补充道,以前的模型需要通过学习多个棘手的客户案例(即所谓的“边缘案...