在今年开始之前,问题已经酝酿了数月。在 2024 年下半年的大部分时间里,OpenAI 都在开发一个内部代号为“Orion”(猎户座)的模型,该模型原计划成为 GPT-5。据参与该项目的人士透露,Orion 的目标是实现比当年 5 月发布的现任旗舰模型 GPT-4o 更大的性能飞跃。
但 Orion 项目最终未能产出更优的模型,公司不得不在今年 2 月将其作为 GPT-4.5 发布。 此后,它便淡出了人们的视线。
失败的部分原因在于预训练的局限性。预训练是模型开发的第一阶段,模型在此阶段处理来自网络和其他来源的数据,以便建立概念之间的联系。
据两位知情人士透露,OpenAI 不仅面临着高质量网络数据日益枯竭的问题,研究人员还发现,他们对模型进行的调整在模型规模较小时有效,但随着模型规模的扩大却失效了。