中国产经观察消息:2020年,GPT-3的发布标志着大模型时代的开启。从GPT-1到GPT-3,模型在各项任务表现提升的同时,参数量也增长了1500倍,据OpenAI公布,GPT-3最大的一个模型拥有的参数量是1750亿。2023年,随着GPT-4模型的发布,其在逻辑推理和文本理解上展示出了强大能力,GPT-4模型生产的内容已接近人类创作水平,而其训练的参数量也相应增长至1.8万亿,需要在2.5万张A100上训练90-100天。
2025年1月,DeepSeek引发的大模型应用快速增长,推动智算算力需求猛增。迈入DeepSeek后时代,国内AI推理侧算力需求正迎来爆发前夜。凭借稀疏注意力机制、混合量化等技术创新,DeepSeek将模型部署成本大幅降低,让中小企业乃至开发者都能低成本接入高阶AI能力。而Agent生态的持续繁荣,从智能客服到复杂业务自动化场景的全面渗透,带来了指数级增长的t