被低估的算力短板:Agent 正在重塑算力的木桶效应

用户头像
火千
 · 广东  

曾几何时,GPU 是 AI 世界的巨星,聚光灯下挥洒浮点运算,万人追捧。而 CPU?不过是后台打杂的,默默搬数据、管流程、伺候显卡大爷。可如今,Agent 潮水般涌来——成百上千个“数字员工”同时上线,吵吵嚷嚷要调用工具、查网页、开沙盒、写报告、互相辩论……系统瞬间炸锅。

GPU 还没热身,CPU 先跪了。

多 Agent 会“把操作系统忙坏”

每个 Agent 都像一个话痨实习生:想一想 → 干点事 → 回头看 → 再想想……循环往复,乐此不疲。这些动作不烧显存,却疯狂消耗 CPU 的调度神经——创建进程、切换线程、分配内存、回收资源……操作系统的内核快被薅成地中海。

结果是什么?

还没等到“模型通信”把系统打满,CPU 先忙不过来了,成了瓶颈。同时,Agent 经常要调用云端沙盒、虚拟环境,导致云服务器实例数量激增。

于是,云厂商惊觉:显卡堆得再高,CPU 不跟上,整套系统就是个精致的花瓶——好看,但一碰就碎。

英特尔AMD 突然成了抢手货。英特尔将 Intel 3 和 Intel 7 产能紧急转向服务器,消费端交付率下滑;Intel / AMD 宣布 CPU 涨价 15%。说白了就是把原本给普通消费者(PC、笔记本)的 CPU,优先拿去做服务器用的 CPU

如果你问为什么?

因为 服务器 CPU 不够用,云厂商、AI 数据中心在抢货。而愿意为了AI支付高溢价的,肯定不是普通消费者。所以,涨价不是因为想涨,而是因为“真的供不应求了”。这说明,CPU 紧张,已经从“市场预期”,变成了现实中的供需失衡

这哪是涨价?这是 CPU 的“三年之期已到,恭迎龙王归位”。

从配角到主角,从幕后到台前——它终于不用再假装自己只是个“搬运工”。

长上下文不只吃显存,还会“拖慢整条通路”

当 AI 需要“记住很长的上下文”(比如几万字、几十轮对话)时:

一部分内容只能搬到

内存(DRAM)

甚至更慢的存储(SSD / NAND)

问题来了:

显卡 ↔ 内存 ↔ 存储,中间要经过 PCIe 通道,PCIe 的速度,远低于显存内部带宽

于是:

整个系统的处理速度被“卡在路上”,不再是显卡算得慢,而是数据搬得慢

解决思路之一:

用更多 CPU,提供更多通道、并行搬运,或改通信方式,降低单通道压力

Agent 爱“同时干很多事”,CPU 扛不住就崩

Agent 不只是聊天,它会:同时调用多个外部工具、高频搜索网页、解析返回结果、多进程 / 多线程并行运行。这些行为的特点是,计算不重、并发极高、控制逻辑复杂。这类任务GPU 并不擅长,主要靠 CPU 的单核性能 + 多核调度能力。如果 CPU 不够强,Agent 会“卡顿”,工具调用排队,整个系统响应变慢。

Agent 时代 = AI 不再只是“算模型”,而是像一个不停指挥、协调、调度的数字员工团队。GPU 负责“深度思考”,CPU 负责“组织协调、搬数据、跑流程”。

Blackwell 架构刚发布时,黄仁勋意气风发,说这是 AI 的终极引擎。结果呢?内部 ARM CPU 成了瓶颈,Agent 一多,系统卡得像老式拨号上网。黄教主不得不低头:下一代 Rubin 架构,狂加 CPU 核心数;NVL72 甚至破天荒支持 Intel x86——那个“又老又耗电”的架构。

为什么?因为 x86 虽老,但稳。

其实我在之前讲存储的时候就提过,在 复杂 Agent 场景 下(多任务、多工具、多步骤),CPU 并不是“配角”。而是决定系统能不能顺畅运行的关键角色,x86 这种“老架构”,在处理复杂、杂乱、非标准化任务时,依然比很多新架构更稳、更通用。

也就是说,不是谁更新、谁更省电就一定更好,而是谁能把复杂事情处理好。AI 从“单一算模型”,进化成“多 Agent 协同干活”之后,英伟达现在也不得不承认AI 系统不是“显卡越强越好”,CPU 不够,整体性能就上不去。

就像一个公司,招了一万个天才,却没有中层管理——结果人人自说自话,项目全乱套。AI 也一样:模型再聪明,若没人调度、没人搬数据、没人处理 I/O,那不过是一堆沉默的参数。

所以别再只盯着显卡了。看看那些被忽视的“老家伙”——IntelAMD 的服务器 CPU,它们不是技术最新最炫的,却是系统最不能缺的“脊椎骨”。

潮水退去,才知道谁在裸泳。

而这次,是 GPU 发现自己裤衩子差点掉了——因为 CPU 才是那个默默系好腰带的人。

在大A,$海光信息(SH688041)$ 是基于 x86 架构,技术源头来自 AMD 授权获取 x86 相关技术,然后自己设计和商业化。产品主打服务器 CPU、数据中心和金融/政务云计算。

牢美里把x86生态当做护城河的非$英特尔(INTC)$ 莫属了。从收入和生态的角度,$AMD(AMD)$ 不如英伟达,但它毕竟是全球第二大 x86 CPU 厂商,且它家的CPU单核性能强,多核扩展能力极强,能效比优秀。AMD 的EPYC(服务器 CPU)AWS、Azure、Google Cloud和Oracle都在用。

我是秌,记录科技如何真实地影响产业与个体。记录变化,拆解趋势,如果你也关注这些问题,关注我,一起讨论正在发生的一切。

风险提示:本文系基于公开行业数据、券商研报及个人研究的整合分析,所有结论及观点仅为信息分享,不构成任何投资建议。提及标的仅供案例参考,投资者须结合独立判断并自行承担风险。市场有风险,决策需谨慎