2023年我判断英伟达处于ai龙头地位,网页链接{第一批 AIGC 独角兽开始裁员了,发生了什么?AIGC 行业现在合适进入吗,该如何选择和规划? - 知乎}
2024年我判断英伟达拿到了第一张门票网页链接{(2 条消息) 2024年12月24日开始梯度加仓英伟达 - 知乎}
按照一年写一篇的频率,2025年继续写一篇作为付费专栏的开篇文章。
进入2025年,算力领域的竞争格局并未发生根本性动摇,所以我之前那篇文章仍旧是有效的。但是市场对ASIC(专用集成电路)路线的讨论愈发激烈,尤其以博通为代表的定制化芯片方案引起不少关注与波动。其实在之前我就简单说了为什么我不看好博通的技术路线、今天的文章算是填坑,详细的解释为什么我如此判断。
一般认为,ASIC的核心优势在于,针对某一特定算法(如Transformer)或特定场景,通过硬件固化可以实现极致的性能与能效。但我认为这种优势极其脆弱:
首先,算法的快速迭代是专用系统的天敌。AI算法的发展日新月异,从CNN、RNN到Transformer,再到下一代可能出现的Mamba等新架构。一旦核心算法发生变革,为上一代算法优化的ASIC就会迅速贬值。而GPU的通用可编程性则能平滑过渡,通过软件更新适应新算法。
其次,“专用”意味着市场天花板清晰可见。ASIC的研发成本高昂,需要巨大的出货量才能摊薄成本。其应用场景被严格限定,一旦该细分市场的需求增长放缓或饱和,ASIC的商业模式就会面临挑战。而通用GPU的市场边界随着新应用的诞生不断扩展,天花板远高于ASIC。
专用系统的优势是静态的,而通用平台是动态的。它们之间的竞争也绝对不是排行版刷榜的竞争,而是生态的竞争。通用平台往往能通过灵活定制与软件迭代弥补硬件缺陷,这是GPU路线最强大的生命力所在。GPU并非完美,但其所有缺陷都可以通过庞大的生态和软件层来持续优化和弥补。
性能不足?可以通过软件库(如cuDNN、TensorRT)的极致优化、算法模型的压缩量化、以及分布式计算框架来弥补。开发者社区的集体智慧在不断挖掘硬件潜力,使得同一块GPU在不同时期的实际性能仍在不断提升。
能效不如?可以通过系统级优化(如GPU的精细功耗管理、与CPU的协同调度)和编译优化来改善。而ASIC的能效优势一旦在流片时确定,就几乎无法再提升。
功能缺失?通用性本身就是最大的功能。GPU可以今天训练大模型,明天做科学计算,后天处理渲染任务。这种灵活性意味着单一通用硬件平台可以通过软件定义,化身成无数种“虚拟的专用系统”,从而在整体经济效益上碾压任何单一的ASIC。
其实在技术演进史中,“专用系统”与“通用平台”之争反复出现。它们背后实则是两种商业逻辑和生态哲学的竞争。所以我们不妨回顾几个经典的技术竞争案例:
个人电脑(PC) vs. 大型机/小型机(Mainframe/Minicomputer)
大型机(如IBM System/360):它们是为处理大规模、特定、关键任务(如银行交易、人口普查)而设计的强大、专用、高度优化的系统。性能极强,但极其昂贵、封闭,且用途固定。
个人电脑(如IBM PC兼容机):它们是基于通用架构(x86)、标准化、可编程的平台。初期性能远弱于大型机,但价格低廉、灵活开放。任何人都可以为PC编写软件,实现各种功能(游戏、办公、设计)。
竞争过程与结果: PC并没有在 raw performance 上直接击败大型机,而是通过颠覆性的性价比和开放的生态系统,创造了一个全新的、巨大的市场。最终,PC的规模效应和持续迭代使得其性能不断提升,甚至侵蚀了大型机的很多传统市场(如服务器)。如今,大型机并未消失,而是退缩到其最核心、最擅长的领域(超可靠的关键任务处理),而PC及其后代(服务器、云)成为了计算世界的绝对主流。
2.晶体管 vs. 真空管
这是一个更底层的技术替代案例。
真空管是早期电子设备(收音机、电视、最早计算机)的专用放大和开关元件。性能对于当时的需求足够,但存在致命缺点:体积大、耗电高、发热严重、寿命短。
晶体管是一种更通用、更可靠、更高效的半导体基础元件。初期成本高、功率处理能力弱,但具有优越的特性(小型化、低功耗、高可靠性)。
竞争过程与结果: 晶体管没有试图在真空管的所有传统赛道上直接竞争,而是凭借其核心优势,开启了全新的应用领域(便携式收音机、小型计算机),并最终通过这些新领域的规模效应,实现了技术迭代和成本下降,反过来全面取代了真空管在几乎所有领域的地位。
3.智能手机 vs. 功能手机/各类专用设备
这是最近期的例子。
功能手机、数码相机、GPS导航仪、MP3播放器:它们各自在特定功能上做到了极致(诺基亚的耐用、索尼相机的成像、Garmin的专业导航)。但它们是封闭的、功能固定的。
智能手机(iPhone/Android):它是一个通用的、可编程的移动计算平台。初期摄像头不如卡片机,导航不如专业GPS。但它通过开放的操作系统和应用生态,将无数专用设备的功能整合到一个平台中。
竞争过程与结果: 智能手机没有在单一功能上立刻打败所有专用设备,但它提供了“足够好”的体验和无与伦比的便利性与综合性。巨大的市场吸引了应用开发者和硬件迭代,使得手机的各项功能迅速提升,最终彻底吞噬了MP3、卡片相机、便携GPS等市场,只给专业单反、高端导航等最顶级的专用设备留下了狭窄的空间。
从这些历史竞争中,我们可以总结出一些清晰的规律,这些规律也正作用于ASIC与GPU之争:
1,通用平台总是胜利:历史多次证明,构建一个开放、灵活、可编程的通用平台和生态系统,其长期生命力和影响力通常远大于一个性能极致但封闭的专用系统。NVIDIA的CUDA生态正是其最坚固的“护城河”。
2,共存:专用技术永远不会消失。当市场规模足够大、任务足够固定时,专用化(ASIC)永远是追求极致效率和性能的最终手段。它们会退到最核心的细分领域,并存活得很好。大型机、专业单反相机都是例子。
3,“足够好”定律:很多时候,“灵活通用且足够好”比“僵化专用但极致”更有商业价值和发展潜力。智能手机的相机就是“足够好”战胜“专业”的典型。
4,范式转移优先:新技术往往不是直接在旧战场上竞争,而是通过创造前所未有的新需求和新市场来赢得主导权(晶体管创造便携电子设备,PC创造个人计算市场)。
因此,回到ASIC和GPU,历史告诉我们:GPU所代表的通用加速计算平台更有可能成为未来计算的基础生态和主流,而ASIC则会在特定任务(如超大规模AI推理、视频编码)中扮演高效的“配角”角色,但是问题在于,符合要求的特定任务市场占比有限。超大规模、算法固化的单一推理场景——尽管绝对数额巨大,但其在整个AI芯片市场的占比预计仅为15-20%。更重要的是,这个市场并非一片蓝海,其内部竞争格局已经固化。
这个占整体市场不到20%的ASIC领域,还是一个客户集中度极高的“巨头游戏”。全球有能力和需求自研或大规模定制ASIC的公司,掰着手指头都能数过来:Google, Meta, Amazon, Microsoft等寥寥十几家而已。
这意味着博通等ASIC厂商的命脉,高度依赖于前十大客户的订单健康度。任何一家巨头的业务波动或战略转向,都会对其造成致命打击。这是一个典型的 “苦生意”,有人可能会说,英伟达的利润同样依赖这些大客户,但是我要说,这两者是表面相似本质不同的典型,英伟达的客户名单很长,但巨头们采购其GPU的原因高度一致:他们别无他选。
采购GPU是为了“做生意”:云巨头购买数万张H100/GH200,不是为了自己用,而是为了搭建AI云平台,租给OpenAI、Anthropic、数以万计的企业和开发者使用。这是一项能带来巨大新增收入的业务。客户的所有软件堆栈、算法模型、开发人员技能都基于CUDA构建。放弃NVIDIA意味着推倒重来,机会成本高到无法计算。这给英伟达带来了无与伦比的议价能力。
相比之下博通更像是一个打工皇帝,博通的ASIC业务本质上是顶尖的“设计服务外包”。采购ASIC是为了省钱和控制:巨头定制ASIC的核心动机,是希望在自己业务规模足够大的特定场景(如视频转码、搜索推荐推理)中,用定制芯片取代通用GPU,以极致地降低单次计算的成本。
这是一个成本中心的优化项目,而非收入中心的扩张项目。客户拥有最终架构定义权:芯片怎么做,是巨头说了算。Marvell、乃至巨头自己的芯片设计部门都是博通的直接竞争对手。在深度合作中,博通的核心IP和设计方法可能会被客户摸透,为客户未来自研或更换供应商埋下伏笔。以上种种都使得博通在与巨头的谈判中处于弱势地位。
这使得博通的订单实际上非常脆弱,一旦巨头战略收缩或计算需求发生变更,订单可能瞬间消失。
总而言之,这场竞争的最终形态,更像是智能手机整合无数功能一样,由GPU这样的通用平台来调度和管理包括ASIC在内的各种专用加速器,形成异构计算的终极形态。但是毫无疑问,在这个形态中,谁占主导地位是非常清晰的。