采访纪要:迪伦·帕特尔谈万亿美金AI基建(第2部分)

用户头像
杰夫磊
 · 广东  

对话双方:采访者(提问方)、迪伦·帕特尔(回答方,简称“帕特尔”)

十三、AI人才战争:少数人决定行业走向?

采访者:AI领域的“人才战争”也是个热门话题。有人说,随着AI越来越强,可能会“压缩”真正关键的研究人员数量——只有少数人能影响AI的未来方向。这是不是意味着Meta这些公司现在的巨额投入其实很合理,甚至应该更多?

帕特尔:现在有人觉得“某个人拿10亿美金年薪太离谱”,但其实很合理。因为这些人在价值数百亿美金的芯片上做实验——要是他们的一个实验没做好,比如用了1/3的算力却做了重复研究,那浪费的成本是巨大的。我把这叫“浪费算力”,但本质上是“试错”——没人知道该试什么、不该试什么,AI太复杂了。

比如有些团队在调整现有数据的使用方式:怎么混合数据?按什么顺序喂给模型?怎么过滤?模型架构怎么调?有人研究长上下文,有人研究其他细节——哪怕有人能让模型效率提升5%,也能节省5%的训练时间和5%的推理算力,积少成多。而且我们离“模型效率达到人类大脑水平”还很远,所以这种优化空间还很大。

“加人不会让进度变快”——因为试错需要时间:做实验、分析结果、调整参数,再试100种不同的方式,看趋势,再决定方向。这里面有很多“直觉”——读数据、理解数据、重新实现模型,加人反而会拖慢速度。

比如Meta在搞“超级智能”(Super Intelligence)之前的问题就是“人太多,且没有优秀的领导”——很多实验失败,时间浪费在无关紧要的事情上。我一个在OpenAI的朋友(推特上很有名,叫Run)发过一条推文:“一想到Meta浪费了多少H100(英伟达GPU),我就气到发抖”。这话很有意思,因为所有人都在浪费算力——OpenAI也在浪费,没人知道“最优模型架构”是什么。

Run最近还提了个有意思的观点:“为什么不花更多钱挖有‘工艺知识’的人?比如我们在亚利桑那州的晶圆厂做得不错,为什么不把深圳最优秀的人挖过来?”这种人才战争会不会升级到“国家层面”——比如美国通过Meta、OpenAI挖全球的人才?

其实英特尔的衰落也和这个有关:很多在纳米化学、物理领域的天才,因为“年薪只有20万美金”而转去谷歌(年薪80万)或OpenAI(年薪1000万)、Meta(年薪1亿)。聪明的18岁年轻人肯定会选“赚钱多的领域”——就像最聪明的医生会选皮肤科或麻醉科,不是因为这些领域最有价值,而是因为“工作时间好、薪水高”。

所以人才战争确实很激烈,本质上是“人力资本”和“资本品”的博弈。工业化时期,随着资本品增加,人力资本的重要性下降;但现在,“制造东西”已经很普通了,价值主要来自“创意”。英伟达CEO黄仁勋跟我说过一句话,我觉得很有道理:“美国人富有的原因不是大家想的那样——我们把劳动力外包了,但保留了价值。”英伟达、苹果都是这么做的——生产在亚洲,利润在自己手里。

但“挖有工艺知识的人”的难点在于“怎么选对人”——有些人“能说会道”,让人觉得很厉害;但有些人“不善言辞却很会做事”,你却不知道。比如Meta之前挖人就有这个问题——没挖到最优秀的,反而挖了很多“不行的人”。OpenAI的山姆就说过“Meta没挖到我们最优秀的人”,但他也不得不内部加薪留任——所以人才战争的真实情况很复杂。

我最近想到一个比喻:机器学习研究和半导体制造很像。半导体制造里有很多机器学习没有的岗位,但核心都是“调无数个参数”——比如把晶圆放进设备,调整沉积时的腔室压力、化学物质的混合比例、速度、时间(30分钟还是31分钟)。每个设备有无数个参数,还得考虑顺序——根本不可能试遍所有组合,就像设计芯片时不可能试遍100万亿个晶体管的排列方式。所以只能靠直觉选几个点试,看数据,再决定方向——机器学习研究也是如此。

半导体制造的研发成本很高(比如英特尔的主晶圆厂),而且不产生经济价值,只用来“学习怎么搞下一个制程”,然后规模化赚钱——机器学习研究也是如此。

十四、AI生态的权力格局:谁掌握主动权?

采访者:我们回到最开始的话题——AI生态的“权力源泉”是什么?企业如何保持或获取权力?比如 talent(人才)可能是源头,长期来看,有人才的企业才有权力;但也有“结构性因素”,比如工业规模的基建需要很久才能建成。能不能举个具体例子,比如Cursor(AI编程工具)现在很火,营收很高,但大部分利润给了Anthropic——这种关系里谁有权力?未来会怎么变?

帕特尔:Cursor现在的年化营收快到10亿美金了,这是个天文数字。但它的利润率不高(有人说负的,我觉得略正),而且大部分利润流回了Anthropic。现在的毛利润在Anthropic手里,但Anthropic又把这些利润投入到算力训练中——最终这些钱会流向黄仁勋(英伟达),或者亚马逊(再流向博通),总之是硬件层。

很多人觉得“Anthropic掌握所有权力”,但其实不然——Anthropic只提供“生成代码的模型”,系统里还有更多关键角色:Cursor掌握用户数据和用户交互行为,Anthropic只拿到“提示词-响应”的配对数据。而且Cursor现在有了“Cloud Code”(自己的代码产品),和之前不一样了。更重要的是,Cursor在训练自己的嵌入模型(embedding model)、自动补全模型,还能“随时把Anthropic的模型换成OpenAI的”——它现在用Anthropic只是因为“Anthropic的模型最好”。要是Cursor有了足够多的数据,甚至能训练出“在编程领域比Anthropic更好的模型”。

所以这种权力关系很微妙,他们是“友敌”(frenemies)——表面是朋友,实则有竞争。就像OpenAI和微软的关系,这是全球最疯狂的权力博弈。比如他们签的协议里提到“对OpenAI转为盈利后的条款有共识”,这话听起来像“没说”——但背后的权力斗争比韩剧还精彩。

采访者:你个人最感兴趣的“权力博弈”是哪个?哪些子剧情的风险最高?

帕特尔OpenAI和微软的关系最有意思。2023年大家还说“微软要统治世界”,2024年也差不多,但2024年下半年微软开始“退缩”——艾米·胡德(微软CFO)这些人觉得“不能为OpenAI承担3000亿美金的算力投入”,他们付不起。所以微软暂停了很多数据中心的建设,还说“我们不做OpenAI的独家算力供应商了,你可以找甲骨文”——主动放弃了权力。现在甲骨文拿到了合作,但OpenAI还要把20%的API营收给微软,而且微软对OpenAI有“49%利润上限”的股权,还有IP共享协议——没人真正懂这个协议的细节。

现在他们在重新谈判——OpenAI不想受限于微软,协议里还有“要是实现AGI,微软就不再拥有API或IP权利”的条款,这到底是什么意思?20年前的人看到ChatGPT,肯定会说“这就是AGI”——它什么都知道,能聊天,比人类聪明;但现在大家觉得“它连XX都不会”。所以“AGI的标准一直在变”。对我来说,只有当AI能“把手放进嘴里,意识到‘这是我自己’”——也就是有自我意识时,才算AGI。

另一个权力博弈是“英伟达和超大规模云厂商”(hyperscalers)。英伟达现在是“王者”,几乎所有毛利润都流向他们——台积电、三星也赚钱,但需要巨额资本支出;博通也赚很多,但英伟达的毛利润是行业最高的,而且差距很大。

英伟达不能收购大公司——之前想收购ARM(2020-2021年)都没成,当时他们还没现在这么大。所以他们的现金流怎么用?要是只做股票回购,就等于承认“找不到更高回报的投资”——这是“失败者的做法”。Meta苹果谷歌之前成熟时也做回购,但现在他们觉得“资本有更好的回报”,所以不做了。

英伟达CEO黄仁勋虽然也提过回购,但主要还是“再投资”——但能投的地方有限,所以他们开始做“需求担保”(demand guarantees),用资产负债表赢取更多合作。比如最近和CoreWeave的合作:英伟达为CoreWeave的算力集群提供担保,CoreWeave本来不会建这个集群,因为短期算力租赁是个烂生意——最好的模式是和有资产负债表的公司签长期协议。但这种公司不多,所以只能和OpenAI这种“没资产负债表但有潜力”的公司签长期协议,或者和有资产负债表的公司签短期协议。

英伟达来说,最理想的情况是“风投公司投资AI初创公司,70%的融资用来买算力”——现在很多初创公司(比如Physical Intelligence)就是这么做的,就算不全是直接买GPU,也会间接流向英伟达。要是能让初创公司“把70%的融资用在一次训练上”——先有想法、收集数据、做训练、出产品,再融资——那就更好了,但没人愿意做这种“靠单次训练生存”的算力集群,所以英伟达得提供担保。

而且OpenAI也可能“换供应商”——比如自己做芯片,用其他公司的ASIC(专用集成电路),甚至买谷歌的TPU、和亚马逊合作。他们不关心供应商是谁,只关心“能服务用户、建数字上帝、赚营收”。所以英伟达虽然是最好的选择,但也不能掉以轻心。

十五、AI产能过剩风险:需求会一直增长吗?

采访者:有些研究经济周期的投资者(比如卡洛·佩雷斯)说“每次短缺都会跟着过剩”——大家会在长周期、高资本支出的项目上过度建设,比如现在的多吉瓦算力、半导体产能。但你之前说需求还很旺盛,是不是意味着我们离“过剩”还很远?

帕特尔要是模型停止改进,肯定会过剩——这很简单。供应链问题(比如换供应商)是细节,核心还是“模型能不能改进”。要是模型不改进,一年后美国经济会陷入衰退,台湾、韩国也会——因为现在太多经济活动依赖AI基建,营收都流向了这些领域。

但和历史上的泡沫不同,AI不是“郁金香泡沫”那种无意义的炒作,也不是“加密货币”那种庞氏骗局——它是真实的价值创造。比如英国曾在10年内把GDP的6%投入铁路建设,我们现在投入的比例还远没到这么高。当时英国也“过度建设”了——但铁路降低了运输成本,只是没人知道需求会在哪天停止,而且10家公司一起建,肯定会过剩。

现在有人说“这次不一样,因为是全球最赚钱的公司在投入,他们随时能停”——比如微软之前就停过,后来又重启了,还和Nebius签了190亿美金的GPU采购协议。要是微软没暂停数据中心建设,就不用给Nebius这么多毛利润,但Nebius赌对了需求,所以赚了。

所以关键是“需求什么时候停”——要是规模化定律持续,需求会一直增长,只是受限于“接受周期、资本、供应链、时间”。但本质上,“对谷歌高级工程师水平AI的需求是无限的”——这背后是2万亿美元的软件价值。再比如“能识别物品、简单操作的物理智能机器人”——对供应链的价值也是巨大的。

而且AI和之前的革命不同:之前的革命是“用资本品减少人力资本需求”,而AI是“创造人力资本”——这是本质区别。

采访者:对了,还有个说法是“我们这个播客会戳破AI泡沫”——因为之前聊过的股票都跌了。但你之前说这只是市场正常波动,不是“诅咒”?

帕特尔:我之前算过,根本没有“诅咒”——就是市场表现而已,像抛硬币一样随机。比如我上次在你的另一个播客里聊过应用材料(Applied Materials),之后六个月股价涨了70%——我打破了“诅咒”。

十六、AI中间层公司:临时补丁还是长期生意?

采访者:我们聊了英伟达(底层硬件)和应用端(比如Cursor),那中间层公司(比如Together、Base10、Fireworks、Nebius)呢?它们能做成长期好生意,还是只是“临时补丁”,用来满足当前的算力需求?

帕特尔:中间层的“新云厂商”(neocloud)模式,做得好能赚大钱,做得不好就很糟糕。要是签短期协议,靠“短期算力租赁”赚钱,初期现金流会很好——比如买一块英伟达Blackwell GPU,六年的每小时成本约2美元,但前六个月租出去能收3.5-4美元/小时,利润率极高。但2-3年后,下一代GPU出来(10倍快,成本3倍),老GPU的租金会暴跌,生意就难了。

要是签长期协议,比如Nebius和微软的190亿美金合作,情况就不一样——微软的信用比美国政府还好(债券利率更低),所以这个协议的毛利润很高,Nebius至少能赚60亿美金毛利润,扣除运营成本后还是很可观。CoreWeave之前也是靠和微软的长期协议赚钱,后来微软不合作了,CoreWeave又找了谷歌、OpenAI这些客户。但OpenAI没有资产负债表,所以CoreWeave的风险更高——虽然利润率高,但不确定OpenAI能不能付钱。

所以中间层公司能赚大钱,但风险也分等级:微软这种“有资产负债表”的公司合作,风险低和OpenAI这种“没资产负债表”的公司合作,风险高;和初创公司合作,风险更高。

还有“推理服务提供商”——比如帮Roblox在游戏里集成LLM,帮Shopify做AI客服。虽然这些公司自己也能做,但推理其实很复杂,尤其是模型变大后,所以中间层公司能提供“规模化、可靠的算力”,还能做开源模型的微调——这也是一门生意。但要是客户自己能搞定,或者有更多竞争对手,利润就会被压缩

总之,中间层有机会,但大部分风险都在中间层,英伟达几乎没风险——所有钱最终都会流向他们。

十七、AI与软件行业:传统SaaS模式的终结

采访者:我们聊聊软件行业。有人说“价值会流向软件端”,但你好像不这么认为?软件行业的商业模式会怎么变?

帕特尔:很多人问我“你为什么不关注软件端,价值都在那里”,但他们没意识到“软件已经不是5-10年前的样子了,商业模式也会变”。

2021年11月SaaS(软件即服务)开始暴跌,当时大家觉得是“公司盈利超预期后的回调”,但核心是SaaS的商业模式依赖“研发成本稳定,用户增长快,销货成本低”——而且客户获取成本(CAC)很高。但AI改变了这两点:

1. 软件研发成本暴跌:比如中国的软件开发者2015年的薪资是美国的1/5,能力可能是美国的2倍,所以软件研发成本是美国的1/10——这导致中国的SaaS和云业务远不如美国发达,因为企业更愿意“自己开发而非租赁”。现在AI让全球软件研发成本都暴跌,企业会更倾向于“自建”,SaaS的核心价值会被削弱

2. AI软件的销货成本很高:传统SaaS的销货成本几乎为零,但AI软件需要算力,销货成本很高。而且客户获取成本没降——销售难,进入新领域难。所以AI软件公司会面临“高客户获取成本+高销货成本+多竞争对手”的困境,市场会变得碎片化,很难达到“客户获取成本和研发成本被摊薄”的临界点,净利润会更差

所以传统软件公司的日子会很难过,但有规模的公司(比如YouTube)会越来越好——内容生成成本下降,平台掌控权更强。比如Salesforce里的AI功能,未来企业可能会“自己开发”,而不是用Salesforce的——不是说Salesforce不行,而是很多软件公司都会面临这种“被替代”的风险。

十八、AI与能源:算力的“电力瓶颈”

采访者:我们聊了Token(推理),但没聊“瓦特”(电力)——AI对电力的需求激增,人类怎么应对这个挑战?

帕特尔:首先,现在的电力消耗其实不算多——AI数据中心的电力消耗约占美国总电力的3-4%,其中普通数据中心占2%,AI数据中心占2%,这真的不算多。问题是“我们40年没怎么建电厂了”——这些年主要是把煤电换成天然气,而且监管法规多、劳动力不足、供应链短缺(比如通用电气的联合循环燃气轮机、三菱的设备、变压器线圈的UV固化产能)。

但单个数据中心的电力需求确实很惊人——比如OpenAI要建的2吉瓦数据中心,电力消耗相当于整个费城的总消耗,这很疯狂。以前大家觉得“建几百兆瓦的数据中心就很大了”,现在“不到1吉瓦都不好意思说”——我认识一个负责数据中心建设的人,他说“500兆瓦而已,没什么”,我当时就惊了——500兆瓦的资本支出约250亿美金(包括GPU),这可是巨款,但现在大家都习以为常了。

不过我们正在“重新学会建电厂”——供应链在扩张,电网在调整。但AI数据中心也给电网带来了挑战:比如训练任务的算力需求波动大,可能导致电网不稳定,甚至停电;就算不停电,电网频率(比如59赫兹)波动太大,会缩短冰箱等家电的寿命,而用户可能都不知道是数据中心导致的。

所以现在有很多“奇招”来解决电力问题:比如用天然气建高效的联合循环电厂,用柴油发电机(有人把卡车发动机并联起来发电,因为卡车发动机的产能大),埃隆·马斯克还从波兰进口电力设备到美国——因为美国本土供应链跟不上。只要有供应链缺口,就会有人填补:通用电气会翻倍生产涡轮机,三菱也会,变压器供应链会扩张,甚至会进口中国的设备(虽然不是首选)。

还有“劳动力短缺”——比如西得克萨斯的移动电工(能做数据中心电力工程的)薪资翻倍,就像2015年的页岩油工人一样,不需要太高技能,去西得克萨斯就能赚大钱,但这种人太少了——要是美国有足够的电工,数据中心建设速度会快很多。

不同公司的供应链也不一样——谷歌、Vantage、Edge Connects、QTS、亚马逊的 data center 建设方式不同,供应链也不同,所以会有各种“供应链怪象”。而且不同人的乐观程度也不一样:达里欧最乐观,然后是机器学习研究员,再是我,再是你,然后是纽约的半导体投资者,再是纽约的非半导体投资者,再是红杉资本里觉得“AI从2023年就是泡沫”的人,最悲观的是电力公司的人——他们觉得“电力需求不会涨,不用建电厂”。

还有法规问题:比如得克萨斯州和PJM(美国东北部电网)规定“可以提前24-72小时通知大型用电户,削减一半电力”——这没问题,因为要优先保障居民用电,不能像台湾那样“干旱时限制居民用水,却不限制台积电”(2021-2022年有几个城市限制居民每周只能洗3次澡,因为台湾人没有“体味基因”,所以能接受,但在印度就不行)。

但数据中心要应对“断电”,就得装备用发电机(通常是柴油发电机,也有天然气或氢能的),但又会遇到“环保法规”——比如发电机的密度太高,要是每月运行超过8小时就会违反“空气排放许可”。所以这里面的矛盾很多,很有意思。

十九、中美AI竞赛:谁更需要AI赢?

采访者:要是对比中美在AI产业链各环节(电力、半导体、模型、应用)的表现,你觉得最有意思的差异是什么?有哪些值得关注的“子剧情”?

帕特尔:中国是很强的竞争对手。要是没有AI热潮,美国可能在本十年结束前就失去全球霸权,不再是“霸主”——对美国人来说,这是个坏消息,对我来说也是(我是美国本位主义者)。没有AI,美国的供应链速度慢、成本高、经济下滑、债务不可持续(经济增长跟不上债务增速)、过度消费(生产远低于消费)、金融化严重,还有社会不稳定——收入不平等是一方面,社交媒体放大了这种不平等(人们更爱炫耀财富,算法推送的内容不同,导致文化分裂)。比如上世纪30-50年代,大家都看同样的电影,有“共同文化”,但现在就算是我和你,社交媒体推送的内容也不一样,更别说和圈外人了。

所以美国“必须靠AI”——AI必须大幅提升GDP增速。一旦开始“分蛋糕”(而不是“做大蛋糕”),美国就完了。而中国的思路不一样——他们不“必须靠AI赢”,而是一直在“打长期战”:从钢铁、稀土、太阳能板、手机、PCB(印制电路板),到很多其他行业,他们都是“循序渐进,最终胜出”,而且他们更努力、平均智商更高。要是没有超强AI,美国会耗尽易开采的镍、钴、石油、天然气,太阳能板的效率提升也跟不上,成本会上涨,“蛋糕”会缩小,社会也会分裂。所以我的悲观观点是:“不加速,就灭亡”,美国必须赢AI竞赛。

中国也想当“全球霸主”——谁不想呢?但全球只有美国和中国有能力、有意愿这么做。中国AI生态的思路是“不一定需要最大的算力集群”——比如OpenAI要建2吉瓦的Blackwell/GB300芯片数据中心,这些芯片比中国能买到/自己做的芯片快得多,中国部署的芯片也少。但美国现在在做的,其实是中国过去常做的“砸钱建生态,让市场变有趣”——比如OpenAI现在有8亿用户,未来可能有30-50亿用户,覆盖全球,到时候就能赚钱,这是“聚合理论”(aggregation theory)。

中国不这么想,他们更关注“自主可控”——自己做所有芯片。当然,特朗普搞关税、美国搞《芯片法案》,但这些投入和中国过去10年在半导体领域的投入比,就是“杯水车薪”——中国通过国企、税收优惠、土地补贴、地方政府、政府风投基金(大基金)等方式,在半导体领域投入了至少4500亿美金,而且是“不计利润”地建生态。

长期来看,中国在“自主供应链”上更有优势——除了原材料,他们几乎不用依赖外部;而美国需要从各地进口(比如从某个地方进口钛),供应链是全球化的。所以中国现在更关注“自给自足”,而不是“靠聚合用户赢”。但中国的人才储备很强,企业间“不挖人”——比如DeepSeek的工程师薪资比其他公司高,但远不到1000万美金,就算他们值这个价。

而且中国的建设速度比美国快得多——要是中国想建2吉瓦或5吉瓦的数据中心,可能会“走私很多芯片”(虽然不是故意的,但为了建10吉瓦数据中心,他们可能在几年内就搞定,而美国要建10吉瓦数据中心还需要很久)。中国的芯片速度、内存不如美国,但他们能“靠规模弥补”,而且建设速度快——埃隆·马斯克算快的了,但和中国比还是慢,他自己可能也知道,所以特斯拉的电池厂很多在中国建。

二十、AI质疑者:你尊重的“AI悲观派”是谁?

采访者:你最尊重的“AI悲观派”是谁?就是那些和你观点差异很大,但你依然觉得他们值得关注的人。

帕特尔:一些AI领域的“大佬级研究员”,比如扬·勒丘恩(Yann LeCun),他们是悲观派。我尊重他们,喜欢他们的观点,但觉得他们完全错了。他们的核心观点是“现在的AI路线(LLM规模化)走不通,到不了AGI”——这一点他们是对的,但他们又说“强化学习这些也不行”,这就不对了,有点“为了反对而反对”。

还有一些投资者,觉得“AI是炒作”,但还是靠AI赚钱——比如他们知道OpenAI和甲骨文的合作,觉得“OpenAI付不起钱,但市场会觉得这是利好,所以甲骨文股价会涨”,于是买甲骨文股票,在财报前卖出。我在某种程度上尊重他们,但觉得这种“只看短期市场情绪”的做法没什么意义——随着AI的证据越来越多,这种“悲观”会越来越站不住脚。

采访者:对了,还有个说法是“我们这个播客会戳破AI泡沫”——但你之前说这只是市场波动?

帕特尔:我之前算过,根本没有“诅咒”——就是随机的市场表现。比如我上次聊应用材料,之后股价涨了70%,打破了“诅咒”。

二十一、最受关注的AI初创公司

采访者:你现在最关注哪些AI初创公司?

帕特尔:我最近投的一家叫Periodic Labs,团队主要是OpenAI的人,还有一个谷歌员工和几个材料科学家。现在大家聊的AI都是“大规模网络训练、强化学习、文本、数字上帝”——我们都想做“数字上帝”,但除了自动化编程,还有一个领域能创造巨大经济价值:比如“研发出效率提升25%的电池化学材料”。

现在很多设备(比如智能眼镜)的瓶颈就是电池——要是能在眼镜上实现笔记本电脑的算力,我们的技术会进步很多。而Periodic Labs想做的,就是把“强化学习”用到“现实世界的化学实验”中:模型生成一个化学配方,在现实中测试,把结果反馈给模型,反复迭代。

这种“物理世界的强化学习”比“纯数字强化学习”难很多——因为物理实验的“飞轮”很慢:做配方、测试、反馈,成本高、耗时长。但这里面有很多“低垂的果实”(low-hanging fruit),潜力很大。

二十二、AI硬件创新:除了加速器还有什么?

采访者:硬件领域除了“和英伟达竞争的加速器公司”(比如做TPU、Trainium的),还有哪些值得关注的创新方向?

帕特尔:我一直不看好“和英伟达竞争的加速器公司”——太难了,要做的事太多、资本支出太高、缺乏革命性突破、依赖太多前提条件。我希望他们能成,但可能性不大。

真正的机会在“供应链的非尖端环节”——英伟达很尖端,但他们的供应链里有很多“老旧技术”,超大规模云厂商的供应链也一样。比如“变压器”——变压器技术50-100年没怎么变了,现在有公司在做“固态变压器”,这就是机会。

还有“芯片间的网络”——随着上下文长度延长,内存需求越来越大,虽然新内存技术(比如HBM)有帮助,但DRAM(动态随机存取存储器)行业的资本投入太多、工厂太多,很难颠覆。所以“让芯片更紧密地连接,共享内存”是个好方向,这里面有很多创新空间。

还有“光电子连接”——填补“电连接”和“光连接”之间的空白。比如英伟达的Blackwell芯片在制造和供应链上遇到了很多问题,导致AI服务器部署变慢,可靠性也受影响——因为芯片间的连接带宽太高(每个芯片能和机架内其他芯片以1.8TB/秒的速度连接),这种带宽的数据流是难以想象的,所以连接技术需要创新。

还有“半导体制造的软件”——半导体制造的设备是“太空级”的(最复杂的人类造物),比如一台设备要5亿美金,工程奇迹,但设备背后的软件很烂。这里面有很大的优化空间,能加速制造过程。

另外,“数据共享”也是个问题——比如英特尔内部的数据共享很差,光刻团队不愿和蚀刻团队分享数据,数据也不能传到AWS数据中心做关联分析,所以实验学习的速度很慢。台积电也有这个问题,不会把数据传到云端。要是能“加速实验-分析-再实验”的循环,就能提升效率——这需要“改变公司文化”(比如联电正在做的)和“更好的模拟器”。

世界模型”(world models)也是个方向——不只是“模拟虚拟世界”(比如谷歌的Genie3,能在虚拟世界里走路、看汽车),还能“模拟分子、物理反应”(不是靠传统的计算流体力学,而是靠AI学习物理规律,再模拟)。比如用世界模型训练机器人拿杯子,或者模拟化学反应、火灾——现在有很多做世界模型的公司,尤其是聚焦“物理现实模拟”的,潜力很大。

不过现在很多“酷创新”还是来自大公司——台积电、英伟达、安费诺(Amphenol)这些,这是行业常态。

二十三、快速问答:AI公司印象

采访者:我们来个“快速问答”——我说一家公司,你用一两句话说说你的印象。从OpenAI开始。

帕特尔:超级棒。我们聊了一天,不用多说了。

采访者:Anthropic。

帕特尔:我对Anthropic比OpenAI更乐观。因为他们的营收增长快得多——聚焦软件领域(2万亿美元市场),而OpenAI要兼顾软件、科学AI、消费应用等多个方向,虽然这些方向都可能成,但Anthropic在软件领域的执行力更强

采访者:AMD。

帕特尔:我喜欢AMD,但他们很“中庸”。我从小组装电脑,喜欢电脑,AMD一直有“对抗英特尔、英伟达的弱者心态”——英特尔、英伟达是“邪恶巨头”,AMD是“友好的弱者”,总有人说“AMD要抢占市场份额”,这种“弱者叙事”很容易让人喜欢。而且AMD是我第一个“翻倍股”(multibagger),有感情。可惜我现在因为合规不能炒股了,有点遗憾。

采访者:XAI(埃隆·马斯克的AI公司)。

帕特尔:XAI面临“融不到资”的风险。埃隆是最好的CEO,肯定有人愿意投,但需要的资本规模太大——他能建“歌利亚2号”(Colossus 2)超级数据中心(建成后会是全球最大,有30-50万块Blackwell GPU),但要是找不到“除了‘色情机器人’(Annie)之外的商业模式”,就难下去了。Annie(XAI的AI助手)的变现方式也不对——明明靠“可爱动漫女孩人设”吸引了很多用户,甚至有人对Annie产生情感依赖,却只卖“虚拟服装”,定价还不灵活。其实可以搞“随机限定”,比如“有机会买到Annie的‘裸身’虚拟形象”“买到某部动漫的同款服装”“买到修女服造型”,肯定更赚钱。当然,XAI的人可能不喜欢这种方式,已经有人离职了。

XAI能建成下一个算力集群,但规模不会超过OpenAI、谷歌、Meta——不过他们会有“全球最大的单体数据中心”。如果埃隆找不到除Annie之外的大业务,就会落后。他肯定不允许这种情况发生,能自己垫资推进,但要建3吉瓦的数据中心,必须靠融资或营收,而现在营收还撑不起。

采访者:Oracle(甲骨文)。

帕特尔:只要OpenAI能成,甲骨文就能赚翻。但要想让OpenAI付得起3000亿美金,得看OpenAI的用户规模和IP价值——要是OpenAI能成5万亿或10万亿美金的公司,3000亿就不是问题。当然,OpenAI有风险(比如和微软的协议纠纷、Anthropic的竞争),但在“OpenAI能成功”的场景里,甲骨文的收益会非常惊人。

采访者:Meta。

帕特尔:Meta有“坐拥一切”的潜力。你看过他们新出的“带屏幕智能眼镜”吧?回顾计算史:从打孔卡编程,到DOS终端,到图形界面(GUI)+鼠标键盘,再到触屏——下一代人机交互会是“无需触摸”:告诉AI要做什么,AI直接执行。而Meta是全球唯一拥有“全栈能力”的公司:硬件(智能眼镜)、优秀模型、算力、推荐系统(知道该给用户推什么内容)。

要实现“无触摸交互”,需要四样东西:生成内容、理解用户指令并行动、精准推送内容、资本——Meta全有。当然风险也有,但我很看好Meta

采访者:Google(谷歌)。

帕特尔:我两年前很看空谷歌,现在超级看好。他们在所有领域都“醒过来了”:对外出售TPU(之前只自用)、模型性能越来越强(能和OpenAI竞争)、加大基建投入。公司内部还有很多混乱,但他们有“硬件业务”可以转型(虽然不如Meta、苹果),还有Android、YouTube、搜索这些IP——未来既能做消费端AI,也能做企业端AI,而Meta可能只擅长消费端。

二十四、AI时代的软件行业:传统SaaS的末日

采访者:很多人问你“为什么不关注软件端,价值都在那里”,你怎么看?软件行业的未来是什么样的?

帕特尔:大家没意识到“软件已经变了,商业模式也会跟着变”。5-10年前,SaaS是香饽饽——2021年11月开始暴跌,当时大家觉得是“企业盈利超预期后的回调”,但核心问题是SaaS的“好日子”依赖两个前提:研发成本稳定(甚至下降)、销货成本极低。但AI打破了这两个前提:

1. 软件研发成本暴跌:比如中国2015年的软件开发者,薪资是美国的1/5,能力却可能是美国的2倍——研发成本是美国的1/10。这导致中国几乎没有SaaS巨头,企业更愿意“自己开发”而非“租赁”——因为自建成本更低。现在AI让全球软件研发成本都暴跌,美国企业也会越来越倾向“自建”,SaaS的“不可替代性”没了。

2. AI软件的销货成本(COGS)极高:传统SaaS的销货成本几乎为零(多一个用户的边际成本接近0),但AI软件需要算力——每服务一个用户,都要花算力钱,销货成本很高。而且客户获取成本(CAC)没降——说服企业用新软件依然很难,进入新行业也难。

所以AI时代的软件市场会很“碎片化”:企业要么自己建软件,要么用“更垂直、更便宜”的AI工具,传统SaaS公司会面临“高成本+多竞争”的困境,很难达到“摊薄研发和获客成本”的临界点,净利润会越来越差。

但有规模的平台型公司(比如YouTube)会越来越好——内容生成成本下降,用户更依赖平台,平台的掌控权更强。比如Salesforce里的AI功能,未来企业可能会“自己用AI开发类似功能”,而不是买Salesforce的套餐——不是Salesforce不好,而是“自建”的门槛和成本都变低了。

二十五、最温暖的回忆:别人为你做过的最善良的事

采访者:最后一个问题——别人为你做过的最善良的事是什么?

帕特尔:肯定是我哥哥。我这辈子都很“混蛋”,现在也一样,但他每次都把我拉回正轨,纠正我的错误,无条件爱我。我小时候的很多记忆都是“重构的”,但哥哥对我的好是真实的——比如我总忘事、不考虑别人的感受,说话做事很自我,经常无意中伤害别人,都是他提醒我“你这么做不对”“你该考虑别人的想法”。

我知道自己有很多缺点:比如做事没条理、记不住细节、容易沉浸在自己的世界里忽略别人——幸好身边有哥哥这样的人,帮我补全“短板”。他这辈子都在包容我的“混蛋行为”,这是我能想到的最善良的事。

采访者:太感人了。今天聊了很多,非常感谢你分享这么多深刻的见解。

帕特尔:谢谢,我也很开心。