新年第一次更新 主要是AI硬件附赠一些锂电材料 0106(上)
首先祝兄弟们新年快乐 新的一年收获和收益更多
本文主要分几个部分
1 主要还是讨论海外AI硬件(NV和谷歌的全光趋势 基本确立了光的最大锐度 包括光芯片 CW激光器)
2 下篇写写国产AI 比如H200的进度 非常看好国产800G光模块的大放量(目前大家预期很低)
3 有一小部分的锂电材料内容(毕竟创立这个号的时候 我其实是看化工和金属材料的)
1 海外算力
1.1nv和谷歌两大巨头争夺cowos产能
目前海外的叙事主题就是谷歌和NV这两家巨头抢购台积电的后道cowos
当然nv有备选且成熟的cowos 比如amkr这一类 去年前年做个200W片一年的H20都没出错 谷歌当然也有备选 自然就是ASE日月光 但是目前还不够成熟 尤其做外售的卡
这导致了台积电的后道cowos供不应求+涨价(对大客户其实也涨不了太夸张) GPU也好TPU也好外售的订单完全是供不应求(所以我真的不明白A股硬件在怕什么 人家客户都多到需要抢购后道cowos产能了 还愿意加钱加急 最终做成GPU还不是利好ai硬件吗?)
目前nv给台积电的cowos指引差不多是27年是26年的翻倍不止
而谷歌这边更夸张。。。。给的是翻倍还超过。。。
本来本文准备是昨天写的 但是硬等看完了nv的ces发布会
眼花缭乱的看完了nv的六大产品
CX9网卡协同BF4-DPU+spectrum-6的组合 显著的增加了网络端口的数量和速率直接的迭代
现在的GB系列-nvl72的网卡配置大概也就是gpu:网卡=1:1左右 gpu:DPU-BF3大概是4:1左右 GB300对应的光模块数量差不多是1:1 而DPU-BF3的端口主要是200G的模块 差不多1:2左右 需要36个200G模块即可(这些还是柜内的光模块增量)
而现在的rubin-nvl72的网卡配置显然直接CX9直接迭代到了1.6T时代 而DPU的bf4最大的变化就是速率直接上升到800G GPU:DPU-BF4对应的数量最高上升到了2:1左右 而且端口上升到400G 差不多对应 72个800G光模块左右 数量差不多是上一代的2倍 而速率直接翻了四倍
这还不算cpx产品搭载同样多的CX9网卡+BF4 DPU 增加相同数量的网络端口 直接又让光模块的使用量直接翻倍
这些还是柜内的光模块增量 理论属于tor和scale up的范围 如果加上scale out 那更加不得了了
更何况这次展出的明年的主力产品NVL576据我所知已经应该出了一版的柜内scale up全光NPO方案的测试版了
还顺便的看了amd的mi455x 最大的变化也是网卡数量的增加 一个gpu配置了3个800G的网卡 这样的话 两层网络下还需要一倍的800G+1.5倍的1.6T光模块需求(说实话switch tray存在的情况下 三层网络是很普遍的 而不是两层 tor-leaf-spine三层)
谷歌那边的话 我下面会专门写一段
总结来说就是谷歌的TPU总体加单到了430W~490W片这个区间 上限取决于台积电的cowos给多少
今年的主力外售产品V7P V8P(V8ax)这两款 外售的量达到了200~220W片左右 架构依然是3D tours-64卡魔方环形架构 但是从本来用的800G铜缆 全面升级到了1.6T的lpo或者aoc 相当于scaleup层 全年从铜100%替换成了光100%
而明年谷歌的最大变化就是开始设计switch tray(估计明年9月份)而非现在的3D tours 这显然会增加网络的tor这一层的使用 相当于多了一层网络 目前是2层 这如果多加一层 而且用的全光1.6T方案甚至以上的话 光模块的数量又是暴增
大厂都在努力的全光+加大网卡端网络这边的配置来达到tco的最大化 好像只有A股的投资者傻傻视而不见最大的alpha变化
1.2台积电capex扩产周期&存储hbm扩产周期
大概率今年8月份左右 台积电可以进一步扩产这部分的产能 所以最近海外走的最强的就是先进制程的半导体设备+存储扩产设备(尤其存储敞口高的走的更好 毕竟长x在A股今年上铁板钉钉的事情)
其实我写这类内容为啥更新总是断断续续的 而是经常写台积电+nv流片多少详细的数据在公开平台 后来被相关的专家都拉黑了 毕竟一本正经把人家数据都写出来 得罪不少专家 以后大概率也不会写太详细了 总感觉写一堆东西有种吃力不讨好的感觉(专家费也不便宜啊)
存储真的纯AI相关的 最重要的还是hbm 要投资还是首选hbm
三星现在应该在hbm4这块的进展是非常好的 用的是4nmbase die的d1c工艺 速率超越了海力士做到了11.2~11.7GBPS以上 但是成本肯定比海力士的12nm搞了不少 预期这一代HBM4 三星的份额能直接超过美光(HBM3这块 是海力士大头 美光其余 三星小部分 目前越来越多了 三星)
HBM4差不多是海力士大头 三星中等 美光还在等验证的状态(而之前大家都知道在nv这边 三星过了验证很久 nv都不问他要货 弄得他前段时间降价给nv便宜卖了一批hbm3的货)
至于nand也好 essd啥的也好 由于A股确实没啥纯粹的标的 可能存储敞口高的半导体设备会比较好 尤其跟两长相关的 不是我的专长 不具体讨论了
如果怕除了hbm以外的存储由于涨价过高出现严重的负反馈 个人还是觉得hbm更靠谱一些
1.3 PCB的未来路线到底如何
可以肯定的事 未来pcb的线路如何走就是看大厂怎么走
最重要的就是看谷歌和nv怎么选
谷歌很明确 从今年2026年全是高多层的设计会逐步30%开始才用HDI的设计(还是m8.5)
到明年的V9P(V8P)产品开始基本全面采用HDI+M9的设计 所以谷歌链可以关注给谷歌供应HDI的供应商和将来的M9材料供应商 对应的肯定是2027年以后 逐步渗透率提升
NV这边今天有传闻说这个改哪个改的 反正最终版本没有定性(按照nv的以前的过往历史 这一块估计反复折腾至少还有一个Q的时间)
大家最好还是关注tray的板材(com tray swtich tray才是大头中的大头) 因为像是cx9这种网卡用啥版本pcb 真的用量也就这么一点 不是太重要的 如果站在2026年的角度去展望 毕竟炒股是炒作预期 所以如果您觉得2027年以后的新产品在tray的用料上 基本都是朝着M9走的话 那肯定趋势就是这样的
那这一代rubin72用m8 m8.5还是m9其实都是小事 这就跟网络速率总归要从800G升级到1.6T一样 无非早晚这一代下一代的问题
1.4 来聊聊谷歌的加单砍单啥的还有OCS
首先谷歌今年方案和数量的定型是很超预期的 跟gemini的爆火 A股炒股的TPU链 OCS链也好 确实都是现实中非常超预期的存在
最终的方案估计在1月15号左右定型 今年的款基本就是135w颗V7(V6P)240W颗V8ax(V7P)40W颗V8x(V7E)一共430W颗tpu 括号里面的是原本的内部代号 P的含义是训推一体 E的含义就是纯推理
而下一代产品也就是V9P(V8P) V9E(V8E)估计是2027年9月份出 对标nv的产品
而韩国那个不知道啥媒体说的是以前谷歌原本的计划
本来大概今年就出300W颗左右 但是无奈客户太热情了 外卖的订单竟然多到200~220多W颗 加上自用的200多W颗TPU差不多2026年TPU竟然有450W+这么多 太夸张了 都快敢上NV的量了
毕竟人家谷歌是做软件的公司 结果硬件层面的TPU数量都快敢上nv的2025年了 实实在在的大超预期
有点供不应求 谷歌没办法 只能加单加单 让博通去找台积电商量增加cowo的产能 但是我之前也说过 nv莫名其妙付了定金的把台积电的cowos全包了 当时台积电还疑惑 确定有那么多客户吗 要那么多的cowos的量
弄得谷歌只能找ASE之类的想办法 但是由于TPU设计和流片的一致性可靠性原因 迫于无奈 只能把自己用的40W颗V8x(V7E)丢给ASE做做 外卖给客户的只能找台积电要产能
谷歌目前的主力产品135w颗V7(V6P)240W颗V8ax(V7P)都是找博通合作做的 而V7E是联发科打苦工做的推理卡 目前确实不如和博通合作的款V6P和V7P
所以目前外卖的产品主力就是V7P和V8ax这两款跟博通合作的训推一体卡产品
预计价格在90W和105W左右一个64卡的小集群 3D-tours架构 16个服务器组 4个卡一组这样
目前的客户主要有两家大的分别是anthropic和meta
前者大概2年要了100W的forecast 目前2026年从之前的60W卡需求增加到了80W颗
meta本来是40W卡的需求 但是由于这次主动出让台积电的cowos给了谷歌 有了个人情(我看有个gz号写了这个消息)得到了一些折扣 反手加单直接到了80W颗
所以谷歌目前的客户总共有160W颗的订单+微软+orcale+苹果这一类 差不多50~60W颗左右
总体的外卖规模在220W颗TPU左右
谷歌最大的变化上文已经写了 就是V8ax开始
基本从800G的铜缆全面升级到1.6T的aoc或者lpo的光模块在64卡的3D tour-pod里面
相当于scale up全面升级到全光
然后就是PCB这块 开始试水HDI 目前的计划是30%的产品尝试用HDI来生产取代高多层方案 逐步如果效果非常好 差不多2027年基本全面用HDI取代高多层(也是为了散热其实)
而且很确定的是今年谷歌基本是M8.5为主 但是基本明年可能直接全用M9了 谷歌在材料端比大家想想的都更激进
目前谷歌的方案还是卖卡为主 而不是学NV卖全家桶
但是大概率2027年以后谷歌会有自己的想法去做全家桶网络
那就是搭配自己的OCS+以太网交换机去做scale up+ scale out+ scale across全面全家桶的迭代野心
分别是scaleup这边开始设计 swtich tray取代3D-tour架构 可能有th5的6~8个 swtich tray产生+搭配ocs去做柜于柜的链接取代本来的64卡pod架构
然后一个小集群也从现在的9000卡pod升级到2W卡的集群
scale out这一块增加一层tor 做三层网络扩展到2W卡
然后scale across这块 2W卡一个集群做成32W卡 64W卡甚至更多的集群 也用ocs来收敛 但是这里由于收敛比比较大 差不多10:1 对ZR这种DCI光模块的需求也就这样 而且这玩意有意思的是加上空心光纤效果会特别好 在scale across层面(收敛比比较高 需要的ZR光模块也不少 大概是10:1 的比例)
总体而言最大的变化就是光模块的全面升级+数量暴增 从本来的1:1.5左右估计直接要到1:4.5甚至1:5以上 然后就是对自家的OCS交换机的需求的暴增
差不多今年谷歌的OCS交换机的需求在1W5台 mems方案左右 差不多就是1912个tpu对应24台300x300的ocs交换机 而以后scale across这边会增加大概每2W卡需要65台ocs交换机左右
谷歌的代工大头大家都知道了 基本就是cls的mems代工 瑞士的HUBER+SHUNNER做压电陶瓷方案(就是今天发公告OCS订单的这家的供应商)
如果从长期和打包卖全家桶的方案来看 以后OCS交换机的需求会同样爆发性的增长
假设谷歌2027年能卖出600W卡且全部搞全家桶来说 对应的ocs交换机需求差不多就有scale up是75300台需求 scale out可以选择不用或者做一些冗余 scale across是19550台需求 差不600W张TPU对应OCS交换机是94800台以上的需求(这里还不包含scale out可以用ocs做故障对冲冗余的存在)
1.5 来聊聊cpo的那家
最近我看到zs也好 hx也好的卖方反复在调研萝卜
这些内容 我也分别看了可以说基本属实
而且最意外的是瑞士的HUBER+SHUNNER做压电陶瓷方案的订单
这可是我第一次看到OCS设备还有供应商这回事(这真是全A股都算独家了)
这家公司是谷歌OCS压电陶瓷方案最大的代工厂 公司由于是瑞士上市公司 在今年7月30号发过波兰工厂拿到polatis重大订单的公开公告
目前大概得知一条线的价格就是公告的数量 估计按照谷歌现在的计划和野心 我看卖方说2年有个一亿欧元的订单做ocs的产线
反正据我对谷歌ocs的调研来看 如果压电陶瓷方案能解决动态拓普的问题的话 将来的空间由于谷歌以后打算搞全家桶的玩法来看 将来的空间会非常非常大
回到cpo交换机
目前给nv车间和台积电的设备主要至少双面光电检测设备 大概价值量在150W欧元左右
工作原理就是测试光电oe的wafer 需要测试8~10小时一片 一片wafer可以切500颗的OE
所以理论上长期来看 从26年到29年 配合台积电的扩产周期的话 需要至1500~3000台以上 才能配合nv在28 29年几十万台CPO交换机的产能
否则有产品 但是没有产能 一切都是空谈 我是真心觉得cpo目前的问题
Spectrum-X的问题就是一个产能问题 你现在这个产能良率 一年2~3W套顶多了
但是光模块和NPO量产简单多了 可靠性强 替换容易 一年几千万个都不成问题 目前就是可靠性+量产规模的问题 ai-infra迫在眉睫的就是效率+速率 军备竞赛不是等你产能充足才行 而是现在就要大干猛干
所以CPO以后一定会占据一部分的市场份额甚至在未来的29~30年一定会越来越大
而这个测试设备对于硅光光模块的芯片检测也是一样 目前tower扩产周期就买了不少的单面测试设备 而且在逐步增加 基本就是用于硅光模块 比如800G 1.6T的测试 价格大概是双面的一半
而耦合设备来说 主要是海外的公司在买 主要就是FN finisar这一类 长期来看 基本每年都有几百套的需求
spacex那块我真的不了解 商业航天真的猛 我也佩服
至于基石投资者的问题 我真的不知道 参考卖方观点吧 反正目前看港股历史上 从来没有nv和tsm投资某家上市公司作为基石投资者 真的投了就有点巴菲特投谷歌的感觉了
写的好累啊 上篇目前写到这里吧
下篇 主要写H200搭配800G国产光模块超预期的可能 对于光芯片厂商的超预期的可能
锂电材料的价格谈判超预期的可能 (我听说最大家今天跟C就是今晚8点刚谈完)
因为大家对于国内的800G基本没有什么展望 而且光芯片这几家公司基本只能供海外的公司主要是CW激光器产品 包括70mw 100mw 200~300mw这类
但是如果某一天 尤其今年国内的800G光模块爆发了呢? 试问谁是最大的收益上
目前对于国内800G的测算只有800W卡 如果H200卖爆了会如何呢 毕竟这是训练大卡 基本都是两层全上800G的模式 而且大厂 比如A的超节点512自研ppu已经快出方案了 基本也是直接迭代到800G
所以最近12月份的国内招标我第一次看到了240W个800G这样的内容
我预估2026年的800G光模块会大超预期的 超过2000W个以上 超大家的预期
然后凡事是能做eml光芯片的企业 绝对不会降价而且跟国际价格差不多 况且供不应求
这可比CW激光器的生意还要好做