用户头像
roboroborobo
 · 上海  

最近一些国内外AI的一些更新0625

距离上次更新也有一段时间了

自从0513更新海外算力以来 都走出了比较好的趋势和方向

而且行业的催化还是不断 从我那会写的0513光模块800G的“从今年年初写的今年1800~2000W只的量到明年800G光模块的量大概率要超过2700~3200W只这个等级”

到0609更新上修到“从我之前跟踪的2700~3200W个800G差不多可以继续上修到3200W~3500W+了

而实际上最近因为NV的加单 大概率明年的预期已经超过4000W个800G光模块了(虽然硅光800G的渗透率持续提升 但是不得不说 明年搞不好真的又会EML光芯片短缺 光芯片有扩产能力的企业 真的可以稍微高看一眼)

之前主要是关注asic链 增长和景气度超预期 加单也超预期 主要是scale out的超预期配置和增长 比如meta的asic是大die 3.2TB的互联 光scale up就需要3.2TB乘以2除以800GB=1:8的多模光模块的配比 这是很超预期的(不过不是每家csp都倾向于多模光模块的 目前来看META和谷歌是倾向于全光方案的 -这个有infra部门领导长期耕耘的倾向+实际上用某种特定方案 比如说全光 做软件适配的时候是很有优势的 至少多模这块是LPO的倾向 而AWS是绑定credo之类的aec nv的GB300这边 CSP都是自己的方案 但是目前看即使是meta的方案 在GB300上短距离还是用AEC800G为主)

而实际上 仅仅过了2周多的时间实际上 nv这边继续开始上修了

第一点 首先B300的流片和搭配的CX8网卡1.6T的进度是超预期的

之前我有在0625聊过 当时跟踪台积电这边B200和B300的流片

“这里我给一些自己跟踪的数据:(每几周跟踪一次 不一定全对)

nvQ2差不多 B200 80W片 B300 40W片左右

nvQ3差不多 B300 80W片 B200只有30W片

nvQ4差不多 B300了 100~120W片 B200少量了”

而现在台积电Q3的排产基本上B200全部转单了

目前最新的Q3排产是 B200减少到只有7000片 B300超预期有150W片

Q4还是老样子差不多 B300了 120W片+(大概率还会加) 而基本没有B200的前道了

rubin系列会在Q3开始出来测试 由于rubin用的是cowos-L +n3P的架构 基本等同于B300的架构 目前台积电这边觉得不会出现去年那种良率问题 大概率会比较顺利

目前排产是100~150片 大概2500~3000颗rubin在Q3投片

但是值得注意的是rubin ultra由是双soc的菱形架构(菱形结构 一段rubin ultra需要两段前道匹配) 在2026年的Q2开始流片 这款的良率和难度可能需要跟踪

目前明年的rubin的forecast排产是400W片左右

所以根据B300的超预期流片 这就意味着NV这边的CX8全面要上量了

B300和cx8都对应着pcle6的架构和全新的互联速率的翻倍 200G单通道(cx7和B200就是pcie5 cx8可以向下兼容)

所以对应的NV的互联架构 那就是B300要配合CX8的网卡最低都是800G的铜缆和光模块做短距的互联 而如果采用IB交换机 则长距离的光模块必须直接升级到1.6T光模块(200G单通道)

而nv也有自己的以太网交换机 如果是这块 那就是 那就是B300要配合CX8的网卡最低都是800G的铜缆和光模块做短距的互联 而如果采用nv以太网交换机也是800G兼容的状态 如果明年1.6T的以太网交换机全面放量(网卡侧好像没按么快BF4的网卡没那么快 但是BF3x2也可以解决)

基本上今年Q4和明年的nv系列的所有交换机的scale out互联将全面升级到200G单通道和1.6T光模块的时代

如果按照tape in 和tape out的节奏(一般差不多2~3个月 前道6月流 8~9月做成产品 但是客户差不多6月肯定可以付定金购买了)

差不多9月份开始B300的产品就是主流了(侧面的一个印证就是算力租赁这边在纠结于B200还是B300的租赁 价格不会差太多 但是如果做B300的租赁 组网的价格会上升不少 原因就是必须采购新的网卡和一些高速互联的交换机设备 这意味着这块国产业被迫提早升级成了更快的速率 但是大厂可能都有自己的方案 还是以太网为主 不一定都是IB 是IB的话基本必是1.6T)

所以我非常看好1.6T的光模块这边的进展超预期 据我所知某家几家头部光模块企业接到的订单非常乐观 包括NV的800G持续加单 都印证了台积电这边的流片进度 而且全部来自于NV的订单增加和需求 而且如果今年1.6T的量级比如说在100~200W颗区间 明年大概率会大超预期的提高到600~1000W颗以上(增长几倍以上 而不是百分之几十) 这个原因也有很多 比如明年Q3大部分asic的厂商基本都要升级到新的asic架构 还有就是200G通道的th6在明年Q3会大规模量产 而且asic比如谷歌 meta 比如aws都是这个升级进度(mita的新产品不管是阿瑞斯还是女武神啥的 谷歌的V7P V6E tr的新款)

而这边博通的dsp流片也是超预期的 今年的nova2也有2300W颗左右 而现在和明年的nova3(1.6T)和nova4(明年Q3)都开始排产了 而且还有个叫做spica的产品(估计是LRO类型的)

第二点 cpo的技术路径和排产

其实排产没啥变化 因为cpo的良率不是很理想大家都知道

博通的路径不太一样 良率和排产问题不大 但是问题在于是51.2T的产品 实际上2台才等于一台nv的产品速率 排产没啥大的变化 明年4W都是51.2T的 其中有少部分TH6的产品 倒是后要看th6的良率(毕竟大家都知道th5当时就难产了一阵子 导致了800G的时代延后了)

所以从去年9月台积电做了10台的cpo交换机以后 今年2月份业就做了10台 5月份做的不少是50台 然后目前的规划 还是老样子 Q3做250台左右(1000片) Q4的规模是400~1000台左右 具体就是看良率 因为现在的良率大家都知道 因为cow比较高 50%+ os+耦合都不到30% 综合良率就徘徊在40%左右 台积电的问题就是它这个良率不怎么赚钱 为啥?因为它问nv要钱 nv肯定只给一次的cowos完整的费用 但是实际上他要自己做10次才成功4次 多出来的费用相当于自己承担了

明年的nv排产还是老样子 就是1W2500台~2W这个区间 具体看台积电的量产进度

所以良率是cpo交换机这边的进度关键(毕竟都是做生意 包括之前nv跟台积电说要给10%cowos费用 结果最后只提高了6~7%)

但是最近台积电做了一次耦合的方式的转变 从之前的GC(Grating coulper)耦合变成了EC耦合(Edge coulper)oe和fau的耦合是良率影响最大的部分 后者是博通的主流方式 前者本来是用垂直的方式有角度的比如90%°角度从上往下去耦合 造成良率丢失 而现在如果EC耦合就是直接对齐耦合 提高了不少良率 目前的目标从现在的45%左右 目标要提升到70% 这点倒是其实很利好耦合的厂商 但是台积电的采购节奏在Q3 差不多是8~10月份 所以大家如果喜欢某家企业 关注这个时间段的订单

目前的顺序是OE第一道cowos 转变成了soic

amkor第一次 cow(cowos)oe送过去第一次

第二次做asic(nv swtich芯片)

第三次做耦合 最后组装到pcb上面 交给cpo交换组装厂 白牌或者官方的鸿海这类

所以我个人还是挺乐观的 充满信心的 对于cpo交换机这一块 之后具体就看量产进度了

也说了太多遍了 这个跟铜缆和光模块都没啥太大的关系 也不存在非常严重的取代关系 某一种产品占据小的份额是很正常的 都是增量

所以我之前说了 我更看好跳线 mpo之类的产品 因为无论什么产品 这个都是增量

光模块里面也是 打个比方说 谷歌喜欢长距离的FR 跳线都是几公里起步 肯定超级收益(以前我写过一个比喻 就是谷歌的数据中心都超级大 都是几个足球场那种 所以都是用超长的FR光模块)

而别的厂商比如xai aws都是dr为主 都是500米到2000米 这些就远远不如谷歌这些的单模光模块的跳线长度收益

回头我们聊聊国内AI产业

主要是产业的变化并不是太多 大部分时间还是持续着跟踪

国产AI这边 其实很久以前就说过 一直都是欣欣向荣的状态 只是股价反映不出现实层面的状态 这不是我可以决定的 既然一早就决定是跟踪产业趋势和基本面 好好跟踪就是了

最近传闻我看很多 比如说说某些互联的企业中报增长大超预期 如果这在中报季得到印证 其实就是我当时说的JDM的模式或者国内前两年扶持的模式走通了 目前我无法判断真伪 投资需谨慎

我首先说说GB202这边的变化吧

因为我之前说过GB202(衍生产品就是5090 5090D 5090DD-最新阉割版 B30也好B40也好 随便名字叫啥)综合这些加起来都可以叫做GB202

毕竟这款产品在台积电的前道就叫做GB202 之前最早我说过是5090系列150W片 后来因为RTX6000D的推出 加单到了300W片

台积电这边收到NV最新的指引是450W片。。指引又增加了50%。。

台积电排产仅有360W片

目前是Q1 50W片 Q2 75W片 Q3 125W片 Q4 120W 虽然不需要先进制程 但是最近台积电生意实在太好了 给nv这边没有明确加单排产 还在商量 主要是其他客户抢的份额太满了

目前ZAT三家大厂都收到了B40的测试片在测试 目前我跟几家都聊过 觉得由于没有nvlink 综合性能确实在推理这边不如H20 但是由于价格 性价比还是有的 下单意愿估计在Q3和Q4会体现 实际到货应该在Q4 也是Q3tape in Q4给tape out 如果要算入资本开支的capex 那么Q3就会体现

目前T应该是比较感兴趣的 每个Q可能都会下30~40W片 A兴趣一般 主要是以前对H20兴趣就不大 靠自研+转租拿性价比 Z这边应该会下 具体不知道

我可以具体聊聊最近大厂的一些态度

Z的态度是全力升级基座模型+创新+全力推ai-coding(产品叫做trae)端侧的眼镜估计要延后 内部由于赛马机制 模型团队还是缺算力 都处于排队的状态 下半年会会推出更先进的多模态模型 然后会让更多算力放在火山这边做商业化to B 重点是to B

今年的aidc这边肯定是继续加速 尤其是Q3 Q4 网上传闻其实是Z的自建招标结束 而不是开始 其实规模不算很大 就是200mw左右的项目 他们的柴发有9家供应商 其实最受益还是美股的玉柴….(可以看玉柴中报 美股只发中报和年报 玉柴没有季报)

A这边差不多是算力比较充裕和富足和野心比较大 Q3应该发QW3的多模态 Q4发QW3.5按部就班来 比较重大的变化是Q3的自研芯片的回片 量比较大 可能会追加aidc的建设 主要原因是自研用的N+1制程 能耗比较高 差不多是H200的一倍 比如万卡的H200耗能在13mw左右 自研万卡的耗能在25mw左右 如果全年有个12W~15W卡的量 差不多要增加500mw的aidc数据中心的量 所以如果回片顺利可以看A的Q3的招标增加与否

转租这边基本就是在看B200和B300是否转换 基本现在没有H200的转租了 B300就会等更久一些时间到货 但是组网的成本因为cx8的关系会增加不少 价格还是比较好的

我建议大家可以观察一下算力租赁企业的中报 但是基本上不是所有企业都有利润的预期 为啥呢 比如说4月签的 6月交付 7月才有租金 大部分公司都这样 观察Q3可能更明显 b200和b300的更加是了 差不多6月签 9月交付 10月才有租金 都是这样的节奏

但是中报由于要审计之类的 会明确写出企业付出了资本开支(上市公司的capex)钱花去那里了去干嘛了 会有一大笔钱莫名其妙花掉了 这个可能是个好的标志

T这边还是老样子 不怎么缺算力 但是就怕自己的商城小程序agent突然成了 可能的节点还是之前说的Q3 10月份 一旦成了 小程序这种dau 5~6亿的产品一下子爆发了 倒时候找算力就来不及了 所以都要提前建设 就在博弈是不是要在Q3 Q4继续加码(最近就在跟某家柴发博弈)

柴发综合写一下吧 玉柴由于是Z御用+主机厂有议价权 肯定是非常收益的 毕竟都自己下场搞组装成品了 但是美股玉柴只有中报8月份 年报有披露 倒时候可以观察 但是可以肯定的是他们的现货价格从年初的200W现在基本上300W这个价格 你说多出来这100W不是纯利润?

所以我一直以来更看好主机厂 但是我估计利润体现要在Q4了 为啥我这么说

因为我分析过 柴发分为期货和现货两种产品

所谓的期货 就是打个比方我在2024年年底预测到了2025年的柴发很紧缺 我提前付了定金锁了2025年的产能 除非主机厂违约 否则你必须根据2024年的签约价格给我供货(一般都是250+ 到不了300W 海外的高点)

而所谓的现货 就是我打个比方 我说我Q4需要100~150台 但是我不跟你签约 我就现在告诉你我要 但是我给的价格就是300~320 甚至更高 这就是现货 现货根据供需 没人知道Q3 Q4到底工供需如果 有可能继续涨 也有可能不缺了(目前看可能不大)

但是如果我觉得明年柴发紧缺 我直接签约2026年的 就是期货 直接可以签的便宜点 比如280~300W估计都行 无非就是大厂有没有这个魄力或者想继续博弈价格 毕竟国内的公司没有北美四大CSP那么爽快

但是可以看到的是自有品牌的主机厂目前议价权很强 所以更多关注国产柴发厂商

目前就是这样 我也观察中报看看具体兑现程度和景气度如何 跟大家一样

你说真要牛市回归 我们AI总不能缺席吧 无论国内外的

但是一样充满信心 永远喜欢AI~~~~~