用户头像
roboroborobo
 · 上海  

海外AI-0925更新上

很久没更新了 主要是懒

每天自己跟踪就很开心 市场也很有效 尊重市场就行了

今天主要是随便聊聊 聊到哪里算哪里

海外1.1 谷歌

之前跟deepmind的聊过 谷歌最新模型内部代号叫做gemini2.8 产品早就蓄势待发了 外部有些人称作gemini3.0 说的是之后会发

没法的原因很简单:

谷歌觉得gpt5实际上不及他们的预期 否则就会直接发2.8(发出来就叫3.0)

也有很多朋友问为什么不看应用 很简单 现在飞轮效应太显著了 头部模型赢家通吃这是看ai的人普遍观点 XXX概念股你冲一个死一个 除非 除非什么 除非真的有一家很小的公司突然跑出来一个超级爆款应用(目前看几乎没有 之前有过偏向于炒作的2025年年初的manus 5月开放注册后也是昙花一现)

大厂飞轮效应很显著的点就是 大厂可以免费给你用它的模型 不订阅也没事 但是你要配合它给它 你的用户数据 甚至会给你选项 来判断答案是不是正确的 当然这种用户反馈数据 内部的测算诚实度只有10% 大部分用户都是胡说八道乱选薅羊毛

但是人家也有诚实度模型去判断你的诚实度可靠性 然后只有10%的用户可靠诚实的数据被大厂吸收了 并且作为真实可靠的用户数据去post-训练 目的也就达到了

其实现在合成数据已经不是主流方案了 合成数据的可靠程度都不如我说的这种

目前主要有两种 数据来源

第一种就是上面说的 大厂给你免费算力换取的 部分用户的可靠性数据(可能10%都不到)

第二种就是大厂花钱 它在每个领域只请最出名的专家 比如生物 医疗 法律 或者科学领域 它只请 这个领域排名前100的专家 我给超额的费用 让这些世界领域前100的专家配合它的专业领域的数据集去展开问答和绝对的正确专业回答 给我独一无二的数据(是不是有一种中医独门秘方的感觉 实际上专业领域就是这样的 重金求最好的数据)

以前谷歌不做这些事 现在非常愿意而且乐意去做这些事 这是我觉得超预期的点

有第三种的可能性 就是类似于脑际借口的那种类型 如果我想要得到你某种领域工种的特殊数据 接一个脑机借口在你身上 理论上我可以得到你上班 比如9点~5点这段时间 你任何的对于专业工作的思考和步骤的所有数据(当然这是理想化的 这种数据会非常真实真实的可靠)

而且nano banana的爆火 从9月4号到9月24日 短短20天 这个ai生图做了50亿图(这数据简直太可怕了 换成dy 做个视屏ai 和研究都是十几分钟 和半小时起步 用户体验不咋的)

所以在前些阵子 很多机构投资者都觉得要特别重视谷歌的投资价值 这也源于谷歌委托博通的不断地cowos的加单 以及gemini的数据超预期超预期的增长(V7P加单转单特别多 V7E-V7E相当于2die的V7P 理论上7E是训练芯片 其实是训练推理通用 这个cowos一直在加单 加单 加到 博通现在排队拿TSM的单 被nv抢完了)

所有CSP非要说 都是有比较强的跟nv解耦的倾向(包括我们国内的)

原因也很简单 nv的报表是明牌 你肯定不想被任何一家70%毛利的公司绑定 然后看着它这出色的业绩利润承认自己技不如人( 因为这就是实实在在的技术差距 否则川普也不会说 即使美国的第二名amd 离nv还差10年 虽然没有10年那么远)

当然主要原因还是不想受制于人 要两条腿走路 自研+外购 否则容易犯 互联网时代被硬件绑定的恐惧

固执一点来说 aws就做到了asic解耦 死活不找博通去定制asic aws的光头大领导和博通是世仇 所以老mrvl的领导过世 灵堂都必须办在老mrvl员工居多的credo的大楼

从硬件层面来说 谷歌的细分增长最大的还是光模块和ocs的1-10的互联效率的增量

目前无法得知明年谷歌ocs的增量 但是无非就是mems方案和新的波导方案的权衡(后者只是10台样机的送样而已 但是有超预期的可能)

但是不得不说 确实ocs是个电信市场就存在的方案 可靠性和实际运作效率比cpo交换机靠谱一点(十几年历史有的)

海外1.2 CPO交换机&CPC和npc&有别的厂商能做光模块吗?

1.2.1 CPO交换机的问题还是在于良率 TSM就是两道cowos的良率差不多40~60% 问nv收费 nv就付一次钱(以nv的一次付费来说 当然nv可以选择加钱 台积电最乐观两道60% 收费就是1x36% 这有一个性价比的问题)

加上设备就也就一条原型机 做不了太多

所以目前良率和进展低于乐观的预期

这点希望大家理性一点 首先如果 一条原型机就可以做2000台cpo 大家觉得继续大规模购置整条cpo产线意义大吗?所以今年通过edge grerting能做的cpo数量就在1000~2000台左右 目前2026年的tms排产就是5000~10000台左右的范围 低于之前2W台的预期(个人认为还是设备产线和cowos价格没谈拢的原因 所以理性的讨论 明年19台产线到货之前 一边爬坡一边提高良率是最好的答案)

同时这也给设备厂商提供了了2026~2030更好的成长性的预期 这是更长远的

就像存储的周期一样 你不买半导体设备 怎么扩产

不要去想一台原型机产线干完2000~5000台 不可能的 理性一点

还有一点 目前日月光做的博通TH5-cpo交换机 客户实测效果确实不理想(博通做得不好也可以选择做的好的设备是不是)

但是nv的cpo交换机客户测试还可以

1.2.2 目前看 无论Ali的方案 还是GB300的特别版使用了 NPC或者CPC+LPO

ALi的方案大家都看到了 就是正交结构的NPC方案 没有太多cable(缺点很明显 速率继续翻倍到 类似于nv的B系列如何升级呢?之后呢?怎么解决?)

NV展出的CPC做的是switch tray 9个的内部链接 但是背板用的都是LPO方案

这个跟H公司一样 H公司有两个方案 大头是全光方案 所谓的全光就是32~36卡都使用LPO互联的方案 因为做cable tray 太折腾了

所以CPC更利好的其实是背板做LPO的供应商

1.2.3 目前看来光模块头部效应其实是加剧的

尤其是光模块的头部两家厂商

为啥 因为产业追踪的话可以得到他们两家在上游的硅光芯片流片数量(tower啥的)

分别提高了分别从40提高到了750和1700提高到了4500

一片晶圆切1000颗左右 良率90% 差不多是67W颗和405W颗以上

理论上 将来的某个节点只要硅光产业链跑通 某些企业净利润50%+会有一天可以看到

而网传的鸿海系和l系 (鸿海旗下甚至有四家企业做这个 山东云华 江苏太比康 ht 自己 )

光模块的主要区别就在于品类不同 非常多SR DR FR一大堆

首先头部已经是硅光+多品类+进军LPONPO的模式了 已经有非常显著的羊群效应了

而鸿海系和l系品类目前品类还是不够丰富和兼容性还是存在问题

光模块显然还是头部赢家通吃的局面

但是明年如果苹果系ai服务器有需求 鸿海系个人觉得问题也不大 也是增量 鸿海的更大增量还是在于服务器整体的良率和规模效应的领先

而整体光模块的盘子实在太大 增速实在太高了 这个盘子吃不完的剩饭 有些二三线厂商一定可以吃一点 问题不大

海外1.3 nv&TMS的cowos数量&rubin的案子定案

1.31 首先要理解清楚概念 前道和后道cowos

cowos的量和2nm和3nm的量不是一回事情(当然你可以跟我留言我 你搞不清楚nmsl还是mnnmsl分别是什么意思 我会开心的送给你小傻瓜拉黑套餐 )

前者是后道封装 后者是前道产能

明年tsm的2nm前道只有500k的产能 受限的原因主要是有一个厂被洪水淹了(2mn前道 主要是消费电子联发科啥的+GPU和CPU只有amd+苹果的2nmsoic-info的ai服务器)

所以苹果为了明年的m6笔记本和折叠屏产品的超预期可能 直接锁了300k的量 还是加钱搞的 本质上还是挺超预期的 跟我之前说的ip17产能相比去年的8400W台多了20% 直接预定了9900W台一样的道理(实际是后续又加了500W台 目前是104m台 但是这由于tape out需要至少4~6月的时间 现在没法继续加了 只有等到12月份再说)

其实我也不觉得ip17有啥太超预期的点….苹果还是太保守了 一方面想用gemini一方面又怕gemini吃他的用户数据+生态(毕竟谷歌是竞对)

弄得现在只敢跟其他人合作 慢慢的苟 明年3月份会先退出siri ultra差不多要结合agent模型(国内A)

翻译和其他模型 苹果都会自己做 估计快的话年底上线

COWOS这边个人也看了大摩的报告 写了NV差不多2026E 拿了580K的cowos产能

实际上nv最近加单到了690K左右(之前是560~580K)但是外界传闻是800K 原因如下:

因为这110K取决于rubin cpx的产能

目前有两种看法 一种认为rubin cpex也需要cowos产能

另外一种认为 韩国amkor可以搞定不算cowos(类似于H20和6000D 用的GDDR6和7)

所以理论上是加到了800K 但是110k存疑的点在于用不用cowos

上周黄(915那周)去了tsm 特地加了单 然后给了定金 而且接受了10%的cowos的费用(但是实际没那么高 因为有大客户返现 所以最终应该是7~8% 如同前年 最早也说是+10% 结果业绩报一看是7%左右)

所以最近最大的变化是rubin良率在不断提升(从60%~直接上升到了75%+++

加单后明年的流片是B300 280W颗+rubin200 400W颗 其实挺超预期的

分别是 2026H1上半年 B300 230W颗….rubin200 50W颗

2026H2下半年 B300 50W颗…. rubin200 350W颗

目前CPX的预定产能只有12W颗左右 差不多2W台RB200不到

cpx方案 目前没有几百万颗那么夸张 CPX具体还得看客户的接受程度了

本来个人也在思考为什么有那么多的量 而且rubin加了那么多到底有那么多客户吗

现在很显然 orcale和openai是大客户和增量 但是由于还在商议阶段 没人搞定清楚是租赁还是购买啥的 最好等2~4周相关公司签好合同再公告为准是最好的

其实nv的客户加单都是挺莫名其妙的

上周Xai加单 就是莫名其妙开了个招标 还找了HPE DELL SMIC 鸿海广达 说要买7000台GB200+300 赶快给报价 最快10月中旬就要开始交货(因为HPE DEEL SMIC这种要额外加价做L11的 不如鸿海广达便宜)

所以报价速度就挺莫名其妙的 然后直接要求下个月就能发货?

然后Nebius上周也莫名其妙来了 但是没xai这样豪横 只要800~1000台 同样开了招标

招标估计近期都会有结果(估计就是过完国庆)

从投资的角度说 做NV链最最重要的还是看增量 尤其是2026年的增量

目前VR200的144定案和cpx 大概率 最大的增幅还是PCB这边

(详情见好朋友oliver-AYZ的报告网页链接

10月中旬定案了以后 大概有增加200~300%以上的提升 如果正交有的话(无非是锦上添花) 那更好了 超过300%+了(成了价值量3~4倍起步)

光模块也是至少增加200~300%的提升 看CPX有多少了量了(2W打底)(请注意多了 300%是4倍的意思 但是如果cx9+cpx都成了 搞不好更夸张 7 8倍也是有可能 但是不是整年 是整个一代)

铜缆这边如果背板连接器和AEC ACC继续使用铜 差不多是100%以上的增量(成了价值量翻倍起步)目前好处是TE在224综合方案都失败了(国内有L 其他只能找aph要lisence专利)

相当于海外aph一家独大 以后asic厂商要找224背板方案+专利 独此一家 下一代scale up铜缆大头(当然现在scale up的方案太多了 ocs也有 alab那种交换机也是 更有cpc+LPO NPO的方案)

理性说实话 用增量的角度考虑确实是 PCB 光模块 铜都有增量和投资的价值

1.32 rubin定案和com 板子决定是m8还是m9具体时间段

目前预计9月~10月中会定案rubin的芯片 之后大概率不会再改了(可以参考AYZ的文章 毕竟他跟踪CCL都快10年了)

10月中旬左右会定案rubin的com tray用什么板子 M8还是M8.5还是M9

弯弯也有节日(10月10号)之后 可能就会定案通知供应商物料

所以凡事都有先后顺序

首先NV会在9月底~10月初先定rubin芯片案子

然后10月中旬左右定rubin的com tray的bianca板子的案子

然后在用这些comtray swtray ubb去测试是不是适配新的连接器案子和铜缆背板 正交背板

没有人能提前知道答案 这况且还是第一版(正交 铜缆都在送样 一样的测试进度)

之后的版本会边修边改 会有第二 第三 最终版

大概会在2026年上半年决定 最终rubin的全体rack配套方案

所以不用去YY什么rubin 288 rubin576用不用什么

这些案子都处于初步阶段

rubin 288需要的是rubin 4die版本的菱形流片架构

目前流片真的还早

所以尊重现实 跟踪产业即可了

不要吵架 天天pcb的 铜缆的 光模块的

我真的觉得 市场份额那么大 openai和nv的合作动不动就是10GW

大家不觉得兴奋吗 为啥还会去争得你死我活的

广阔无垠的市场空间 动辄都不是10倍起步了

你要知道nv在2023年就要了70k的cowos 现在2026年起步都是690~800K 3年就10倍增长了 不是什么10年十倍 是三年十倍!!!(这还不包括cn市场和非cowos的产品)

写不动了过几天继续写下篇