用户头像
roboroborobo
 · 上海  

最近一些国内外AI的一些更新0714

产业跟踪为主的话 还是从0515以来 持续看好海外链+国内链(但后者大家觉得缺少beta)

最近无非就是几件事情

1 老黄来中国 大概率H20库存解禁+卖B40 kimi-k2作为 顺便说下GPT5很惊艳 但预计在做对齐+安全

2 GB300月底开始试量产 1.6T光膜块 nv持续加单

3 GB200的cx8版本持续爬坡 良率提升 以及GB200的加单情况(主要是oracle非常猛+coreweave)

4 台积电cowos 这边再加单 主要是谷歌amd的产品 amd的cpu成为主流产品 占据ai服务器超过50% 超过intel

简单点 一件一件来说

1 老黄来中国

老黄每次来基本都是卖卡 他自己也是顶级销售 上次来就直接签了40W以上的H20 这次大概率也差不多 主要是卖b20这款产品 目前大厂基本都测试完了 测试的结果是做小集群推理性价比是超过H20的 主要是价格还比较便宜 但是因为没有nvlink+互联带宽只有1.7TB 做不了什么大模型训练 基本上用不到训练这边

有个可能潜在的好消息是(不一定100%确认) 这次大概率是跟川普谈拢了 H20库存的lisence 可以把当时那几十亿美金的计提H20库存 重新卖掉

那对于大厂来说基本上就是更愿意优先买H20+新款的B20

目前b20在台积电今年的流片数量差不多是135W颗左右(整个GB202家族是350W颗 代号太多了 比如GB202-300 GB202-870就是B20)

这样大厂买得到合规的卡以后 aidc的建设进度和国产的beta可以期待一下了

目前Z的进度最好 8月份有出爆款的可能具体内容不方便说 因为内幕机制还是赛马 产品主要是agent形式 有委托电话语音和订票购物功能这一类 Z的aidc进度和购卡一直都比较畅通无阻 所以没有太大的capex压力和问题 风格也是最激进的 最新的下半年+明年大招标情况要差不多8~9月份决定(以前都是每年9月份)

A这边算力租赁继续推进 我目前没看到因为外卖的事情 aidc有任何放缓的可能 但是基本上都会从b200转移到b300 b300的tapeout节奏差不多在8~9月份 所以部署会相对慢一点 但是性价比极高 主要是用来大集群推理+训练 差不多价格比h200多50% 性能翻了2~3倍以上 自研这边非常顺利 interposer找的湾公司 量非常大

T是老样子 纠结追加capex 但是拿aidc的资源从来不含糊 主要是天津滨海(6月)贵阳贵安 韶关(最早 弄了大半年了)这几个地方 都要做几十万卡甚至百万卡集群 但是投入追加capex还是因为合规的原因之前缓解了 还有就是预计产品的ai-agent要到9~10月份才能出比较好的demo(其实还有日本数据中心….)

其他小模型企业 因为世界人工智能大会WAIC 2025的原因 都会在2025年7月26日至28日这之前 把最新模型应发尽发 比较参加WAIC是非常烧钱的 这个会要自己公司投钱才能参加 所以可以期待整个日期前 会有非常多的中国ai模型企业逐步发自己的最新模型(比如kimi-k2作为claude和anthropic的pai兼容平替目前在ai-coding和agent的效果很好

顺便说下GPT5很惊艳 但预计在做对齐+安全 大公司有渠道已经看到了demo 觉得非常超乎想象的惊艳 什么时候发真的不知道

2 GB300月底开始试量产 1.6T光膜块 nv持续加单

GB300在鸿海这边7月底开始正式边测试边开始量产

目前看改动不是很大 因为pcb我不是很懂 我这边能看到的物料表

只有明年rubin系列会用道em896K2这款材料 也就是pcb的m9板材 市场主要的炒作这块

目前rubin明年Q2开始试量产 com tray和ubb用的都是em892k2(M8)而swtich tray目前是用em896K2(M9)这也是首次nv的产品上线M9的材料

而由于GB300的大规模量产和客户追加订单(基本四大csp和oracle都给了forecast)这款搭载CX8网卡的产品将来会成为主流产品

台积电这边的流片量可以侧面印证

Q3的B300流片上调到了150W颗 Q4还是120W颗左右 26年Q1是110W颗左右

其中给了比较好的指引是鸿海和纬创的板卡模组产能预定情况(也就是说板卡就是做GB系列的)

板卡产能目前Q3 鸿海是27W 纬创16W(也就是86W颗GB300=1W2000台GB300Rack量)

Q4 鸿海是25W 纬创20W(也就是90W颗GB300=1W2500台GB300Rack量)

明年Q1 鸿海是22W 纬创20W (也就是84W颗GB300=1W1600台GB300Rack量)

目前看订单 GB300至少有个将近4W的rack量

结合明年rubin按照工程进度率去推算产能 目前是350~400W张左右 总体的量还是比较超预期的

所以非常看好1.6T光模块的放量 相关的企业最近业接到了不少的加单 真的是1.6T的元年到来了

3 GB200的cx8版本持续爬坡 良率提升 以及GB200的加单情况(主要是oracle非常猛+coreweave)

目前GB200出了个新版本 叫做GB200配合cx8网卡的版本 目前爬坡良率在40~60%左右 客户满意度业不错 性价比比较高

而GB200的普遍良率已经超过85%了 鸿海这边 最高的是广达+戴尔这边的良率已经超过90%+

因为广达做成L10的 com tray以后交给戴尔做L11的全组装 戴尔在这块超预期的做的很好(戴尔的客户主要是coveweave+tesla)

GB200各家都加了不少的订单 最猛的还是oracle 本来鸿海只有微软的5K+订单 现在oracle定的量比微软还多 变成了最大客户 其实有具体的信息 但是我觉得不展开了把 因为之前写的GB300的forecast很显然就是这些大客户的加单

4 台积电cowos 这边再加单 主要是谷歌amd的产品 amd的cpu成为主流产品 占据ai服务器超过50% 超过intel

其实这些都是博通的加单 但是博通的加单太多了 包括交换机芯片的th5 th6 光模块的dsp 博通基本处于每几周都加单的状态 实在是高景气度

谷歌的tpu又理论上加了每年差不多10W颗以上

今年主要是少量V6E+大量V6P 大概100W颗左右

明年主要是这代的V6E+大量V6P大概120W颗 V7P+V7E的大概75颗

meta这边也会出个三种今天晶片集合的新产品叫做mtia 3.5 分别包括io芯片 网通芯片 运算asic 整个产品可能会取代mtia4提早推出

amd这边cpu非常的猛 已经占据了数据中心的主流 超过50% 完全超过intel 目前用的是2nm工艺 名字代号叫威尼斯 会和amd的mi430 450一起使用2纳米工艺在今年Q3量产 明年Q1大规模流片

差不多这样吧 最后希望tmt资金都格局一点