最近一些国内外AI的一些更新0714产业跟踪为主的话还是从0515以来持续看好海外链+国内链（但后者大家觉得缺少be...

roboroborobo

2025-07-14 18:48 · 上海

最近一些国内外AI的一些更新0714

产业跟踪为主的话还是从0515以来持续看好海外链+国内链（但后者大家觉得缺少beta）

最近无非就是几件事情

1 老黄来中国大概率H20库存解禁+卖B40 kimi-k2作为顺便说下GPT5很惊艳但预计在做对齐+安全

2 GB300月底开始试量产 1.6T光膜块 nv持续加单

3 GB200的cx8版本持续爬坡良率提升以及GB200的加单情况（主要是oracle非常猛+coreweave）

4 台积电cowos 这边再加单主要是谷歌和amd的产品 amd的cpu成为主流产品占据ai服务器超过50% 超过intel

简单点一件一件来说

1 老黄来中国

老黄每次来基本都是卖卡 他自己也是顶级销售上次来就直接签了40W以上的H20 这次大概率也差不多主要是卖b20这款产品目前大厂基本都测试完了测试的结果是做小集群推理性价比是超过H20的主要是价格还比较便宜但是因为没有nvlink+互联带宽只有1.7TB 做不了什么大模型训练基本上用不到训练这边

有个可能潜在的好消息是（不一定100%确认） 这次大概率是跟川普谈拢了 H20库存的lisence 可以把当时那几十亿美金的计提H20库存重新卖掉

那对于大厂来说基本上就是更愿意优先买H20+新款的B20

目前b20在台积电今年的流片数量差不多是135W颗左右（整个GB202家族是350W颗代号太多了比如GB202-300 GB202-870就是B20）

这样大厂买得到合规的卡以后 aidc的建设进度和国产的beta可以期待一下了

目前Z的进度最好 8月份有出爆款的可能具体内容不方便说因为内幕机制还是赛马产品主要是agent形式有委托电话语音和订票购物功能这一类 Z的aidc进度和购卡一直都比较畅通无阻所以没有太大的capex压力和问题 风格也是最激进的 最新的下半年+明年大招标情况要差不多8~9月份决定（以前都是每年9月份）

A这边算力租赁继续推进我目前没看到因为外卖的事情 aidc有任何放缓的可能但是基本上都会从b200转移到b300 b300的tapeout节奏差不多在8~9月份所以部署会相对慢一点但是性价比极高主要是用来大集群推理+训练差不多价格比h200多50% 性能翻了2~3倍以上自研这边非常顺利 interposer找的湾公司量非常大

T是老样子纠结追加capex 但是拿aidc的资源从来不含糊主要是天津滨海（6月）贵阳贵安韶关（最早弄了大半年了）这几个地方 都要做几十万卡甚至百万卡集群但是投入追加capex还是因为合规的原因之前缓解了还有就是预计产品的ai-agent要到9~10月份才能出比较好的demo（其实还有日本数据中心….）

其他小模型企业因为世界人工智能大会WAIC 2025的原因都会在2025年7月26日至28日这之前把最新模型应发尽发比较参加WAIC是非常烧钱的这个会要自己公司投钱才能参加所以可以期待整个日期前会有非常多的中国ai模型企业逐步发自己的最新模型（比如kimi-k2作为claude和anthropic的pai兼容平替目前在ai-coding和agent的效果很好）

顺便说下GPT5很惊艳但预计在做对齐+安全大公司有渠道已经看到了demo 觉得非常超乎想象的惊艳什么时候发真的不知道

2 GB300月底开始试量产 1.6T光膜块 nv持续加单

GB300在鸿海这边7月底开始正式边测试边开始量产

目前看改动不是很大因为pcb我不是很懂我这边能看到的物料表

只有明年rubin系列会用道em896K2这款材料也就是pcb的m9板材市场主要的炒作这块

目前rubin明年Q2开始试量产 com tray和ubb用的都是em892k2（M8）而swtich tray目前是用em896K2（M9）这也是首次nv的产品上线M9的材料

而由于GB300的大规模量产和客户追加订单（基本四大csp和oracle都给了forecast）这款搭载CX8网卡的产品将来会成为主流产品

台积电这边的流片量可以侧面印证

Q3的B300流片上调到了150W颗 Q4还是120W颗左右 26年Q1是110W颗左右

其中给了比较好的指引是鸿海和纬创的板卡模组产能预定情况（也就是说板卡就是做GB系列的）

板卡产能目前Q3 鸿海是27W 纬创16W（也就是86W颗GB300=1W2000台GB300Rack量）

Q4 鸿海是25W 纬创20W（也就是90W颗GB300=1W2500台GB300Rack量）

明年Q1 鸿海是22W 纬创20W （也就是84W颗GB300=1W1600台GB300Rack量）

目前看订单 GB300至少有个将近4W的rack量

结合明年rubin按照工程进度率去推算产能目前是350~400W张左右总体的量还是比较超预期的

所以非常看好1.6T光模块的放量相关的企业最近业接到了不少的加单真的是1.6T的元年到来了

3 GB200的cx8版本持续爬坡良率提升以及GB200的加单情况（主要是oracle非常猛+coreweave）

目前GB200出了个新版本叫做GB200配合cx8网卡的版本目前爬坡良率在40~60%左右客户满意度业不错性价比比较高

而GB200的普遍良率已经超过85%了鸿海这边最高的是广达+戴尔这边的良率已经超过90%+

因为广达做成L10的 com tray以后交给戴尔做L11的全组装戴尔在这块超预期的做的很好（戴尔的客户主要是coveweave+tesla）

GB200各家都加了不少的订单最猛的还是oracle 本来鸿海只有微软的5K+订单现在oracle定的量比微软还多变成了最大客户其实有具体的信息但是我觉得不展开了把 因为之前写的GB300的forecast很显然就是这些大客户的加单

4 台积电cowos 这边再加单主要是谷歌和amd的产品 amd的cpu成为主流产品占据ai服务器超过50% 超过intel

其实这些都是博通的加单但是博通的加单太多了包括交换机芯片的th5 th6 光模块的dsp 博通基本处于每几周都加单的状态实在是高景气度

谷歌的tpu又理论上加了每年差不多10W颗以上

今年主要是少量V6E+大量V6P 大概100W颗左右

明年主要是这代的V6E+大量V6P大概120W颗 V7P+V7E的大概75颗

meta这边也会出个三种今天晶片集合的新产品叫做mtia 3.5 分别包括io芯片网通芯片运算asic 整个产品可能会取代mtia4提早推出

amd这边cpu非常的猛已经占据了数据中心的主流超过50% 完全超过intel 目前用的是2nm工艺名字代号叫威尼斯会和amd的mi430 450一起使用2纳米工艺在今年Q3量产明年Q1大规模流片

差不多这样吧 最后希望tmt资金都格局一点