$阿里巴巴-W(09988)$蔡崇信近期在迪拜论坛说到：“纯做大模型的公司与既做大模型又提供云服务的公司，在盈利能力上有...

刺猬密码

2026-02-07 19:49 · 福建

$阿里巴巴-W(09988)$
蔡崇信近期在迪拜论坛说到：“纯做大模型的公司与既做大模型又提供云服务的公司，在盈利能力上有本质区别。纯做大模型的公司得考虑如何产生收入。在美国，谷歌这种全栈云公司有大模型、云服务以及芯片，可以变现的方式有很多。在中国，我们阿里有开源模型千问，也有云服务。我们现在靠云服务创收，因为现在很多人在阿里云上做大模型训练和推理。但C端消费级大模型在国内如何创收，还有待考察。”
如果说算力token是AI时代的水和电，阿里一定要做token成本最低的那家，才有前途。
如何实现token成本最低？马老师去年就说了：通云哥。通义基模，阿里云，自研芯片平头哥。云厂商要自研芯片才能降本。
————
目前算力租赁的毛利大部分都被英伟达链给赚走了，GPU租赁利润率比CPU还低，那云厂商不是开历史倒车吗。如何破局？北美规模最大的超级云AWS（亚马逊云）和增速最快的超级云谷歌云都把自研芯片租给云客户，以实现降本。AWS既有CPU芯片Graviton，还有GPU芯片Trainium供其云客户使用。自研的Graviton芯片比市场主流的x86 CPU处理器比，性价比可以提升40%。亚马逊云前1000大客户，有900多家都在用亚马逊自研芯片。Graviton已经是年化收入数十亿美元的生意，4季度同比增速50%。AWS自研GPU芯片Trainium2的性价比要比友商的GPU性价比提升30-40%，近期推出的Trainium3比Trainium2性价比最高又提升了40%。AWS的CPU+GPU芯片已经是年化超百亿美金的业务，而且还在保持三位数的同比增长。
谷歌也是一样。谷歌CEO皮柴在Q4业绩会上说，谷歌自研大模型Gemini基于谷歌TPU芯片研发，在自研芯上研发自有大模型，能够改善资源利用率，Gemini单位服务成本下降78%。简单说，AWS和谷歌云都在证明，全栈云能为企业大幅降低成本。