用户头像
刺猬密码
 · 福建  

$阿里巴巴-W(09988)$
蔡崇信近期在迪拜论坛说到:“纯做大模型的公司与既做大模型又提供云服务的公司,在盈利能力上有本质区别。纯做大模型的公司得考虑如何产生收入。在美国,谷歌这种全栈云公司有大模型、云服务以及芯片,可以变现的方式有很多。在中国,我们阿里有开源模型千问,也有云服务。我们现在靠云服务创收,因为现在很多人在阿里云上做大模型训练和推理。但C端消费级大模型在国内如何创收,还有待考察。”
如果说算力token是AI时代的水和电,阿里一定要做token成本最低的那家,才有前途。
如何实现token成本最低?马老师去年就说了:通云哥。通义基模,阿里云,自研芯片平头哥。云厂商要自研芯片才能降本。
————
目前算力租赁的毛利大部分都被英伟达链给赚走了,GPU租赁利润率比CPU还低,那云厂商不是开历史倒车吗。如何破局?北美规模最大的超级云AWS(亚马逊云)和增速最快的超级云谷歌云都把自研芯片租给云客户,以实现降本。AWS既有CPU芯片Graviton,还有GPU芯片Trainium供其云客户使用。自研的Graviton芯片比市场主流的x86 CPU处理器比,性价比可以提升40%。亚马逊云前1000大客户,有900多家都在用亚马逊自研芯片。Graviton已经是年化收入数十亿美元的生意,4季度同比增速50%。AWS自研GPU芯片Trainium2的性价比要比友商的GPU性价比提升30-40%,近期推出的Trainium3比Trainium2性价比最高又提升了40%。AWS的CPU+GPU芯片已经是年化超百亿美金的业务,而且还在保持三位数的同比增长。
谷歌也是一样。谷歌CEO皮柴在Q4业绩会上说,谷歌自研大模型Gemini基于谷歌TPU芯片研发,在自研芯上研发自有大模型,能够改善资源利用率,Gemini单位服务成本下降78%。简单说,AWS和谷歌云都在证明,全栈云能为企业大幅降低成本。