为什么寒武纪会涨到8848元(深度分析)

用户头像
莫南
 · 湖南  

我大概是2013年的时候,开始从事智能芯片设计研究。

我们这个行当,是划归在计算机系统结构这个大的专业门类下。领域内,每年都会开有一些顶级学术会议,全世界最先进的研究成果,经过层层选拔,才能在会议上发表。为了学习更先进的技术,掌握行业动态,我每年都会去阅读发表在这些会议的文章。

这些会议里,有四个殿堂级的存在,isca、asplos、macro以及hpca。那会中国人的学术影响力还不高,基本很少很少有能力在这四个顶会发表文章。

而2014年,有一个中国年轻人,踩在了AI芯片设计珠穆朗玛峰山巅,获得了asplos最佳论文奖。对,那就是一切开始的地方,寒武纪的雏形“电脑”。

任何成功都离不开积累,这篇文章的底子是中科院计算所在多年“龙芯”处理器设计中积累的芯片设计能力。

我非常认真的阅读了这篇文章,其提出的体系结构,相对较为完整的重现了深度神经网络的推理过程,由于是针对神经网络的专用ASIC,甚至是面向当时最先进的卷积神经网络优化的,所以其理论性能可以碾压业界最先进的英伟达开普勒架构。

说实话,我一眼就看出了这个设计的硬伤--通用性。并且从那个时候开始,我个人就给寒武纪打上了“实验室产品”的标签,我认为,没有通用性的架构,是不可能适应人工智能算法日新月异的迭代的。买来的加速卡,一两年就变成废铁,这种产品,肯定不会有市场。

后来,这个团队,在领域各大顶会不断发表文章,不断优化其设计,代表作包括强化规模的“大电脑”(2015年发表于macro)面向计算机视觉的“视电脑”“pu电脑”(asplos)等。

2016年,寒武纪成立,同时,其奠基之作“寒武纪指令集”发表在isca2016,同期其扩展指令集“寒武纪x”发表在macro2016。这些文章的含金量,业内都应该很清楚,这是那个时代的传奇,代表着全中国和全世界芯片设计水平的巅峰。

寒武纪指令集,总结了深度学习算法的特征,抽象出了其专用中的共性,是寒武纪打破其专用性限制,迈向领域通用的重大努力。

可是,我认为,寒武纪的架构天生不太灵活,虽然性能很好,但在生态上非常难以让人接受。这个判断后面也得到了事实的印证。寒武纪公司的产品推广并不顺利,而且由于训练更为复杂,所以一开始寒武纪的产品并不支持训练。用户不得不先用英伟达卡把模型训练好,再移植到寒武纪上去,大家的接受度很低。

2018年,在思源芯片设计中,寒武纪观察到神经网络模型中有大量突触链接的权重值很低,基本可以忽略不计,为将芯片性能推到极致,寒武纪对网络进行了剪枝,舍弃了模型中3/4的突触链接,直接将性能提升了4倍。此时的寒武纪用非常低的面积功耗,实现了和英伟达当时最先进的v100相近的推理性能。

但代价就是通用性的进一步丧失。用英伟达卡训练出的模型还需要进一步剪枝压缩,必须在寒武纪技术支持人员的帮助下才能运行,这种做法无疑是自寻死路,彻底和客户说88了。作为对比,当时瑞芯微的市场策略就聪明很多,瞄准最火热的yolo视觉模型,推出不朽经典rk3588芯片,用户很轻松的就能把自己训练的模型移植到3588上,销售额狂飙,一举成为中国端侧推理芯片之王。

寒武纪的芯片架构,对中国芯片发展历史有着深刻影响,其早期大客户是华为,华为将其ip核集成至麒麟970芯片,随mate10-20售卖。后期,虽然华为甩了寒武纪自己设计智能加速部分,但其技术路线已经被寒武纪影响。个人认为,寒武纪这种专用且难用的架构,至少把昇腾的研发进度拖慢了3年以上,目前华为内部还时不时不断传出声音,想切换到英伟达主导的通用gpu路线上去。

2021年,寒武纪在把芯片性能做到极致后,越来越感受到通用性生态的重要,下定决心在其mlu2.0架构中加强了通用性设计,使其芯片具有训练能力。并连续迭代了思源290,思源370的多款产品。

最终,旷世之作思源590在2024年面世。但此时,寒武纪早已臭名昭著,业内都觉得其产品难堪大用,甚至有很多不明真相的群众视其为骗子公司,皮包公司。好在寒武纪的中科院血统,帮助他一直在国有数据中心建设,以及信创市场中占有一定份额续命。

直至,2024年川普重新上台,延续了拜登政府对中国的人工智能管制,英伟达加速卡向中国的流动通道基本被切断了。

上层不能允许我国人工智能的发展机遇受阻于算力芯片,倾举国之力扶植,华为昇腾首当其冲,但上层肯定不会满足只有一家企业担此重任。其时,昇腾有华为,昆仑有百度,平头哥有阿里,都不愁卖,但技术水平同处第一档的寒武纪确没有大腿可以抱。

网传经过上面穿针引线,终于说服字节出手援助。当时苦于禁令的字节难以获取英伟达最先进的训练卡,自己有没有很强的芯片设计团队,只能依赖阉割版h20度日,采购寒武纪后,抱着试一试的心态,让技术人员去进行了适配。不用不知道,一用吓一跳,当完成适配移植,解决“难用”这个问题后,寒武纪性能的优势就凸显出来了。

又便宜性能又高,货源还稳定的的国产替代方案,谁不喜欢呢?

此次采购,是寒武纪发展史上的质变,互联网大厂优秀的顶级程序员,正慢慢帮助寒武纪解决困扰近10年的“生态”问题。一旦寒武纪加速卡在字节用通,连h20都买不到的其他大厂都会蜂蛹而至。寒武纪的星辰大海,终于显现了。

关于估值,我再次给大家进行科普。

一块加速卡的市场价格是10万量级的,每个一线大厂目前每年采购量在数十万块。国内大厂腾讯,字节去年的采购量大概是20-30万块,国外大厂微软去年是50万块。而且这个数字随着AI应用的快速普及,还在不断高速攀升。目前看,中国AI加速卡的市场需求已经在200万张量级。

我们假设国内未来5-10年,随着人工智能基数广泛应用,不考虑潜在的出口预期,仅中国AI加速卡市场也很可能达到1000万块,寒武纪作为国内老二获取200万块是有可能的 ,其营收将达到2000亿量级。参照英伟达50%净利率,50pe估值,合理市值将达到5万亿人民币,而这也仅仅是英伟达目前市值的1/7。5-10年后,中国公司还一定屈居人下?

如果上述预期实现,寒武纪股价将会超过8848元。

$寒武纪-U(SH688256)$

重要声明:此文是我模仿股市黑嘴的语气写的搞笑段子,文中内容全是我虚构的,不构成任何投资建议。我本人严肃的认为,寒武纪目前股价严重偏离基本面,市盈率高达4000多倍,泡沫非常巨大,将来至少跌到5元,希望关注我的朋友们能坚持价值投资,不追高,不接盘,保护好自己的钱袋子。