科德教育:1.3亿投资中昊芯英,TPU产品性能超过英伟达当代先进芯片

用户头像
南昌深挖哥
 · 江西  

对比下来,东芯投了励算2亿、科德投了中昊芯英1.3亿,东芯涨了2倍多,科德应该涨多少?

一. 中昊芯英TPU AI芯片性能超过英伟达当代的先进芯片

中昊芯英研发了“刹那”TPU芯片,是我国首枚量产高性能TPU架构AI专用大芯片,其IP核、指令集、计算平台全部自研,彻底摆脱对海外技术的依赖。

TPU AI芯片专用于AI大模型,面向AI计算场景时,相较于GPU可以拥有3-5倍的性能提升。中昊芯英的TPU芯片在处理AI模型运算时计算性能可以超越英伟达当代的先进芯片1.5倍,完成相同训练任务量时的能耗降低30%,综合测算,单位算力的成本仅为英伟达芯片的42%

除了单卡性能外,中昊芯英用1024片“刹那”TPU芯片组成AI计算集群性能远超传统GPU数倍,可支持超千亿AIGC大模型计算需求。实测发现TPU千卡集群性能和特斯拉Dojo同一水平比NVLink有一定的优势。从单卡到集群,中昊芯英实现从底层技术到应用生态的全链国产自主可控,为我国AI算力自主化提供支撑。

并且中昊芯英官微8月8日的文章中CEO提到第二代性能更强大的TPU AI芯片已经在研发最后阶段,很快就会面向市场推出,目前第一代芯片已经进入国产数据中心,成为国产替代核心力量,具体看下文:

二. 科德教育对比东芯科技、中昊芯英对比砺算科技

对比科德教育东芯股份,科德教育对中昊芯英投资1.3亿,东芯股份对砺算科技投资2亿,此外经咨询公司后续有意向增持中昊芯英,如有增持,将会发公告。

砺算科技前日发布国内首款消费级7G106显卡,带动东芯股份股价大幅上涨。通过产品对比可得知7G106和英伟达的上一代显卡中相对低端的RTX4060性能大约持平,略有领先(当代显卡是RTX50系列)。

中昊芯英的国内首款量产的TPU AI芯片性能相比英伟达当代的先进芯片相比,性能超越1.5倍,综合测算单位算力成本仅为前者的42%

市场应用方面,砺算科技的该款显卡还没有正式应用,预计在今年9月份量产

中昊芯英的TPU芯片已经应用于多个智算中心和科研项目

同样以英伟达的产品对比可以看到中昊芯英的TPU芯片产品在性能上更有优势并且TPU芯片适用于智算中心、AI大模型计算,这点是显卡做不到的。该TPU产品已经进入智算中心装机使用,市场方面也是优于砺算科技,第二代产品也即将上市。综合来看中昊芯英是优于砺算科技的。

综上所述,科德教育理应有一定涨幅。

三. 中昊芯英TPU芯片已经应用于多个项目

中昊芯英去年9月份和中国联通就共建了广东TPU智算中心。今年又共建天津移动TPU智算中心,两者都已经投入使用。产品还应用于多个科研项目

中昊芯英保持高研发的同时净利润连续为正,显著优于同行业其他公司,在芯片行业里算是十分少有的,现在国家大力发展AI的同时要求芯片等产品国产化中昊芯英现有产品和即将推出的第二代TPU产品将会有更大的市场

四. TPU比GPU更适用于AI大模型

相较于传统的GPU架构,TPU具有多项优势:显著降低数据移动延迟和功耗;能在更低的能耗下实现持续高吞吐量推理;更优的扩展性和资源利用效率。TPU架构比GPU更适合大模型计算,在同等制程下相较GPU可实现性能3-5倍的跃升。

OpenAI在今年已经开始租用谷歌的TPU为ChatGPT和其它AI产品提供算力支持,作为英伟达GPU的最大采购商之一,OpenAI此举也证明了TPU在AI大模型方面的优势。在国内,互联网大厂因为美国对芯片出口的管制很难获取英伟达最先进的芯片,此时中昊芯英这款性能上优于英伟达芯片的TPU芯片肯定会获得青睐,并且还能实现芯片国产化,一举两得

(上文所用有关中昊芯英的图片均来自中昊芯英官微)

文章内容属于个人研究心得的分享,仅供参考和交流学习,文中所有内容不构成任何股票买卖依据!据此投资风险自理!

$科德教育(SZ300192)$ $东芯股份(SH688110)$ $寒武纪-U(SH688256)$