中国 GPU 发展史:从零起步到自主突围

用户头像
小弧仙
 · 广东  

中国 GPU 的发展,从技术空白自主创新,可以分为三个阶段:技术启蒙 → 国产替代 → 生态构建

在聊发展史之前,先把几个基础概念捋清楚

GPU (Graphics Processing Unit):最早是给游戏、图形渲染用的芯片,后来因为并行能力强,也能做 AI 训练。

GPGPU (General Purpose GPU):把 GPU 当成“计算芯片”来用,跑科学计算、大模型训练。

NPU (Neural Processing Unit):专门针对深度学习算子(卷积、矩阵运算),效率高,但功能单一,不能渲染游戏。

AI Chip:一个大类,GPU、NPU、TPU(谷歌)、ASIC 都算在里面,泛指所有用来提供 AI/大数据算力的芯片。

一句话对比:
GPU = 万能刀 🔪
GPGPU = 计算型分支 ⚙️
NPU = 手术刀 🗡️
AI Chip = 工具箱 🧰

一、技术启蒙(2000—2015):从实验室到国产首颗 GPU

科研探索:2000 年前后,中科院计算所、国防科大尝试 GPU 架构研究,但成果有限。

IP 引入:芯原微电子等引入 ARM Mali、PowerVR 等 IP 做嵌入式 GPU。

景嘉微破冰:2014 年发布 JM5400,填补军用显控空白;2016 年上市,成为国产 GPU 第一股。

二、国产替代(2016—2020):从军用到民用

$景嘉微(SZ300474)$ JM7200:28nm 工艺,支持国产 CPU/OS,首次进入党政办公与 CAD 工业市场。

资本与政策推动:国家大基金入股景嘉微

新势力崛起:2019 年,壁仞科技、摩尔线程成立,立志做通用 GPU,对标英伟达

三、生态构建(2021—至今):多场景突破

性能差距缩小

景嘉微 JM9 系列:14nm 工艺,性能接近 GTX1080。

摩尔线程 MTT S80:支持 DirectX 12,可跑《黑神话:悟空》。

壁仞 BR100:7nm 工艺,PFLOPS 级算力,用于大模型训练。

新锐力量登场

砺算科技:2025 年发布 7G100(6nm),性能超 RTX4060,支持 48 任务并行,在建筑可视化和数字孪生场景表现突出;背后有 $东芯股份(SH688110)$ 持股,被称为“性能黑马”。

沐曦集成:C500 已交付万卡,计划 C600 支持 FP8,走规模化路线。

国际竞争与生态建设

美国禁售 A100/H100 后,国产 GPU 替代加速。

摩尔线程 MUSA 架构、壁仞 BR100、景嘉微生态适配,国产 GPU 开发者社区逐步成型。

四、未来展望

技术:Chiplet 封装、FP8 精度、国产 HBM 内存将是突破口。

市场景嘉微守政企,摩尔线程攻游戏,壁仞主攻 AI,沐曦量产,砺算走性能黑马路线。

2030 目标:国产 GPU 在信创、超算、大模型训练市场份额超 50%,实现从“跟跑”到“并跑”。

结语

景嘉微 JM5400 的军用突围,到 摩尔线程 MTT S80 的游戏突破,再到 壁仞 BR100 的大模型训练、沐曦的量产、砺算的黑马潜力,中国 GPU 已经完成了从零起步到多场景突破的历史跨越。

趋势已很清晰:中国 GPU 的突围之路,才刚刚开始。