
当HBM叠上GPU,散热难题如何成为算力突破的 “拦路虎”?

打开AMD或英伟达最先进的AI产品封装,你会发现一个熟悉的布局:GPU两侧是高带宽内存(HBM),这是目前最先进的内存芯片。这些内存芯片尽可能靠近它们所服务的计算芯片,以减少AI计算中最大的瓶颈——将每秒数十亿比特的数据从内存传输到逻辑电路所需的能量和延迟。但是,如果将HBM堆叠在GPU顶部,进一步拉近计算和内存的距离,又会怎样呢?

图中较大的黑色方块是连接到AMD Instinct MI300X GPU 逻辑芯片的高带宽内存[中心]。 来源:AMD
Imec近期利用先进的热模拟技术研究了这种情况,并在2025 年 12 月举行的 IEEE 国际电子器件会议(IEDM) 上公布了结果,结果令人沮丧。3D堆叠会使GPU 内部的工作温度翻倍,导致其无法正常工作。但由 Imec 的James Myers领导的团队并没有就此放弃。他们找到了