嘿,朋友们!我会在这里持续分享热门题材硬逻辑个股,干货满满,要是觉得不错,记得点个关注呀,这样就能第一时间收到我的更新啦,咱们一起成长进步哦~
AI 推理成价值核心,HBM 瓶颈凸显产业痛点,“以 存代算”应运而生。当前,AI 推理已成为衡量大模型商业化价值的关键标 尺,但在实际应用中仍面临“推不动、推得慢、推得贵”的严峻挑战。为突 破算力瓶颈与“存储墙”制约,“以存代算”作为一种颠覆性技术范式应运 而生。该技术通过将 AI 推理过程中的矢量数据(如 KV Cache)从昂贵的 DRAM 和 HBM 显存迁移至大容量、高性价比的 SSD 介质,实现存储层从内 存向 SSD 的战略扩展,而非简单替代。其核心价值在于显著降低首 Token 时延、提升推理吞吐量,并大幅优化端到端的推理成本,为 AI 大规模落地 提供可行路径。
“以存代算”CachedAttention 技术是一种通过将 AI 推理中历史对话的 KV Cache 缓存到 HBM+DRAM+SSD 等外部存储 介质。
HBM(高带宽内存)是一 种专用内存技术,用于 AI 处理器、GPU 和 HPC 系统。HBM3 每堆栈可提供高达 819 GB/s 的传输速度,对于支持大型语言模型 (LLM)、神经网络训练和推理工作负载至关重要。 与传统内存芯片相比,HBM芯片最大特点在于采用了先进的3D 堆叠技术,通过硅通孔(TSV) 将多个 DRAM 芯片垂直堆叠在一起,并与 GPU 或 CPU 等处理器封装在同一模块中,实现 了大容量、高位宽的 DDR 组合阵列,能有效解决“存储墙”问题。
在 AI 服务器中,HBM 的成本占 比约为 20%—30%,仅次于用于计算的 AI 芯片。当前全球 HBM 市场由三星、SK 海力士等 主导,且受到美国出口政策的影响。根据 2024 年 12 月 2 日发布的新规,美国禁止向中国 出口 HBM2E(第二代 HBM 的增强版)及以上级别的 HBM 芯片。不仅美国本土生产的 HBM 芯片受到限制,任何在海外生产但使用了美国技术的 HBM 芯片也受到出口管制。该禁令 于 2025 年 1 月 2 日正式生效。目前,国产厂商 HBM 的突破还在推进中。
他们三者的作用及关系如下:
核心定位:GPU 本地高速存储,用于实时支撑 LLM 推理计算,是 KV 缓存访问的 “第 一梯队”。
关键作用: 存储当前活跃会话的 KV Cache,直接供 GPU 的自注意力计算(Attention)和前馈网 络(FFN)调用,避免计算阻塞。
预留读写缓冲区(read buffer/write buffer):读缓冲区用于提前加载 DRAM 中的 KV 缓存,与 GPU 计算重叠;写缓冲区用于暂存未完成保存的 KV 缓存,避免阻塞下一 个推理任务。
核心定位:HBM 与 SSD 之间的 “中间缓存层”,平衡存储容量与访问速度。 •
关键作用: 存储近期可能被访问的非活跃会话 KV Cache,作为 HBM 的扩展,避免频繁从低速 SSD 加载。
承接 HBM 的异步 KV 缓存写入:在推理计算(如解码阶段)同时,将 HBM 中已完 成计算的 KV 缓存异步保存到 DRAM,减少 HBM 占用。
作为预取目标:通过调度感知预取(scheduler-aware fetching),将 SSD 中即将被访 问的 KV 缓存提前加载到 DRAM,确保 GPU 访问时能命中高速存储。
核心定位:海量 KV 缓存的 “长期存储池”,解决 HBM 和 DRAM 容量不足的问题。
关键作用: 存储海量非活跃会话的 KV Cache,提供 TB 级容量,避免因 HBM/DRAM 容量限制 导致 KV 缓存被丢弃。 配合调度感知驱逐(scheduler-aware eviction):当 DRAM 空间不足时,将长期不被 访问的 KV Cache 从 DRAM 迁移到 SSD;当 SSD 空间不足时,驱逐最不可能被访问 的会话 KV Cache。
江波龙专注于半导体存储领域,为客户提供从产品设计、存储芯片、主控芯片设计及固件 开发,到封装、测试、制造等全方位的存储定制服务。 国产替代龙头,企业级存储实现放量增长。2025H1 公司企业级存储业务规模增长明显, 企业级存储 业务收入 达到 6.93 亿元,同比增长 138.66% 。 公司是国 内少数具 备 “eSSD+RDIMM”产品设计、组合以及规模供应能力企业,在 eSSD 与 RIDMM 产品组合 基础上,已成功点亮 SOCAMM 产品,结合 MRDIMM、CXL2.0 内存拓展模块构建了全面 的企业级产品体系。公司的 eSSD 与 RIDMM 产品已成功完成鲲鹏、海光、飞腾等多个 国产 CPU 平 台服 务器的 兼容 性适配 ,DDR5 RDIMM 产 品也通 过了 AMD 旗 下 Threadripper PRO 9000WX 系列工作站 CPU 认证,为在主流平台上的广泛应用提供了坚 实的技术基础。公司企业级业务进入快速增长阶段,客户涵盖运营商、大型及中型互联网 企业、服务器企业等,产品已在通信、互联网、金融等行业历经多次严苛考验并成功交付
佰维存储专注于半导体存储器的研发设计、封装测试、生产和销售,核心产品及服务涵盖 半导体存储器和先进封测服务,具体可分为六大产品线:嵌入式存储、PC 存储、工车规 存储、企业级存储、移动存储和先进封测服务。 公司企业级存储有 4 大类别,分别为 SATASSD、PCIeSSD、CXL 内存及 RDIMM 内存条, 主要应用于数据中心、通用服务器、AI/ML 服务器、云计算、大数据等场景。公司 SS 系 列企业级 2.5"SATASSD 产品包含 SS811、SS821 等系列,支持异常掉电保护、端到端的数 据保护、Thermal Throttling、动态和静态磨损平衡、支持电源动态管理、S.M.A.R.T、垃圾 回收和 TRIM、固件备份、InternalRAID 等特性。公司 SP 系列企业级 PCIe SSD 产品,包含 Gen4 和 Gen5 两类产品。用创新架构,可实现超低且一致的读写延迟,具备优秀的能效比 表现,可为客户提供业界领先的 KIOPS/Watt 综合性能。
德明利是一家专注于国产存储主控芯片研发及存储模组方案的集成电路企业,以“芯片+ 算法+场景”全链条技术能力,为智能终端、数据中心、工业控制等高价值场景提供高可 靠性存储解决方案。公司产品线涵盖固态硬盘类、嵌入式存储类、内存条类及移动存储类 四大系列,已广泛应用于数据中心、手机、车载电子、平板、安防监控等多元应用场景。
德明利 ES1020 系列工业级 SSD,作为行业主流存储模组厂商率先搭载自研主控芯片的工 业级产品,实现从芯片到模组的全链路国产化设计制造。其自研 TW6501 芯片是国内首颗 支持 ONFI 5.0 的 SATA SSD 主控,采用 RISC-V 架构,满足宽温要求。产品支持 SATA III 协议,提供 64GB-4TB 容量及 M.2/2.5 寸/mSATA 全形态,具备 200 万小时 MTBF、超 3K 次擦写寿命及 7×24 小时稳定写入性能。依托灵活可扩展的自研固件平台,为工业控制、 安防监控、通信、电力等关键行业端侧 AI 硬件提供自主安全、稳定可靠的存储解决方案。 “2+3”自研主控拓展提速,加快高性能领域研发创新。公司闪存模组以自研主控芯片为 核心,随着研发实力不断增强,芯片研发不断拓展提速,同时推动两颗主控量产导入,三 颗主控芯片立项研发。公司新一代自研 SD6.0 存储卡主控芯片成功量产,产品适配工作进 展顺利,目前已有各类搭载该款主控的存储卡模组送样,待客户验证通过后即可实现批量 导入;公司自研 SATASSD 主控芯片成功量产,已经完成产品适配与测试,并实现批量销 售。新一代 SD6.0 存储卡主控芯片主要基于 40nm 工艺,提升读写性能,基于 multi-voltage 多电源域的低功耗设计方法,SATASSD 主控芯片为国内率先采用 RISC-V 指令集打造的无 缓存高性能控制芯片,支持最新的 ONFI5.0 接口,二者均采用目前业界领先的 4KLDPC 纠 错技术,可以灵活适配 3DTLC/QLC 等不同类型的闪存颗粒。
公司专用型存储芯片包括 NORFlash、SLCNANDFlash 和利基型 DRAM 三条产品线,形成 了丰富的产品矩阵,满足客户在不同应用中对容量、电压以及封装形式的多元需求,已在 消费电子、工业、通讯、汽车电子等领域实现了全品类覆盖。 NOR Flash 方面,公司产品覆盖 512Kb 到 2Gb 的容量范围,支持 1.2V、1.8V、3V、1.65~3.6V 以及 1.8VVCC&1.2VVIO 等多种供电类型,并针对不同市场应用需求分别提供高性能、低 功耗、高可靠性、小封装等多个产品系列,可满足客户在不同应用领域多种产品应用中对 容量、电压以及封装形式的需求。2025 年上半年,公司推出了专为 1.2VSoC 应用打造的双 电压供电 SPINOR Flash 产品,进一步强化公司在双电压供电闪存解决方案领域的战略布局, 为市场提供先进嵌入式存储解决方案,可应用于智能可穿戴设备、医疗健康、物联网、数 据中心及边缘人工智能等新兴领域。2025 年,公司为率先实现 45nm 节点 SPINORFlash 大 规模量产的公司之一,存储密度得到显著改善,持续保持技术和市场的领先。 SLC NAND Flash 方面,公司产品容量覆盖 1Gb~8Gb,采用 3V/1.8V 两种电压供电,具有 高速、高可靠性、低功耗的特点,其中 SPINANDFlash 在消费电子、工业、汽车电子等领 域已经实现了全品类的产品覆盖。2025 年上半年,公司推出了兼备更快读取速度和坏块管 理功能的高速 QSPINANDFlash 产品,可应用于工业、IoT 等快速启动应用场景。 公司利基型 DRAM 产品广泛应用于网络通信、电视、机顶盒、智能家居、工业等领域。 2025 年上半年,公司 8Gb 容量 DDR4 产品市场推广顺利进行,营收稳步增长;LPDDR4 产品开始贡献营收。公司控股子公司青耘科技开展的定制化存储业务正有序推进中,业务 进展顺利
联芸科技是国内领先的数据存储主控芯片及 AIoT 信号处理芯片设计企业,业务覆盖消费 电子、工业控制、智能物联等领域。 公司主控芯片核心产品出货量全球领先。在 SSD 主控领域,公司已实现从 SATA 到 PCIe 5.0 的全协议覆盖,构建了消费级、企业级和工业级的全场景产品矩阵。消费级 SSD:公司全 面布局 SATA、PCIe 3.0 及 PCIe 4.0 主控芯片产品线,凭借高性能、低功耗和优异的兼容 性,出货量实现稳定增长,并在头部笔电前装市场实现大规模商用。企业级 SSD:高性能 SATA 主控芯片已获得主流服务器和系统等客户的认可,并实现大规模商用,为下一代企 业级PCIe SSD 主控芯片的研发和市场推广奠定坚实基础。工业级 SSD:公司已完成 SATA、 PCIe 3.0 及 PCIe 4.0 主控芯片的全平台布局。
通过收购北京矽成(ISSI)进入存储芯片设计领域,成为国内领先的车规级存储芯片巨头。其核心产品为 SRAM、DRAM 和 NOR Flash 芯片,广泛应用于汽车电子、工业制造和高端消费电子领域。
国内少数可以同时提供 NAND、NOR、DRAM 设计能力的公司,聚焦于中小容量、高附加值存储芯片的设计,是国内 SLC NAND Flash 领域的佼佼者,产品广泛应用于网络通信、安防监控、可穿戴设备等市场。