回复@火天--大有: 国产算力需要最重要的HBM替代方案,UCM(推理记忆数据管理器)。同有科技就是做这个的,作为一款以KV Cache为中心的推理加速套件,UCM融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,可扩大推理上下文窗口,实现高、低时延的推理体验,降低每Token推理成本$同有科技(SZ300302)$//@火天--大有:回复@知行合一2008:盈亏同源。不接受浮动亏损,承载不了盈利。