$每日互动(SZ300766)$ $优刻得-W(SH688158)$ $青云科技-U(SH688316)$ 优刻得凭借 国产芯片全适配能力 + DeepSeek 生态深度绑定 + FP8 能效优势,已形成“模型–芯片–云服务”闭环。UE8M0 FP8 的落地将显著降低算力成本与功耗。
UE8M0 FP8 作为专为国产芯片设计的 8 位浮点格式,具备两大优势:
显存占用减少 50%-75%:例如 700 亿参数模型显存需求从 140GB(FP16)降至 70GB。
计算速度提升 2-3 倍:优化矩阵运算效率,支持更大批处理量和更长上下文(如 128K tokens)。
→ 直接降低优刻得云平台的算力运营成本,提升服务利润率。
增强推理服务竞争力
FP8 量化可提升 推理吞吐量 56%-144%(参考 TensorRT-LLM 优化数据),优刻得基于国产芯片的 DeepSeek 推理服务响应速度与