$昆仑万维(SZ300418)$ deepseek新更新的大模型,走的也是MOE架构,智能体模式。昆仑的很多首创的技术路径,如下图可以在8×4090显卡上进行推理,在fp8量化下进行高tokens/s吞吐。看公司的公众号,搜索moe,fp8,post-training等,可以看到公司很多发展路径与ds是很一致的。年初ds时刻时,天工的Q*算法,曾经蹭了一波。这次希望昆仑能做自己的潮流引领者。当然目前来看,在ds面前还是不能打。