这就是认知偏差,现在大家用的大模型早就把很多压缩,注意力技术全用上了,谷歌那论文为了夸张实验效果拿的是很多年前啥缓存压缩技术都不用的来比。
打个比方就是已经2025年了,他说自己高铁极限能开400,但是拿了个时速80km的蒸汽火车来说自己速度5倍,实际上大家坐的早就是350的高铁了
而这个方案几乎是物理极限的压缩了,只要你学过通信原理,这玩意几乎就是理论压缩的极值。
读完工学博士甚至硕士你就会发现,很多东西他只能在理论中存在。
$英伟达(NVDA)$ $佰维存储(SH688525)$ $兆易创新(SH603986)$