【苹果芯片和阿里千问3,算力过剩的时代来了】
DeepSeek把三台旧苹果手机和一台苹果平板拼成一块496 GB的“大显存”,跑起AI模型比单买万元$英伟达(NVDA)$ 的显卡还顺,GitHub三万颗星就是铁证。
开发者图的不是炫技,而是把算力定价权从英伟达手里抢回来。
每台设备只贡献闲置算力,电费比挖矿低得多,用户却能在客厅训练出自己的小ChatGPT。
苹果M4芯片的内存统一架构被钻了空子,跨设备延迟压到5毫秒以内,等于告诉全世界:硬件军备竞赛可以歇了。
大模型的瓶颈个就是内存带宽,所以苹果芯片,才是最佳的大模型芯片。
老苹果手机不再进抽屉,直接变成印钞机。
以后拼算力就像拼团买菜,谁还花大钱$英伟达(NVDA)$ 显卡?$英伟达概念(BK1581)$
以后,你会把旧手机扔进抽屉,还是让它继续帮你赚钱?
【阿里巴巴推出新的千问3】
Qwen3大模型,800亿参数模型只激活30亿,性能却碾压32B全量,训练费砍九成,长文本推理飙十倍,钱包和显卡同时松一口气。
阿里悄悄把Qwen3-Next推上线,核心动作只有三刀:注意力更精,MoE更瘦,训练更稳。
多token预测像开了连发,一次吐一串,延迟肉眼可见地掉。
省下来的不只是算力,
训练预算砍到原先的十分之一,小团队也能摸到大模型的门把手。
长文本一口气读十万字,速度还翻十倍,做知识库、做客服、做研报,不用再掐表。
有人担心稀疏激活会掉精度,实测打平甚至略超老32B。
省算力不省智商,这才是关键。
接下来半年,云厂商的按量计费估计要降价,显卡租赁也会松动。
早一步把业务切到新架构,成本直接腰斩。
牛市中后期最爽的涨幅就是估值切换,换一个叙事,原来很贵的估值会立马变便宜,比如科技和算力,CPO,芯片,AI,液冷,服务器,等从看利润会变成不看利润,或看今年利润变成看未来三五年利润,炒成天价。
熊市中后期最残忍的跌法也是估值切换,换一个叙事,本来跌了50%,已经跌得差不多了,结果切换到要看利润,估值还巨贵,能再跌50%。