龙虾时刻Clawdbot 爆火之后,随身智能还有多远?

用户头像
混沌之泊
 · 北京  

前文: 网页链接{聊一聊端侧SoC上市公司AI演进的2种路径(一) AI 从“数字世界”走向“物理世界”的两条核心演进路线当 AI 离开纯数字空间,进入真实物理世界时,并不是一条连续演进曲... - 雪球}

「龙虾时刻」= AI Agent 的「ChatGPT 时刻」,开启端侧 AI Agent超级需求周期

正如乔布斯在《Triump of the nerds》中回忆,个人电脑的兴起并非传统大公司从 “中心” 规划的产物,而是从极客、非主流群体出发的边缘创新,最终走向行业中心。Clawdbot 正是如此,它诞生于商业边缘,却成为了端侧 AI 创新从 “边缘” 走向 “主流” 的关键一步,被业界称作 AI Agent 的 “ChatGPT 时刻”。这一时刻的到来,直接开启了端侧 AI 的超级需求周期

一、Clawdbot 爆火的真正原因(它到底解决了什么)

Clawdbot 的走红,不是因为它“像人”,而是因为它第一次把 Agent 从聊天界面,拖进了现实执行链路。它完成了三件过去被低估的事:

1 Agent 首次“常驻 + 自主循环”

不是:人问一句 → 模型答一句,而是:任务存在 → Agent 持续观察 → 规划 → 执行 → 校验 → 再执行。这意味着:Token 不再是对话成本,Token 变成系统运行成本。

2 把“工具调用”升级为“物理 / 半物理执行”

Clawdbot 的关键不在“说得多聪明”,而在:能操作 API,能操作系统,能接管工作流,能“干完一件事再回来”。这一步,把 Agent 从“助手”拉到了“执行体”

3 把 Agent 从“模型能力”变成“系统形态”

Clawdbot 不是一个 prompt,而是:多 Agent 分工,长时任务,状态可恢复,失败可重试,这本质上是一个 Agent OS + Appliance 的雏形

二 随身智能还有多远?

爆火的Clawdbot 证明了:👉 Agent 在软件层面已经成立。👉 接下来是 物理世界的落地权争夺。未来可能的三种形态:

Clawdbot 的爆火虽然令人兴奋,但冷静来看,它目前更像是一个“极客玩具”版的 Agent 1.5,距离大众所期待的“贾维斯(Jarvis)”时刻——即真正的“随身智能,至少还有 18 到 24 个月的物理距离。

Clawdbot 实际上是完成了“手脑分离”架构的原型验证(POC),但要实现“随身智能”,它还需要跨越以下四道鸿沟

1. 形态鸿沟:从“桌面锚点”到“口袋算力”

现状: Clawdbot 极其依赖 Mac mini 这种拥有无限电源和强散热的桌面设备。它是一个“座机”,你必须回到电脑前,或者远程 SSH 连回去才能用。

随身时刻: 真正的随身智能要求算力移动化。这需要 2026-2027 年的旗舰手机(搭载 3nm/2nm 芯片)能够撑起 Clawdbot 目前在 Mac mini 上跑的那些本地服务(网关、向量检索、隐私沙盒)。

距离: 等待随身智能 SoC 的内存带宽突破 100GB/s 瓶颈,以及电池技术能支撑全天候后台运行 Agent。

2. 感知鸿沟:从“文本交互”到“多模态伴随”

现状: Clawdbot 的交互界面依然是命令行(CLI)或文本框。它是个“瞎子”和“聋子”,只能处理你喂给它的文件和代码。

随身时刻: 随身智能的核心是“视觉(Vision)”和“听觉(Audio)”的实时在线。它应该通过你的眼镜看到你正在修的自行车,然后直接在其上叠加维修步骤;或者通过耳机听到会议内容,实时整理摘要。

距离: 缺乏能够长时间运行且不发烫的穿戴式硬件(如 Ray-Ban Meta 的下一代),以及能够低延迟处理视频流的端侧模型(VLM)。

3. 时延鸿沟:从“异步批处理”到“实时系统 1”

现状: Clawdbot 的工作流是典型的“慢思考”。你下指令 -> 它调用云端 API -> 思考拆解 -> 回传 -> 本地执行。这中间有明显的延迟,适合写代码、做报表,但不适合“聊天”或“即时辅助”。

随身时刻: 随身智能需要“快直觉”。当你问“前面路口左转吗?”时,它必须在毫秒级内由本地 NPU 直接给出答案,而不是去云端转一圈。

距离: 需要端侧 NPU 能够以极低功耗运行经过蒸馏的、反应极快的 1.5B 或者7B 模型,处理 80% 的日常琐事,只把 20% 的复杂推理扔给云端。

4. 门槛鸿沟:从“GitHub 开源”到“OS 级原生”

现状: Clawdbot 目前的用户画像是 开发者和极客。配置环境、申请 API Key、调试 Shell 脚本,这些操作将 99% 的普通用户拒之门外。

随身时刻: Agent 必须像 Siri 或 Spotlight 一样,是 OS(操作系统) 自带的基础设施。用户不需要知道什么是“API Token”,只需要开通一个类似 iCloud 的订阅,所有配置自动完成。

距离: 等待 Apple (Apple Intelligence) 或 Google (Android AI Core) 将类似 Clawdbot 的架构标准化内置化

结论:Clawdbot 是“Apple II”,我们在等“iPhone”

Clawdbot 的意义在于它证明了“本地隐私 + 云端智力”这条路是通的,且商业上极其强韧(高固定投入+低边际成本)。

离真正的“随身智能”还有多远? 我认为 2026 年底到 2027 年初 将是一个质变点。届时:

硬件就位: 具备大内存和高带宽 NPU 的 AI 手机/眼镜普及。

模型就位: 端侧小语言模型(Small Language Models)足够聪明,能处理多模态输入。

架构就位: 类似 Clawdbot 的逻辑被封装进手机 OS 底层,不再需要用户自己写代码。

三 “龙虾” Agent之后的演进

Agent Appliance 的 4 种最可能落地形态(2027–2030)

形态一:个人 Agent Box(PAB)—— 数字分身的“家庭服务器”。一台 Always-on 的个人 Agent 中枢,部署在家庭或个人办公环境中:管理个人数字分身(PDT),存储全部私人记忆,对外“思考外包”,对内“行动执行”。典型功能:私人邮件 / 日程 / 文档 Agent,长期知识与偏好建模,家庭自动化与多设备协调。

为什么一定会出现?PDT 对隐私敏感度极高,用户不愿将“人格模型”上云,本地 Agent 比云端更可信。Agent SoC(低功耗、强 Memory),统一内存 + 快速 SSD,安全启动 / 本地加密

潜在玩家:Apple/小米(最有系统优势),NAS 厂商,新一代 Agent OS 创业公司

形态二:企业 Agent Hub(EAH)—— AiOS 的“物理落点”。部署在企业内网的 Agent 执行与治理节点:承载企业级 Agent,连接 ERP / CRM / 内部系统,强治理、人类审批闭环。核心价值:替代 SaaS 的“人肉 glue”,Agent 统一编排业务流程,所有决策可追溯、可审计。

为什么一定会出现?企业无法接受“黑盒云 Agent”,数据合规 / 主权要求刚性存在,B 端更看重可信度而非模型大小。技术:Ontology / 数字孪生支持,Context 管理,多 Agent 调度

潜在玩家:Palantir 类平台,云厂商私有化方案,工业软件巨头

形态三:Agent Router(AR)—— 云与边缘之间的“智能交换机”。位于 云—边缘—终端之间 的 Agent 路由节点。决定:哪些 Token 上云,哪些任务本地执行,管理成本、延迟、隐私三者平衡。关键能力:Token 成本感知,任务优先级调度,Speculative / MoE 路由。

为什么一定会出现?Token 成本成为第一性指标,不同任务的“最佳执行点”不同,Agent 系统复杂度急剧上升。技术:高效 CPU 调度,低延迟网络,智能决策逻辑。

潜在玩家:云厂商,网络设备厂商,专用 Agent Infra 初创

形态四:Agent Companion Device(ACD)—— 可穿戴 / 随身 Agent。贴身存在、低功耗、长时运行的 个人随身 Agent,不是交互终端,而是行为感知与建议系统。应用场景:随身助理,行为记录,情境提醒。

为什么一定会出现?交互从“问”转向“被理解”,环境感知需要端侧计算,云延迟无法接受。技术:超低功耗 SoC,本地感知 + 轻量推理,强隐私设计。

潜在玩家:可穿戴厂商,手机 SoC 公司,新型硬件创业团队

$恒玄科技(SH688608)$ $瑞芯微(SH603893)$ $阿里巴巴-W(09988)$