Clawdbot其实是“曲线救国”,通过屏幕图像识别,再用python脚本调用鼠标键盘操作。但Linux原生的CLI操作,语音-文本操作效率会高很多。现在Clawdbot完成一个任务需要消耗百万token,折合最低5美元(先进基模底价),有个哥们深度使用40小时,干掉了1亿opus的token。如果直接用命令行交互,成本预计最多可能下降到十分之一。当然CLI操作的通用性存在短板,Photoshop、微信这类封闭软件的交互受制于人,不过Photoshop正在被Comfy UI等开源的AI图片编辑工具替代,微信短期没办法,但是针对办公场景,企业应该更倾向于私有化的办公协同,那么code banana已经全面打通了。AI操作系统对于出门问问不是一个突发奇想,而是已经有了显著进展的事实。$出门问问(02438)$ 这样一家走在正确方向的公司,价值回归需要的可能仅仅是一份扭亏为盈的年报。