用户头像
冬末最末
 · 广东  

Clawdbot其实是“曲线救国”,通过屏幕图像识别,再用python脚本调用鼠标键盘操作。但Linux原生的CLI操作,语音-文本操作效率会高很多。现在Clawdbot完成一个任务需要消耗百万token,折合最低5美元(先进基模底价),有个哥们深度使用40小时,干掉了1亿opus的token。如果直接用命令行交互,成本预计最多可能下降到十分之一。当然CLI操作的通用性存在短板,Photoshop、微信这类封闭软件的交互受制于人,不过Photoshop正在被Comfy UI等开源的AI图片编辑工具替代,微信短期没办法,但是针对办公场景,企业应该更倾向于私有化的办公协同,那么code banana已经全面打通了。AI操作系统对于出门问问不是一个突发奇想,而是已经有了显著进展的事实。$出门问问(02438)$ 这样一家走在正确方向的公司,价值回归需要的可能仅仅是一份扭亏为盈的年报。

从ClawdBot爆火看出门问问的机遇:从AI工具到操作系统的新征程@冬末最末 :  从ClawdBot爆火看出门问问的机遇:从AI工具到操作系统的新征程  一款名为ClawdBot(现改名为MoltBot)的AI智能体应用在开发者社区迅速走红,不到2周的时间在Github狂揽9万Stars(截至发文)。这款能够自动执行屏幕操作的智能助手的成功并非偶然——其创始人 Peter Steinberger 曾是PSPDFKit的创始人,在屏幕图像识别与图像元素定位领域有着深厚的积累。正是这种...