聊聊openclaw等智能体和国产算力的想法

用户头像
jazzyway
 · 北京  

周末有点忙,本来针对feynman先仔细梳理了下先进封装的思路,但还是先聊聊智能体这边的情况吧,今天白天忙完才有空延续周五的思考继续理清一些模糊的点。

去年Manus发布后,其实对普通人的生活没有太大的冲击,因为当时智能体还是需要专业语言引导来干活,而这近一年的时间里,在发展了skills和mcp后,智能体终于来到了一个爆点。

在去年快到年底时,clawdbot出来了,我的理解是这玩意儿就是个自动脚本编译器,还是需要专业语言来引导,主要帮助完成一些个人设备端的日常工作,应是取巧发展了些技术手段,所以这个东西在个人端的功能自主范围扩大了很多,相应地也对系统和隐私安全有侵犯危险,但给很多一线人的直接体感是能够很大程度上帮助日常繁复作业。

今年1月,在clawdbot的基础上逐渐迭代出了openclaw,这个玩意儿就比较猛了,能够自然语言交互并且切实去自动编程完成工作,于是受众瞬间爆发,很多关注ai领域但不具备编程专业知识的,都可以上手用,去社交平台看看有多少ai博主在吃这碗饭就知道了。。。标题一个比一个玄幻,“几句话让openclaw给我完成了xxx工作”之类的。

openclaw给了很多博主新的流量饭碗,同时也引起了巨大争议,我看了不少后的感觉是:要看你有没有真正合适的需求和想法去使用它。

在尝试用它的人群里,专业人群最开始玩的不亦乐乎,但很快就发现,openclaw的智能程度还是达不到他们理想的状态,复杂的需求需要调用专业级大模型付费完成,巨量token带来的花费很大;简单的需求又完成不了多少有实际意义的工作,再加上智能程度不够导致需要反复调教才能达到理想状态,很多负面反馈都觉得这东西就是个浪费时间的玩意儿。而反馈正面的,一类是不具备专业能力的人,另一类则是类似傅盛这种企业领导层,有足够的认知、智慧去应用它来完成自己需要的功能,尤其是那些偏向重复、规律化的劳动。

之后,又出现了编程能力更优的智能体,比如上周五我提到的腾讯的codebuddy,这类就是在skills等方面做的更好,让ai的技能包更完备,相比于openclaw来说是一种专业维度上的超越。

编程小白和ai聊天都是自然语言交互,但真正能够通过这种日常交互就让它明白指令、完成编程、输出结果的,近期应该算第一次引爆。这个爆点,是我一个外行从它的可扩散性感知的,智能体不再是从业者的工具,而终于跨过了专业的门槛,来到了小白的世界。哪怕很多一线体验者吐槽它的无用、花费巨大,但很明显也有人真的已经用它在帮助自己完成工作,而非仅当知识问答。

说到这儿就聊一下华为云码道吧,周五引发了低代码编程的行情,但实际上逻辑是有问题的。

云码道主要是针对企业合规编程的提效,可以理解为华为把他们之前几十年用在企业管理等方面的编程经验规范化做成技能包给外界用。这个合规,不仅是合行业法规,更合华为内部的规范,所以又是一次影响力扩张。

而和低代码编程的冲突是很明显的。金现代普元信息这两个公司,前者是做的垂类领域的低代码平台,普元则偏向于通用,垂类还好说,因为每个行业内部有自己的代码规范,华为云码道更多是一种企业底层基础建设和他自己生态内的整合,所以是类似ERP这种思路,到很多垂类领域内肯定会涉及盲区,替代性冲突短期不是很高,而通用型的就冲突很明显了,就算都用同一个大模型,普元怎么和华为比专业能力。。。

并且对于算力这方面也不是增量刺激,因为云码道正是在做降本增效的精简工作,以前很多要反复试错、维护调整的工作,现在人家直接规范化甩给你一个技能包,那其实企业在应用后,对算力的使用是缩减了的,云码道的官方信息就说同等任务下token使用量能降低30%。

所以,从云码道去推昇腾的行情是不太合理的,它的增量只有达成影响力的扩散、让更多企业都来用这个平台智能体才符合逻辑。

真正的增量,还是要考虑token出海。

这方面这两天大家也讨论颇多,底层思路就是,国外能源基建不行、算力贵,中国便宜很多,所以国外的都开始跨海使用我们的模型和算力了。

我记得从去年下半年统计,minimax就已经有过token使用量第一位的时候,近期更是稳超。目前网上的信息看,我们的token性能成本能做到对面的1/5或更多。本身中国的顶级模型推理的智能水平就很好,与gpt、claude、gemini这些没太大差距,加上能源基建好,就达到了这个倍率水平。看到球友分享openrouter这个统计还有更多隐形的差距没有算进来,比如to c的使用量。

所以,这和前面聊的智能体达到自然语言交互编程的水平,是共同作用的刺激:我们的性价比高,而且现在智能体具备了往小白扩散的机会,等于双重增量加持。根本作用来源于后者,之前说过的,能到群众中去的才是好东西,才有大机会。

综上,国产算力这波确实要重视。

这里面又有多个细节,像算力租赁用哪个公司?用的是国产算力还是nv的?比如很正常的一个挖掘,看到minimax的调用量大家就会顺着去挖它所用的算力来源,因为它不像腾讯的codebuddy有很大的自有算力,minimax都是租赁,这就会挖到鸿博股份的长单,而顺着就会考虑还有哪些公司有余量可以留给未来可能的爆发需求,昇腾、寒武纪海光信息中科曙光这些都会搜出来。

这些之外,要考虑云天励飞这种推理芯片专业公司,这是智能体所需算力的上一步。因为智能体的应用爆发就是推理的爆发,而非训练。训练是不断优化模型完善知识库,这是贯穿ai发展的任务,而推理是应对需求一直向前完成作业,我们对智能体提出需求就是要求它做推理一步步通过编程搞定结果。

之前还觉得智能穿戴设备有爆款出来才是推理的爆发点,其实是把云端和边缘想多了,忽视了推理本身的任务属性。

聊到推理,又可以和feynman要用的sram联系起来了,但这部分留到先进封装再说吧。