国外几个bench上我没看过,但是国内应该有私人测评但是不保证公正性,我个人用它跑了一些常见的代码测试比如魔方旋转,迷宫寻路,函数计算器等,做的不错。字节的doubao1.6目前比qwen3使用体验是略胜一筹。
国外几个bench上我没看过,但是国内应该有私人测评但是不保证公正性,我个人用它跑了一些常见的代码测试比如魔方旋转,迷宫寻路,函数计算器等,做的不错。字节的doubao1.6目前比qwen3使用体验是略胜一筹。
这两天Kimi万亿参数K2模型开源,关注度远不如年初的DeepSeek V3,本质上是因为当前的大模型已经“够用”了,接下来的优化有更好,没有问题也不大。从底层大模型的角度来说,差异化不大,未来主要看商业化。可以理解为AI技术足够成熟,但是大家都...