用户头像
Josephliver
 · 上海  

这个有几个原因:
1、单论多模态的数据,全世界字节第一,快手应该可以排第二,这方面openai的sora也无法匹敌,可能metainstagramgoogle用youtube可以再去做。但目前这两家还没有专注于多模态的模型;
2、为什么字节的即梦效果上不如快手的可灵,核心我觉得是一开始即梦走的就是一个轻量化的模型,要求的是推理成本低,生成速度快,且生成的多为秒级别的短视频为主。而快手一开始就是打算重资源投入,我猜测他们应该在数据处理上下了大功夫,生成的都是2分钟左右的视频,生成速度慢,但质量高。
3、其实快手一直在视频渲染这块的算力和芯片储备很厉害,多模态的视频训练涉及到更高维度的算力资源和硬件能力。

@路边边走 :悬赏 ¥99.00我一直搞不懂一件事,为什么可灵在AI视频生成领域的效果看起来好像达到领先地位?
不讨论可灵的价值和未来发展,收入太低、变数太多。
仅讨论现状:
1、论海量视频资源和数据,国内字节、海外也有众多大厂,快手没有独特优势;
2、论技术,这绝对是个技术创新吧?技术比快手强的太...