首先要说的是,AI科技不是互联网科技,是生物进化,互联网是后来者可以通过抄路径反超,但AI 是先行者直接垄断进化基因。
那种曾经的互联网时代的“老登”玩法,等别人探路 → 模式成熟后通过模仿,买流量 → 可以后发先至的超车,在AI时代不仅会失效,甚至可以说是一种主动选择淘汰的自杀式操作。
因为AI科技跟任何的科技都不一样,有极强的马太效应,不仅是传统的重资产算力投资与训练数据的规模效应的问题,更重要的是用户反馈也是模型能进化的重要一环,相当于持续的监督学习,反向为模型投喂高质量数据,形成自我强化闭环。
举个最简单的显性例子,GPT经常给出两个风格迥异的答案,让你选择,这就是显性的通过用户反馈进行监督学习。
而隐性的反馈则在后台数据中——你保留的图片、收藏的视频、停留的时长,甚至是输入时的提问与修改方式,都会成为模型迭代的养分。
也就是变成了:
头部模型 → 用户越多 → 反馈数据越丰富 → 理解更准、更好用 → 虹吸更多用户 → 进化速度甩开对手一个身位。
也就是如果以互联网时代的“老登”玩法,不急的观望 → 让别人先试错 → 等成熟了再抄作业。结果就是别人把路探通的那一天,就是你永远追不上的那一天。
落后者只会陷入恶性负反馈循环:模型体验越差→用户越少→反馈数据越匮乏→模型优化越滞后→体验更差。这个差距不是线性拉大,是指数级拉大。
而且这个问题现在还不明显,但很可能再过 1~3 年会爆炸式显现,而且会彻底锁死后来者的机会。
因为公开互联网文本、图片、视频这些 “天然语料” 是有限的,会被榨干的。
一旦头部模型把全网能爬的,能用的都训过一遍,天然语料枯竭后,真正的燃料变成 ——用户实时反馈。
也就是说现在是第一阶段:
大家还能靠买算力、优化模型架构、爬公开数据勉强追一追。
一旦进入第二阶段:
公开数据被训练饱和,新数据主要来自头部产品的用户交互,也就是说训练数据源就会彻底锁死后来者的能力。
而到了第三阶段:
模型将实现自我闭环进化,就像当年的AlphaGo一样,能够通过自我对抗、自我训练完成迭代,再结合用户交互持续优化。到那时,后来者别说追赶,就连“喝汤”的机会都没有的。