别用互联网时代的老登思维,分析AI的未来发展

用户头像
泡沫艺术家
 · 天津  

首先要说的是,AI科技不是互联网科技,是生物进化,互联网是后来者可以通过抄路径反超,但AI 是先行者直接垄断进化基因

那种曾经的互联网时代的“老登”玩法,等别人探路 → 模式成熟后通过模仿,买流量 → 可以后发先至的超车,在AI时代不仅会失效,甚至可以说是一种主动选择淘汰的自杀式操作。

因为AI科技跟任何的科技都不一样,有极强的马太效应,不仅是传统的重资产算力投资与训练数据的规模效应的问题,更重要的是用户反馈也是模型能进化的重要一环,相当于持续的监督学习,反向为模型投喂高质量数据,形成自我强化闭环。

举个最简单的显性例子,GPT经常给出两个风格迥异的答案,让你选择,这就是显性的通过用户反馈进行监督学习。

而隐性的反馈则在后台数据中——你保留的图片、收藏的视频、停留的时长,甚至是输入时的提问与修改方式,都会成为模型迭代的养分。

也就是变成了:

头部模型 → 用户越多 → 反馈数据越丰富 → 理解更准、更好用 → 虹吸更多用户 → 进化速度甩开对手一个身位。

也就是如果以互联网时代的“老登”玩法,不急的观望 → 让别人先试错 → 等成熟了再抄作业。结果就是别人把路探通的那一天,就是你永远追不上的那一天。

落后者只会陷入恶性负反馈循环:模型体验越差→用户越少→反馈数据越匮乏→模型优化越滞后→体验更差。这个差距不是线性拉大,是指数级拉大。

而且这个问题现在还不明显,但很可能再过 1~3 年会爆炸式显现,而且会彻底锁死后来者的机会。

因为公开互联网文本、图片、视频这些 “天然语料” 是有限的,会被榨干的。

一旦头部模型把全网能爬的,能用的都训过一遍,天然语料枯竭后,真正的燃料变成 ——用户实时反馈。

也就是说现在是第一阶段:

大家还能靠买算力、优化模型架构、爬公开数据勉强追一追。

一旦进入第二阶段:

公开数据被训练饱和,新数据主要来自头部产品的用户交互,也就是说训练数据源就会彻底锁死后来者的能力。

而到了第三阶段:

模型将实现自我闭环进化,就像当年的AlphaGo一样,能够通过自我对抗、自我训练完成迭代,再结合用户交互持续优化。到那时,后来者别说追赶,就连“喝汤”的机会都没有的。