$第四范式(06682)$ 对比这个链接网页链接的内容,还记得戴文渊博士几年前对AI大语言模型的评论和判断吗?惊人的预判和精准指出痛点,第四范式一直前进在正确的道路上!
更关键的是,戴文渊博士曾经强调,第四范式10多年最珍贵的积累优势一一曾经在企业AI应用领域中经历过的各种各样的失败经验!
这才是一个顶尖科学家的真知灼见,前沿AI科技研发的最高等级的认知!
这个链接中的2个AI绝顶高手正在准备开始做的事,多年前,就已经是第四范式一直坚持坚守的AI发展的正确道路了!
网页链接
摘选:
问题的核心:到目前为止,科学AI的进步,几乎都来自于在互联网上训练的模型。
但互联网,尽管看起来包罗万象,实际上是有限的。据估计,整个互联网有价值的文本数据,大约是10万亿个token。一个英文单词差不多就是一到两个token。这个数字听起来很大,但在过去的几年里,最顶尖的AI模型,已经把这些数据彻彻底底地“吃干抹净”了。
数据没了,增长的引擎就要熄火了。
继续在更大的模型、更多的参数上内卷,边际效益会越来越低。
Fedus在接受《纽约时报》采访时说得更直白,他认为,AI的主要目标根本不是自动化白领工作。
AI的主要目标,是加速科学。
他觉得,现在硅谷谈论大语言模型未来的方式,在“智力上很懒惰”。
他和Cubuk想做的,是回到贝尔实验室和IBM研究院的那个黄金时代,那个将物理科学视为核心使命的时代。Cubuc也补充了一个非常关键的观点:
聊天机器人不可能光靠推理几天,就得出惊天动地的科学发现。人类也做不到。
科学家们在找到真正有价值的东西之前,需要进行无数次的实验,经历无数次的失败。
科学的本质,是提出假说,然后动手实验,从结果中学习,无论结果是成功还是失败。
而这个“动手”的过程,恰恰是目前所有AI模型都缺失的环节。