今天听了阿里巴巴吴泳铭对未来人工智能的判断,心潮澎湃,在中国我们也可以看到这么一个未来巨大投资价值和发展潜力的科技公司,全文如下:
一、吴泳铭 阿里巴巴集团董事兼首席执行官,阿里云智能集团董事长兼首席执行官
各位开发者朋友,大家上午好,我觉得在我开始演讲之前,我想特别感谢一下持整个中国乃至全球科技行业的开发者朋友,就是因为今天是云溪大会的,我们从云栖大会算是10周年,但真正的云栖大会起源于阿里云的开发者大会。我觉得是广大屏幕后面的开发者推动了中国乃至全球的云计算、AI和科技行业的发展,所以在演讲之前我想特别给全球的开发者和我们现在今天到场的开发者致以最高的谢意。
各位领导,各位嘉宾,大家好。那今天很高兴和大家再次相聚在云栖。那每次站在这里,其实我都能感受到,我都能感受到一种扑面而来的这个技术热浪和创新热情。在经历了几年 AI的高速发展之后,AI的演进路线在我们这边已经看得越来越清晰,当前的世界,一场由人工智能驱动的智能化革命刚刚开始。过去几百年,我们看到工业革命通过机械化放大着人类的体能,信息革命通过数字化放大着人类的信息处理能力,而这一次非常不同,因为智能化革命将远超我们的想象,通用人工智能AGI不仅会放大我们人类的智力,还将解放人类的潜能,为超级人工智能 ASI的到来铺平道路。最近的三年,我们已经清晰地感受到它的速度,几年时间AI的智力从一个高中生的水平迅速提升到博士生的水平,还能拿到国际IMO的金牌。AI Chatbot是人类有史以来可能渗透用户渗透率最快的功能,而AI的行业渗透率将超过历史上所有的技术。
我们看到TOKEN的消耗每两三个月会有翻一番的速度。最近一年,全球AI的投资总额将会超过4,000亿美元;未来五年,我们预计全球AI的累计投入金额将超过4万亿美元。这是人类历史上最大的算力和研发投入,我们相信必然将会加速催生更强大的模型,加速AI在各行各业应用的渗透。我们看到实现AGI一个具备人类通用认知能力的智能系统,现在在行业看来已经成为确定性的事件。然而我们觉得AGI并非是发展的终点。而是全新的起点,
AI肯定不会止步于AGI,它将迈向超越人类智能,能够自我迭代进化的超级人工智能。行业称为ASI的系统,我们知道AGI的目标是将人类从80%的日常工作中能够解放出来,让我们专注于创造与探索,而ASI 将作为全面超越人类智能的系统,有可能创造出一批超级科学家和全站的超级工程师。ASI将以我们难以想象的速度解决现在未被解决的科学和工程问题,比如攻克医学难题,发明新材料,解决可持续能源和气候问题,甚至未来的星级旅行。ASI将以指数级的速度推动科技的飞跃,引领我们进入一个前所未有的智能时代。
根据我们的理解和我们的判断,我们认为通往ASI之路大概将经历三个阶段:
1)第一个阶段我们称为智能涌现,特征是学习人,这个阶段大家有非常清晰的感受。过去几十年互联网的发展为智能涌现提供了基础,核心是互联网将人类历史上几乎所有的知识、科学理论、书籍都数字化。这些语言文字所承载的信息,代表了人类知识的全集。基于此,大模型首先通过理解全世界的知识集合,具备了泛化的智能能力,涌现出了我们现在使用最多的通用对话能力,可以初步解决人类的这些问题,理解人类的意图,并逐渐发展出思考多步问题的推理能力。现在我们看到,经过两三年的发展,AI已经逼近人类各个学科测试的顶级水平,比如国际数学奥林奥赛的金牌水平。AI将逐渐具备进入真实世界,解决真实问题,创造真实价的价值的可能性。这是我们看到AI发展过去几年的主线。
2)第二个阶段,称为自主行动,特征是辅助人,在这个阶段,我们现在刚刚处于这个阶段的开端。AI我们看到已经不再局限于语言的交流,而是具备了在真实世界解决在真实世界当中使用和制作工具,自主完成与数字世界和物理世界的交互,对真实世界产生巨大影响。这正是我们当下所处的阶段,那实现这一个跨越的关键,我们看到其实在背后是,首先是大模型的能力越来越强。具备了非常强的 tool use 能力,让大模型有能力去连接所有数字化的工具,完成真实世界的任务。我们看回顾历史。人类加速进化的起点是当我们开始创造和使用工具,现在大模型也一样具备了使用工具的初步能力,通过 tool use,AI可以像人一样地调用外部软件、接口和物理设备,执行复杂的真实世界任务。这个阶段由于AI能够辅助人类极大地提高生产力,我们看到它将快速地渗透到各行各业,比如物流、制造、软件、商业。生物医疗、金融以及科研领域等几乎所有的行业领域。还有一个关键点,我们看到大模型的coding能力的提升。可以帮助人类解决更复杂的问题,并将更多的场景数字化。现在的agent我们看到其实还处于技术的非常早期,解决的主要的任务,我们看到大部分还是一些标准化和短周期的任务,要想让agent能够像人一样解决更复杂、更长周期的任务,这个更长周期并不是一天,也许是一个季度,这样的一个长周期的任务,最关关键的是让大模型的coding能力有一个巨幅巨大的提升,因为如果agent可以自主coding,理论上就能解决无限复杂的问题,像工程师团队一样理解复杂需求,并通过自主完成编程测试,发展大模型的coding,我们认为也许是通往AGI的必经路径。嗯。未来我们判断自然语言就是AI时代的源代码,任何人用自然语言就就能创造自己的agent,你只需输入母语告诉AI你的需求。AI就能够自己编写逻辑,调用工具,搭建系统,完成数字世界几乎所有的工作,并通过数字化接口来操作物理设备。未来也许会有超过全球人口数量的agent和机器人与我们一起工作,对真实世界产生巨大的影响,在这个过程中 AI将能够连接真实世界绝大部分的场景。和数据,为未来的进化创造条件。这一点我认为非常关键。AI连接真实世界的所有原始数据,对AI未来的进化非常关键。
3)第三个阶段,我们称为自我迭代,超越人。这个阶段我们觉得有两个关键要素,这两个关键要素将会促成这个阶段的一个这个阶段跨越一个重要的拐点,那第一个我们觉得刚才已经讲到了,这AI在帮助人类去解决复杂任务的过程当中,它将逐步连接几乎所有物理世界的所有场景和所有数据。目前AI的进步最快的领域,我们看到的是内容创作。数学和coding这样的领域,那我们看到这些领域的特征是什么?AI为什么能够进步的特特别的快?因为这些领域的知识100%是人类定义的,人类定义和创造的,都在文字里面,这些在文字里面的这些知识和数据,代表了这三个领域百分百的原始数据。但是对于其他任何领域,其他领域包括更广泛的物理世界,今天的AI所接触到的更多的是人类归纳之后的知识,缺乏广泛与物理世界交互的原始数据,这些信息是非常有局限的。
我举一个简单的例子,比如说我是一家汽车公司的CEO,我们明年要迭代的一个产品,我们大概率会经常通过无数次的用户调研或者说内部的讨论,来来决定下一款汽车将要具备什么样功能,与竞对相比,我们要实现哪些方面的长板和保留什么方面的能力是差距,那我觉得这些东西我们现在AI其实它要去做还是很难的,核心点在于因为他所获得的数据和知识和这些信息全都是我们的员工,或者我们的合作伙伴去调研来的二手数据。
那如果有一天 AI有机会通过一一夜之间就能够把这款汽车365天生命周期之内,所有用户交互的数据,所有用户与它交互的所有操作,所有用户的投诉,所有用户与他与给公司打电话的反馈,一夜之间读完所有的资资料和数据,他可能创造出来的下一款汽车的定义,会远远超过我们现在通过无数次头脑风暴所所创作出来的下一款汽车的定义。这只是一个人类世界当中一个,我们现在觉得一个例子而已,更何况更复杂的物理世界、科学规律。这远远都是不能够通过人类现知识现在归纳就能够让AI能够理解的。所以我们觉得AI要进入到一个更高的阶段,就需要从直接从物理世界获取更全面、更原始的数据。就像我们看到在自动驾驶的早期阶段。只靠人类的总结去实现自动驾驶,其实我们看到它无法实现很好的效果。新一代的自动驾驶系统大部分采用端到端的训练方法,直接从原始的车载摄像头数据中学习,实现了更高水平的自动驾驶能力。所以即便是我们现在看来,好像相对简单的自动驾驶问题。仅仅依靠人类归纳的知识,其实也无法很好地解决,更何况整个复杂的物理世界和整个社会环境,只是让AI学习人类归归纳的规律。其实是远远不够的。只有让未来的AI系统与真实世界持续互动,获取更全面、更真实、更实时的数据,才能更好地理解和模拟世界。发现超越人类认知的生存规律,从而创造出比人类更强大的智能能力。
我觉得在第三个阶段的第二个关键点我们觉得是一个非常重要的阶段,我们称为self learning,也就是让模型能够自我学习。随着AI渗透到更多的物理世界场景,理解更多物理世界的数据,AI模型和agent能力,我们相信也会越来越强,未来他们将有机会为自己模型的升级,为自己的升级搭建模型训练的几架构,为自己的模型升级,优化数据流程和升级自己的模型架构,从而实现self learning。这会是AI发展的关键时刻。随着能力的持续提升,未来的模型将通过与真实世界的持续交互,获取新的数据,并接收实时反馈,借助强化学习与持续学习机制,自主优化,修正偏差,实现自我迭代与智能升级。每一次交互都是一次微调,每一次反馈都是一次参数优化。当经过无数次的场景执行以及与真实世界结果的反馈循环,AI将自我迭代出超越人类的智能能力。一个早期的人工智能系统将会成型,所以如果我们的科技一旦跨过刚才所描述的这个基点,人类社会就会像按下了加速键。科技进步的速度将会超越我们的想象,新的生产力爆发将推动人类社会进入崭新的阶段。这条通往超级人工智能的道路,在我们眼前正在日渐清晰。随着AI技术的演进和各行各业需求的爆发。我们觉得AI也将催生整个it和科技产业的巨大变革。
我们的第一个判断:大模型是下一代的操作系统。并不是说大模型替代了Windows或者说Linux这样的操作系统,而是觉得大模型以及相关的这样的系统,在整个物理世界和数字世界的交互当中将承载现有操作系统的地位。未来几乎所有链接真实世界的工具接口都将与大模型进行链接,所有用户需求和行业应用将会通过大模型相关的工具执行任务。LLM将会是承载用户、软件、agent与计算资源交互调度的最核心的中间层。成为AI时代事实意义上的OS。做一些简单的类比,自然语言可能就是未来的AI时代的编程语言,agent就是未来的新的软件。大模型通过MCP这样的接口链接了各类的工具和agent,类似PC时代的总建接口,agent之间又通过 a to a 这样的协议完成多agent之间的作和交互,类似我们现在各个软件之间交互的API接口。所以大模型将会吞噬软件,大模型作为下一代的操作系统,将允许任何人使用自然语言创造无限多的应用,未来几乎所有与计算世界打交道的软件。可能都是由大模型产生的agent,而不是现在由各个软件公司创作的商业软件。现在的开发者将从几千万变成数亿规模,数亿甚至数十数十亿的规模。以前由于软件开发的成本问题,我们看到只有少量高价值的场景才会被工程师开发出来,变成商业化的软件系统。所有终端用户都可以通过大模型这样一个准备数字化。同时我们也判断模型的部署方式也会多样化。它将运行在所有的计算设备上,现在主流的通过调用API的方式来使用模型,我们看到其实只是AI发展的初级阶段。做个类比,非常像非常早期的时候,甚至没有PC时代的主机时代的一个分时复用阶段,当时每个人只有一个memory的一个terminal去连接大型主机做分时复用。但是我们看到这种方式其实它无法解决我们现在很多在系统当中非常关键的问题,比如无法解决数据持久化,缺乏长期记忆,实时性也不够,隐私也无法解决,可塑性还不够。未来我们相信模型将运行在所有计算设备当中。并具备可持久记忆,可塑性,能够端侧与云端联动的运行状。甚至可以随时更新参数,自我迭代,类似我们今天的OS,运行在各种环境之中。
正是基于这个判断,阿里巴巴做了一个重要的战略选择,通义千问选择开源路线,我们的目标是打造AI时代的安卓系统。我认为在LLM时代,开源模型创造的价值和能够渗透的场景将会远远大于闭源模型,我们坚定的选择开源,就是为了全力支持开发者生态,与全球所有开发者一起探索AI应用的无限可能。
我们的第二个判断,超级AI云就是下一代的计算机,大模型是运行于AI cloud 之上的一个新的OS。这个OS可以满足任何人的需求,每个人都将拥有几十个甚至上百个agent,这些agent24小时不间断地工作和协同。需要海量的数据计计算资源,数据中心内的计算范式我们看到也在发生革命性的转变,从CPU为核心的计算正在加速转变,转变为以GPU为核心,以大模型驱动的AI计算。新的AI计算范式需要更稠密的算力,更高效的网络。更大的集群规模。这一切都需要充足的能源,全站的技术,数百万g的GPU和CPU协同网络、芯片、存储、数据库在数据中心内高效地运作,并且能够24小时的处理全世界各地的需求,这需要超大规模的基础设施和全站的技术积累,只有超级AI云才能够承载这样的海量需求。我们觉得未来全世界也许只会有5~6到6个超级云计算平台,在这个新的时代,AI将会替代在能源的地位成为最重要的商品,驱动千行百业每天的工作,绝大部分AI能力将以TOKEN的形式在云计算网络上产生和输送,我们觉得TOKEN就是未来的电。
在这个崭新的时代,阿里云的定位我们要做一个改变,阿里云的定位是全栈人工智能服务商,我们将提供世界级领先的智能能力,以及遍布全球的AI云计算网络。向全球各地的开发者提供开发者生态友好的AI服务。1)首先我们觉得我们拥有全球领先的大模型,通义千问。通义千问开源了300多款模型,覆盖了全模态、全尺寸,是中国应用最广泛而且最受全球开发者欢迎的开源模型。截至目前,通义千问全球下载量超过6亿次。衍生模型已经超过17万个,是全球第一的开源模型矩阵。通义千问可以说是渗透全球计算设备最广泛的大模型。同时阿里云还提供一站式的模型服务平台百炼,支持模型的定制化以及agent的快速开发,同时提供agent运行环境及灵码coder这样一系列的开发者套件,让开发者可以方便地使用模型能力和创建使用agent。2)其次,阿里云运营的中国第一、全球领先的AI基础设施和云计算网络,是全球少数能够做到软硬件垂直整合的AI云计算平台,在硬件和网络层面,阿里云自研的核心存储系统网络架构、计算芯片构成了阿里云大型计算集群当中最坚实的底座。阿里云正在全力打造一台全新新的AI超级计算机,它同时拥有最领先的AI基础设施和最领先的模型,可以在基础设施架构设计与模型的架构设计上协同创新,从而确保在阿里云上调用和训练大模型能够达到最高的效率,成为开发者最好用的云。
AI行业的发展速度远超我们的预期。行业对AI基础设施需求也远超我们的预期,我们正在积极地推进3,800亿的AI基础设施的建设,并计划将会追加更大的投入。从我们现在看到AI行业的远期发展规律,以及现在客户的需求的角度来看,跟,我们做的远期规划,为了迎接ASI时代的到来,对比2022年这个生成式AI的元年,2032年阿里云全球数据中心的能耗规模将提升10倍,这是我们的一个远期规划。我们相信通过这样的饱和式的投入,来能够推动AI行业的发展,迎接ASI时代的到来。所以我觉得如果ASI时代到来,我们很多人包括我们团队内部思考,在开会思考的时候也在想说ASI未来的AI。AGI越来越强,甚至ASI超越人类的智能的能力的AI系统诞生,那我们人类和AI将如何相处。我觉得我们对未来充满乐观,就是超级人工智能到来之后,人类和AI是一个崭新的一种协同方式,人类和AI将会有一个,我们类似,我们现在我们在工作当中,程序员可能已经感念感受到了。我们可以下一个指令,通过AI这样的工具,让它晚上给我们12个小时,就能创造出一个我们需要的一个系统。那我们就觉得,从这里我们看到了一个未来人和AI怎么样去共同协同的一种早期的雏形,所以我们觉得从 AI coding 到 AI working,未来每个家庭、工厂公司都会有众多的agent和机器人24小时的为我们服务,也许未来每个人都需要使用100张的GPU芯片为我们工作。所以我对未来充满了乐观。正如电曾经放大着人类物理力量的杠杆,ASI将指数级地放大人类的智力杠杆。过去我们消耗10小时的时间来获得十小时的结果,未来可以让我们的十小时产生持以十倍、百倍的杠杆。
回顾历史,每次技术革命解锁更多生产力之后,都将会创造更多的新需求,人类也将会变得比历史上任何时候都强大,而且将会比任何时候都会繁忙。最后我想强调一切才刚刚开始,AI将重构整个基础设施软件和应用体系,成为真实世界的核心驱动力,掀起新一轮的智能化革命。阿里巴巴将持续投入,与合作伙伴和客户一起让AI深入产业,共创未来。祝大家度过一个充实愉快的云栖大会。谢谢大家!