文 | 定焦One,作者 | 王璐,编辑 | 阿伦
近期,一则“悬而未决”的竞购在AI圈引发轰动。
靠AI搜索成为行业独角兽的Perplexity称要以345亿美元的价格收购谷歌的Chrome浏览器,这一报价几乎是Perplexity自身估值(180亿美元)的两倍。想买Chrome的还不止Perplexity,另一家AI明星企业OpenAI,此前也透露出了收购意愿。不过,谷歌方面暂时没有接受任何报价。
看到这个新闻,很多人不由得发出疑问:浏览器,这个“老掉牙”的互联网产品,怎么又重新“性感”起来了?
不止国外,国内互联网大厂近一年来也都围绕浏览器做文章。腾讯、阿里、360,分别押宝QQ浏览器、夸克浏览器、360AI浏览器,想要打造“AI时代的超级入口”。
有必要讨论:当AI遇上浏览器,会发生什么化学反应?AI浏览器,为什么能成为大厂和创业公司在AI时代的战略重心?这场争夺赛,谁最有可能占得先机?
AI浏览器的两大流派:界面、功能各不相同什么是AI浏览器?
可以理解为将AI融入到传统浏览器中,具备智能搜索与问答、内容理解与生成摘要、自动化任务执行、多模态交互体验、个性化推荐等功能,实现从“工具”到“智能”的转变。
很多从业者认为,AI浏览器和Agent一样,都属于大势所趋,但此刻大家围绕AI浏览器的谜团也有很多。
目前各家公司在AI浏览器的技术路线与产品形态上有着明显区别,究竟何种形态才能称之为AI浏览器?它和Chatbot、Agent在功能和技术上又有何区别?
先看竞争比较激烈的国外市场。
谷歌和微软这两大科技巨头均推出了“AI浏览器”,前者让Chrome浏览器直接集成了AI能力,从而对用户搜索内容进行总结提炼。后者则在原有Edge浏览器的基础上推出了Copilot模式,启用该模式后,Edge浏览器的新标签页会变成一个简洁的输入框,用户可以直接和AI对话。
Edge中开启Copilot模式
但与传统版本相比,两家AI浏览器的整体界面形态变化不大。
从事Agent应用算法方向研究的资深人士赵江杰表示,谷歌和微软均采用的是集成技术路线打造AI浏览器,即把AI作为独立模块融入到传统浏览器架构中,可以简单理解为,在管理网页的基础上,加上了AI能力和Chatbot式交互。
另一种为AI原生路线,多为AI初创公司采用。
比如Perplexity的Comet、TheBrowserCompany的Dia浏览器以及FellouAI的同名浏览器,“这些产品在开发时便基于AI原生架构打造,和集成模式不同,它是在Chatbot式交互和AI能力的基础上,加入网页管理功能。界面设计大多采用对话框形式,凸显了AI交互的核心地位。”赵江杰表示。
FellouAI页面
再看国内,目前公开宣布研发AI浏览器的主要为互联网大厂,“AI六小虎”为代表的大模型初创公司尚未公布相关动作,赵江杰透露,除夸克外,国内大厂的AI浏览器基本都采用的是集成模式。
除了界面存在差异,各家AI浏览器的功能侧重点也不太一样,区别在于智能化水平。
目前大多数AI浏览器可以理解为非自主型,较传统浏览器相比,AI功能体现在能完成网页总结、生成框架图、推荐相似网页、网页翻译、文字续写、语音助手。
比如360AI浏览器比较突出的功能有总结概括长视频内容,快速梳理出重点概念并生成脑图。阿里的夸克浏览器支持在文字之外制作PPT、生成图片等多模态能力。
总体来看,国外的Chrome以及国内绝大多数的AI浏览器,基本都以上述信息交互与内容生成功能为主。
另一类偏自主型AI浏览器,能自主完成多网页读取与分析、自主操作复杂任务,以及预测用户的个性化需求。
比如国外的Comet、Dia可跨网站执行多步任务操作,FellouAI更是号称“全球首个行动型浏览器”,用户给出“在亚马逊搜RTX4060显卡,并按评分加购最高型号”的指令,FellouAI会自动执行“登录-筛选-比价-下单”整个过程。
目前自主型AI浏览器是AI初创公司主打的功能方向。
在赵江杰看来,自主型AI浏览器更加智能,不过他也强调,即便自主型AI浏览器看起来做到了智能化,但功能也比较基础,目前成熟场景主要有三种:多标签页信息对比总结、自动搜索并回复社交媒体发帖、监控Gmail邮件反馈以及跨境电商自动报价等商用场景。总之,是辅助用户处理一些重复性的工作。
Agent带飞浏览器在互联网早期,因为具备搜索、社交、购物等多样功能,浏览器曾是用户上网的主要入口。
2000年前后,微软的IE浏览器(Internet Explorer,后被Edge取代)凭借Windows系统预装垄断市场,份额一度高达95%。到了移动互联网时代,随着苹果硬件畅销、谷歌安卓系统被广泛使用,苹果的Safari浏览器和谷歌的Chrome浏览器不断蚕食IE浏览器的地盘。
根据市场调查机构 Statcounter 最新公布的数据,在全球所有平台中,Chrome、Safari、Edge的市场份额分别为:67.9%、16.2%、5.1%。在国内,除了三巨头之外,360浏览器、QQ浏览器、UC浏览器也有一定的市场份额。
然而,这些年浏览器们的日子并不好过。因为在移动时代,浏览器的入口地位被APP严重削弱,只有在访问陌生网站、临时查信息等场景下,浏览器还有一点存在感。
到了AI时代,本来以为,被Chatbot接替了部分功能的浏览器,地位会更加岌岌可危。然而,随着Agent的爆发,浏览器彻底“翻红”了。
石榴AI首席研究员、大模型从业者张恒认为,浏览器被重新重视,主要是因为它的Agent入口地位。
据了解,大模型的产品形态由简单到复杂可分为:Chatbot(对话机器人)、Copilot(智能助手)、单智能体和多智能体,后两者被统称为Agent。如今以ChatGPT为代表的Chatbot类产品,弊端越来越明显,比如:用户能否提出明确指令,直接影响回复的准确度与完成度,同时Chatbot自身缺乏长期记忆与连续性,这在一定程度上降低了大模型的智能水平。
相比之下,Agent则像个有自主意识的智能助手,能帮用户琢磨事、做计划、动手干活、规划行程、完成报告等等,且具有自主性和通用性。
而这些功能的实现,绕不开浏览器。
赵江杰表示,目前Agent的开发场景主要有两种,一种是垂直领域,比如完成做视频这种单一任务,只需生成视频片段并做拼接,操作比较简单,或者专门针对某一企业,只服务于公司内部系统,不用跨其他平台。
另一种则是toC场景,比如常见的网购、订票,这种涉及可视化界面和跳转到其他网站的功能,都得依靠浏览器。
简言之,浏览器是Agent的“舞台”,帮它在不同应用之间进行操作,从而完成访问登录网站、浏览电脑文件等复杂任务。“大模型像人的脑子,Agent是手和脚,浏览器就是手脚和脑子一起干活儿的地方,在执行一项复杂指令时,需要大模型、Agent和浏览器三者协作完成。”他表示。
以购买一双跑鞋为例,用户下达这一指令后,大模型作为大脑接收、理解“买跑鞋”的任务,Agent作为手脚行动将其拆解为“比价”“购买”等多个子任务执行,而其在操作时需要通过浏览器打开淘宝、京东这些网站。
赵江杰认为,Agent的关键在于高效完成任务并交付结果,而浏览器作为本地环境,天然具备访问用户本地数据和操作权限的能力,能直接读取用户的登录状态、已安装的插件、本地存储的数据等必要信息,从而显著提升Agent完成任务的质量和准确性。
而且,将浏览器作为Agent入口,用户无需将账号密码等个人信息交给第三方AI工具,降低了泄露用户隐私的风险。
总之,如果Agent有未来,浏览器也会有未来。
AI浏览器的喜和忧浏览器不仅是Agent入口,在整个AI生态中也占据着重要位置。
张恒表示,浏览器减少了AI需要适配的终端类型,是AI应用的统一入口,比如,浏览器使Copilot的功能开发更聚焦,用户无需在多个应用或设备间切换,提升了使用便捷性。
意识到了浏览器对于AI产品的独特价值,Perplexity等AI独角兽,不仅自研AI浏览器,还要花高价收购Chrome。综合从业者的说法,竞购的目的主要有两点。
一是抢市场份额。
据第三方数据平台Statcounter统计,截至2025年7月,Chrome在全球浏览器市场的份额为67.9%,拥有超过30亿活跃用户,可见其主导地位。
在张恒看来,海外的浏览器三巨头,Edge主要适配Windows系统,Safari依托苹果设备的封闭生态,而Chrome凭借跨平台兼容性、丰富的插件生态和与谷歌服务的深度整合,市占率最高,这就意味着AI初创公司只要掌握了Chrome、占有了Chrome产品,也就相当于拥有了大批用户,比自己做浏览器从零积累要快得多。
而且,做一个具有强兼容性和丰富生态的浏览器,复杂度等同于操作系统。“想要再自研一个类似于Chrome的浏览器难度巨大,市面上大多数浏览器都为Chrome(Chromium)套壳。”赵江杰表示。
二是通过浏览器积累用户数据。
用户在浏览器上的每一次搜索、每一次停留、每一个纠错反馈,都是珍贵的数据信息,“研发团队不仅能及时根据用户反馈优化AI模型,也可以用来改进AI产品,让产品变得越来越‘懂’用户。”
不过,与传统浏览器相比,AI浏览器目前也有明显弊端,一是会和Chatbot一样出现“幻觉”,二是生态尚未成熟。
所谓“幻觉”,就是AI会一本正经地胡说八道,编造出看似合理但根本不存在的信息,这主要是由于浏览器的信息生成、内容总结功能,都依赖大模型完成。换句话说,幻觉的根源是大模型,AI浏览器自身无法降低幻觉。
生态未成熟可以理解为配套问题,“AI浏览器要理解网页,要么靠截图,要么靠解析DOM树(网页的结构化表示方法),但截图会漏掉如下拉菜单这类隐藏元素,解析DOM树又很耗费计算资源。而且现在的图像识别技术,还没法像人一样顺畅地操作复杂网页,也会触发验证码之类的安全验证,这些都让AI浏览器用起来不够顺畅。”赵江杰表示。
以上种种问题共同导致AI浏览器在实际应用中面临效率低、可靠性差等挑战,限制了其在复杂场景下的广泛应用。
在使用习惯上,AI浏览器也面临着不小的挑战。
一位从业者认为,传统浏览器的核心操作逻辑是“用户主动搜索+筛选”,老用户已经习惯了在地址栏输网址或输入关键词、点链接跳转,相比之下,AI浏览器更像“主动服务”,用户能否适应这一转变也不一定,这也是传统搜索公司面对AI浏览器这块“香饽饽”时格外谨慎、不敢贸然推出颠覆性的AI浏览器的原因,即便是推出了AI浏览器,也保留着传统浏览器的操作界面。
目前,从业者更倾向于构建“AI浏览器—Chatbot—Agent”的协同生态,实现各司其职的高效分工,三者的功能边界与应用场景有所区分,AI浏览器提供信息检索和展示,方便用户快速获取信息;Chatbot一方面侧重获取信息的基础功能,另一方面完成文本生成、知识问答等更细节性的任务,但不执行实际操作;Agent则是思考+操作,侧重自动化办公、数据分析等复杂任务。
比如用户想做一个假期带娃出游计划:可以用AI浏览器爬取OTA平台、景区官方等平台信息,筛选出适合带娃的景点以及路线,然后自己做规划;也可以让Chatbot给出某地某项目适合多少岁的孩子玩等具体规划,但自己买票;或者直接用Agent给出整体规划并直达交付链条,即用户接收确认景点门票的订单链接。
简言之,同样是做假期带娃出游计划,AI浏览器负责给用户整理信息包,Chatbot给用户提供详细的建议和文案,Agent不仅给建议,还帮用户进行预约、下单,三者的核心差异在于“提供的服务深度”和“是否能自主操作”。
不过,虽然浏览器已在AI时代展现出独特价值,但仍然有很多问题等待解决。
而眼下这场轰轰烈烈的“Chrome争夺战”,最终的赢家,不仅会重写浏览器的市场格局,更有可能主导AI时代的数据主权和技术标准。
回到故事原点,美国司法部以反垄断的理由,竭力想让谷歌卖掉Chrome,但“手握重器”的谷歌,一定知道Chrome的价值,也一定会尽力使Chrome免于分拆。
那些想通过收购Chrome一飞冲天的AI公司,恐怕还得继续眼馋。