1、头部大模型厂商核心迭代
智谱全栈模型升级:近两个月头部大模型厂商围绕Agent能力深度升级,智谱在1月26日发布全球首个兼具深度研究与实际操作能力的AutoGLM沉思模型,这是其设备操控类智能体的重要升级,目前已在智谱清言全端免费开放,未来还将推出虚拟机版本强化落地能力。同时智谱同步更新全栈大模型技术体系,包括GLM 4 Air基座模型,性能比肩Deepseek 1;GLM Z1 Air推理模型,速度提升近8倍;以及具备长上下文推理能力的GMZ 1 Remission沉思模型,该模型将于4月14日全面开源。此外,智谱AutoGLM系列在Agent Bench评测中拿下5个测试环境的全优成绩,其GUI智能体GMPC以9B参数超越GPT 4O。
Minimax Agent能力升级:Minimax聚焦Agent能力完成深度升级,在1月20日发布第二代智能体产品MiniMax Agent 2,将产品定义为AI原生工作台,重构人机交互逻辑,实现从人适应Agent到Agent主动适应人的转变,可主动进入工作环境、理解文件流程,自主完成任务拆解、执行与跟进,实现从“会思考”到“能干活”的升级。该产品依托Lightning Attention技术和M2.1模型积累,具备全栈工程能力,目前已在内部100%落地使用,形成模型迭代、业务落地、反馈优化的完整闭环。其API价格仅为Cloud Sonic 4.5的8%,性价比优势突出。
Agent行业发展新趋势:当前大模型行业核心趋势已从“会聊天”的Chat范式全面转向“能办事”的Agent范式,头部厂商不再单纯追求参数规模,而是聚焦原生Agent能力打造。a. Kimi在1月27日发布并开源万亿参数的MoE多模态模型Kimi 2.5,这是Kimi目前最强大的模型,在多个开源榜单中位列第一,具备Agent任务代码生成、图像处理、视频处理等能力,核心创新为集群式作战能力,可最多调度100个专业Agent分身并行任务,最多完成1500次工具调用,还新增视频内容直接识别理解能力,降低AI交互门槛;b. 同日Deepseek发布并开源Deepseek OCLR 2模型,通过贴近人类阅读逻辑的视频编码技术,让AI精准读懂复杂版式的文档、表格与公式,补齐视觉信息处理短板,为Agent能力落地提供工具支撑;c. 开源项目CloudBot爆火,拥有高系统权限,可连接多平台并自主完成多项操作,已成为端侧Agent核心。整体来看,Agent行业已实现从思考到行动再到反思的能力闭环,正朝着端云协同、多工具融合、场景深度适配的方向发展。
2、头部厂商竞争格局与路径
差异化竞争格局显现:当前大模型行业头部厂商已呈现明显差异化竞争态势,同时行业集中度持续提升,留在市场中的模型厂商数量不断减少,基础模型数量逐步收敛,模型在真实场景的应用效果成为核心评价标准。
核心厂商差异化优势:不同头部厂商依托自身优势形成差异化竞争力:智谱凭借全栈大模型技术自主可控及AIGC技术领先优势,通过从基座模型到智能体框架的全链路布局配合核心模型开源策略,快速构建行业生态;Minimax依托高性价比的API服务、强大基座模型能力及AI原生工作台落地,形成技术-产品-内部落地反馈-生态输出的闭环,在ToB、ToC及开发者生态中占据优势;Kimi以开源为核心抓手,其最新模型K 2.5凭借集群式能力和多模态优势立足;Deepseek聚焦细分技术领域突破,从大模型推理、OCR视觉处理到2026年春节即将发布的V4模型(coding能力实现跃迁),补齐行业技术短板。
互联网大厂AI布局方向:国产大模型与海外的差距持续收窄,且在Agent细分领域已实现局部领先。头部厂商形成三大发展共识:技术上升级轻量化高性能基座模型、打磨Agent核心能力;产品上转向场景化落地;生态上构建开放生态或产业渗透,同时推进全球化布局。阿里、字节、百度、腾讯等大厂依托自身优势布局AI:腾讯2025年下半年以来持续蓄力,通过调整组织架构、招聘高质量AI人才强化布局,其3D模型和世界模型表现可圈可点,后续微信Agent等值得期待;字节凭借流量突围,推进豆包与火山引擎合作、豆包引入抖音商城;阿里依托通义千问APP、平头哥等构建全栈AI生态。
3、模型层竞争洗牌与入口战
模型层竞争焦点转移:1月大模型模型层竞争格局出现剧烈洗牌,Kimi 2.5、Deepseek OCR、千问3 Max Thinking等密集发布,将竞争焦点从通用对话性能推向高阶推理、多模态、Agent MAS和工程效率,国产模型的能力和产品态正加速向硅谷前沿收敛,甚至局部对标。谷歌、互联网巨头等在模型工程化落地、流量入口及资本开支上的优势,让大模型初创公司在高阶推理、多模态及Agent生态领域压力明显上升,智谱、Minimax等厂商的成长路径将进行适配转向,既受益于国产模型估值逻辑的强化,也需直面大厂竞争带来的挑战。
大厂C端入口争夺战:当前C端超级入口之战正从应用层下沉到模型层,掌握高频流量入口与稳定推理成本的厂商,其盈利预期和估值锚正被反向改写,头部大厂的布局尤为关键:a. 腾讯:1月25日宣布2月1日启动新春活动,发放10亿现金红包,单用户最高可获万元,核心在于推动元宝APP下载与活跃量;同时布局3D和世界模型,通过AI小程序成长计划为开发者提供免费会员大模型Token和云资源,构建Agent应用入口与生态壁垒,以入口侧DAU为会员模型的推理调用和数据回流提供支撑。b. 字节豆包:火山引擎成为2026年春晚独家AI云合作伙伴,豆包深度参与春晚互动,春节期间AI应用流量有望达到700亿次级别的互动峰值;目前豆包日调用Token超50万亿,MaaS服务覆盖80%头部消费品牌、90%车企、80%头部券商,其推理需求已成为AIDC和云厂商的刚性增量,字节既在C端入口展开竞争,也通过MaaS抬高行业对推理成本、模型性价比及工程稳定性的要求。c. 阿里千问:1月15日千问APP宣布全面接入淘宝、闪购、飞猪、高德、支付宝等阿里生态,实现衣食住行多场景体验并向所有用户开放测试;千问APP自11月中旬改版后仅两个月,MAU便接近2000万,接入电商生态可进一步提升转化率;同时千问3 Max Thinking这款高阶推理模型与千问APP形成强场景绑定,阿里在模型、云应用及电商闭环上已形成高度一体化结构,提前布局商业兑现。
4、国内外大模型厂商业绩展望
国内厂商业绩与估值:智谱和Minimax是目前市场上最纯的模型标的代表,其中智谱在大模型初创公司中收入体量和增速位居前列,2025年预计收入7-8亿元,2027年预计达25-38亿元,但2027年仍难扭亏,核心原因是模型研发、算力及交付投入较高。Minimax增速更激进,收入弹性更高,2025年收入近3亿元人民币,2026年预计达2.3亿美元,其在语音、音乐多模态、数字员工、AI视频生成、ToC应用等领域布局突出,与智谱下游市场定位存在本质区别,市场更愿给予其接近OpenAI和Anthropic的估值溢价。智谱政企客户收入占比不足1/5,收入大头来自互联网厂商。此外,智谱、Minimax与阿里、腾讯等大厂相比,在C端及云基础设施上存在劣势,2026年C端超级流量入口竞争中劣势会被放大;不过独立大模型厂商可依赖API、爆款C端应用及政企头部客户落地发展。
海外厂商业绩上修及影响:Anthropic将2026年收入预测上调20%至180亿美元,2025年收入预计80-100亿美元,2027年预计突破500亿美元,这一上调信号显示大模型市场规模持续扩大且增速超预期,也可能推动OpenAI被动上修收入预期。2025年大模型语言市场总规模约250-300亿美元,其中coding占比超一半。Anthropic收入上修将强化AI coding和Agent作为主线赛道的地位,海外头部厂商在相关产品上的推进,会进一步强化市场对编程自动化及AGI是下一轮收入爆发点的预期,国内厂商也将在coding、编程自动化及Agent能力上持续提升。此外,大模型发展带来推理Token和算力需求持续外溢,将利好国内外上游硬件厂商、算力及AIDC领域,目前国内推理量已进入全球前三。
5、2026年模型层机会与约束
技术发展四条核心主线:模型训练对电网强度要求极高,美国电网已无法支撑大规模模型训练,这也是马斯克布局太空算力的原因,AIDC和云厂商被视为本轮AI入口战的最确定性受益者。2026年模型层竞争围绕四条核心主线展开:a. 高阶推理能力:从千问3MAX THINKING、Deepseek下一代模型、kimi K二等布局可见,市场预期该能力能在金融、科研、复杂工业设计领域打开高阶价值空间;b. 原生多模态:Deepseek OCR 2、Kimi多模态、千问Omni等将多模态视为数据基础设施与交互界面,服务C端同时提升训练数据质量;c. 多智能体协同(MAS):行业共识2026-2028年将从单一助手过渡到多Agent协同执行复杂任务,但MAS在成本、稳定性等方面仍存较大不确定性,处于探索阶段;d. 工程效率与推理成本:Deepseek V3、Gemini在推理成本控制上优势显著,kimi在token消耗效率上仍有提升空间。独立厂商智谱、Minimax需高强度研发投入才能在高阶推理等领域实现领先。
行业发展潜在风险因素:2026年模型层发展需关注三类潜在风险:a. 互联网大厂入口战的赢家通吃风险:该风险相对较低,春节AI红包大战是入口战加剧的体现,若腾讯、阿里的豆包、千问在2026-2027年形成1-2个超级入口+补充入口的稳定格局,C端用户习惯将被锁定,飞轮效应会进一步放大;b. 算力和成本波动:市场普遍认为微软MIA200、国产算力芯片及AIDC供给扩张能改善算力供给与成本曲线,但若大厂自建IDC进度超预期或算力价格战加剧,第三方AIDC和中小模型厂商的成本优势将被削弱;c. 监管约束:国内AI搜索、广告、内容生成等业务在流量分发、内容安全上可能面临更强监管,当AI及AI agent冲击传统生态时,商业化推进可能受阻。
6、厂商商业化路径与业绩弹性
商业化核心链路分析:当前AI竞争重心已从单纯的模型能力,扩展至模型+入口+云基础设施+应用生态的综合博弈。互联网三巨头凭借流量和云资源,在模型层形成结构化优势;独立模型厂商则通过差异化布局突围,智谱、Minimax等作为高贝塔模型纯度标的,在AI行情强化期将受益于资金关注度放大、收入高增及PS扩张带来的增量弹性。2026年模型层商业化有三条关键链路:a. 推理成本在2024-2026年持续实现数量级下跌,Minimax的M2.1性价比获行业高度认可;b. MaaS作为AI云中增速最快子行业,2030年前中国市场年增速达70%,智谱推进本地化渗透,收入向可规模化复制的云端API调用倾斜;c. 2026年为C端超级应用与多Agent协同落地之年,Minimax在AI陪伴、内容创作赛道形成先行者锁定效应。
Minimax业绩弹性拆解:Minimax为模型+应用双轮驱动的弹性标的,2026年叠加C端订阅、应用内付费及海外扩张,具备较强量价博弈空间。C端核心产品Talkie星野在2025年前三季度全球累计用户超2亿,MAU达2762万,整体付费率0.89%,显著高于行业平均的0.3%-0.5%;当前ARPU虽因用户心智培育阶段有所下滑,但未来月活提升后增长潜力充足。B端开放平台累计客户数从2023年的130家增至1320家,月活客户从4000家升至1.6万家,付费客户从100家增至2500家,呈现长尾开发者扩容的平台化特征。公司目前仍处亏损状态,主要源于高额研发及海外营销投入,但C端应用毛利率已转正,B端毛利近70%,2026年经营性现金流有望逐季改善、亏损率收窄。
智谱业绩弹性与关注重点:智谱为MaaS基础设施+企业数字化的核心配置标的,收入增长取决于本地化项目签约节奏、云端调用量拐点及云端API服务毛利率。公司2022-2024年本地化部署收入占比从95.5%降至84.5%,2025年上半年仍为85%,云端业务是其长期估值提升的核心;2025年9月推出的Coding Plan两个月内ARR破亿,2025年上半年海外收入占比达11.1%,成为对冲国内价格战及监管风险的重要增长来源。本地化部署毛利率常年维持在60%左右,是业绩压舱石。2026年需关注三大重点:a. 本地化订单获取节奏及项目毛利率是否回升至65%以上;b. 云端收入占比能否提升至40%及毛利率是否显著转正;c. 海外MaaS订单进展及收入占比爬升情况。


