MDB:AI Going Back On Offense

用户头像
Nvfans
 · 上海  

花旗观点
我们正重新审视MongoDB的长期投资逻辑,因为投资者仍在激烈争论它与AI的相关性及竞争压力。更宏观地看,我们的深度研究显示,MDB可能比市场共识更像“AI赢家”。它在新兴AI初创企业中的渗透率已不容小觑(虽仍有提升空间),且无论SaaS被AI颠覆的辩论结果如何,应用开发/现代化加速都会成为其顺风。我们提前开启90天“正面催化剂观察”,等待三季度财报、CEO在花旗TMT大会演讲以及9月分析师日/用户大会。我们预计营收与利润预期将获上调,投资者对MongoDB的AI地位、竞争力和财务势头的信心也会增强,尤其是在新任CFO到位、公司可能给出高于市场预期的中期利润率与增长目标之后。

AI原生技术栈“拆解”显示其渗透超预期
不少投资者认为MongoDB在AI时代无关紧要(更看好PostgreSQL)。我们拆解了新兴AI公司的技术栈,看它们到底用什么数据库。虽然PostgreSQL热度上升,但MongoDB仍具相当存在感。我们抽样约75家AI公司,其中50家明确使用PostgreSQL或MongoDB;在这50家里,可验证有22家正在使用MongoDB。

无论SaaS辩论结局如何,MongoDB几乎“稳赢”
应用软件正面临结构性甚至“生死存亡”的争论,但MongoDB的收入模式绑定的是数据量/消费量,而非席位或UI/UX,因此在几乎所有情境下都能中立受益。

管理层转向进攻,催化剂密集到来
我们新增90天正面催化剂观察:即将发布的季报、CEO在花旗TMT大会演讲、以及9月中旬在纽约举行的MDB.Local投资者日。我们预计公司将披露AI业务进展与财务目标。最新13-F文件显示,ValueAct在二季度新建仓MDB。

花旗银行在报告中从数据模型适配性、性能表现、扩展性能力、AI 技术整合、开发者生态与工具链五大核心维度,结合实际测试数据与客户案例,系统评估了 MongoDB 的技术优势,具体分析如下:

一、灵活的文档模型:适配 AI 时代非结构化数据需求

MongoDB文档型 NoSQL 架构是其核心技术基石,花旗认为这一模型天然适配 GenAI 场景中 “非结构化数据占比高、数据格式动态变化” 的特点:

可直接存储 JSON/BSON 格式数据(如 LLM 生成的文本、用户交互日志、多模态内容元数据),无需像 PostgreSQL(关系型数据库)那样预先定义固定 schema,减少数据格式转换的复杂度与损耗;对 AI 应用中常见的 “半结构化数据更新”(如实时调整 LLM 提示词模板、用户偏好标签迭代)支持更灵活,无需频繁修改表结构,降低开发与运维成本。
花旗以 Comcast 案例佐证:Comcast 迁移至 MongoDB 后,借助其文档模型快速处理 Xfinity X1 平台的个性化内容元数据,实现亚秒级响应,而此前 PostgreSQL 因结构化数据约束无法满足低延迟需求。

二、性能优势:高并发、大 payload 场景显著领先

花旗通过第三方测试数据与客户反馈,重点强调 MongoDB高吞吐量实时读写、大体积数据(大 payload)处理中的性能优势,尤其针对 GenAI “实时推理” 场景的核心需求:

大 payload 数据处理效率:引用 Houlihan 测试结果,在处理包含 200 个属性、4000 字节的大体积数据时:插入性能:PostgreSQL 使用 JSON 格式需 17.5 秒、JSONB 格式需 37.2 秒,而 MongoDB 仅需 1 秒;读取性能:PostgreSQL 使用 JSON 格式需 27.8 秒、JSONB 格式需 53.8 秒,MongoDB 仅需 8.4 秒;
花旗指出,这种性能差距源于 MongoDB 的文档存储架构对非结构化数据的原生优化,而 PostgreSQL 需通过扩展(如 JSONB)适配,存在架构层面的性能损耗。高并发场景稳定性:GenAI 应用从 PoC 走向生产后,会面临 “每一次 LLM 查询、图像生成都需实时读写上下文数据” 的高并发需求。花旗对比 PostgreSQL 的局限(如 Reddit 反馈的 “真空机制瓶颈”“索引膨胀” 导致高并发下性能下降),强调 MongoDB 的无锁架构与分布式读写分离设计,能支撑百万级并发用户的实时数据交互(如 Epic Games 用其支撑 Fortnite 的实时 matchmaking 数据,解决 PostgreSQL 的并发写入瓶颈)。

三、水平扩展能力:支撑 AI 应用规模化增长

花旗认为,MongoDB水平扩展技术是其区别于传统数据库(含 PostgreSQL)的关键优势,尤其适配 AI 应用从 “初创期小体量” 到 “成长期大规模” 的快速迭代:

支持 “分片集群” 部署,可通过添加节点线性扩展存储与计算能力,无需像 PostgreSQL 那样依赖单实例垂直扩容(易触达硬件上限);全球集群功能支持多区域部署,降低跨地域 AI 服务的延迟(如 Epic Games 通过 MongoDB 全球集群,为不同地区的 Fortnite 玩家提供低延迟数据访问);花旗以客户迁移案例佐证:Epic Games 因 PostgreSQL 无法应对玩家数据的并发写入与跨区域扩展需求,迁回 MongoDB 后,成功支撑数百万并发玩家的实时数据处理,且运维成本降低。

四、AI 技术整合:强化 RAG 与 Agentic 应用能力

花旗高度认可 MongoDB 通过战略收购与产品迭代构建的 AI 技术闭环,认为这使其从 “通用数据库” 升级为 “AI 原生数据平台”:

Voyage AI 收购的技术增益:收购 Voyage AI 后,MongoDB 整合了其领先的 “嵌入模型” 与 “重排序模型”,强化对 Retrieval Augmented Generation(RAG)场景的支持 —— 可更精准地从非结构化数据中检索上下文,提升 LLM 回答的准确性;同时支持 Agentic 应用(AI 代理)的 “状态保存” 需求,适配 AI 代理迭代式处理任务的场景。获得 AI 巨头认可:Anthropic(知名 AI 模型厂商)将 Voyage 列为 MongoDB 的 “首选嵌入模型”,花旗认为这印证了 MongoDB AI 技术的行业认可度,也使其在 AI 客户竞争中具备差异化优势(即使客户使用其他数据库,也可能因 Voyage 模型选择 MongoDB)。Vector Search 功能:MongoDB 原生的 Vector Search 功能可直接处理 AI 场景中的向量数据(如图像、文本嵌入向量),无需依赖第三方插件,简化 AI 应用的技术栈(对比 PostgreSQL 需依赖 pgvector 扩展,兼容性与性能存在局限)。

五、开发者生态与工具链:降低技术落地门槛

花旗指出,MongoDB开发者友好性与完善工具链是其技术优势的 “放大器”,能加速 AI 企业的技术落地:

活跃的开源社区:GitHub 数据显示,MongoDB 的 “周提交量” 持续超过 PostgreSQL,说明开发社区活跃度更高,技术迭代速度更快(如快速响应 AI 场景的新需求);2025 年 StackOverflow 调查中,MongoDB 仍位列 Top 5 “最受喜爱数据库”,开发者忠诚度显著。迁移工具简化升级:推出 Relational Migrator 工具,集成 AI 功能(类似 Cognition 的 Devin),可自动化完成从传统关系型数据库(如 PostgreSQL、MySQL)到 MongoDB 的迁移,降低企业现代化门槛 —— 花旗观察到,该工具推动 MongoDB 的 “迁移动量回升”,专业服务收入连续季度增长,印证工具链的实际价值。完善的 AI 开发支持:通过 MAAP 计划(AI 初创企业合作计划)提供专属技术支持,帮助 AI 初创企业快速上手 MongoDB 的 AI 相关功能(如 Vector Search、Voyage 模型集成),目前已有约 8000 家 AI 初创企业使用其技术,形成 “开发者 - 生态” 正向循环。