//为什么 Datadog 在利用 AI 实现这一愿景方面具有独特优势。Datadog 的独特之处在于我们获取的数据规模...

icefighter

2026-03-05 20:28 · 广东

//为什么 Datadog 在利用 AI 实现这一愿景方面具有独特优势。
Datadog 的独特之处在于我们获取的数据规模、数据体量，以及我们对现实世界中运行的基础设施、应用程序和系统的理解程度。我们以极大的规模摄取数据——数万亿个数据点、数十亿条追踪记录、EB 级别的日志数据。
同时，我们拥有高度多样化的数据类型。用户向我们发送的关于其系统的数据，包括指标、追踪、日志、用户会话、数据作业、数据血缘、LLM 和代理追踪、团队结构、服务名称以及大量其他信息。这些数据来自我们的 SDK、代理程序以及集成爬虫。
这些数据不仅支撑着当今 Datadog 的可观测性能力，也构成了实现完全自主化运维所需 AI 的基础。
几年前，我们成立了一个 AI 研究实验室，因为我们坚信：凭借我们拥有的数据规模以及研发能力，我们可以在为可观测性和安全构建 AI 方面成为领导者。
我们是如何开始的？
我们想证明：拥有大量领域专属数据会带来优势。因此，我们开发了第一个时间序列基础模型，名为 Toto。
如果你寻找公开可用的最大时间序列数据集，大约是 3000 亿个数据点，涵盖金融、医疗、能源、交通、网络流量等领域。
而我们用 3 倍于这个规模的数据训练 Toto。并且其中绝大多数数据是 Datadog 独有的，与应用程序、基础设施和软件系统直接相关。
结果是，当我们将 Toto 与其他时间序列模型在预测能力上进行对比时，它表现远优于其他模型。我们达到了当前最先进水平。
随后，我们将其作为开放权重模型发布在 Hugging Face 上——大约是去年 5 月。至今已有约 900 万次下载。
你可能会问，为什么要开放权重？
原因有三：
第一，我们希望为这一新兴领域做出贡献。
第二，我们希望确立我们作为 AI 实验室的可信度。
第三，下载量可以反映这些模型的重要性。
但更重要的是成本差异。2025 年，我们训练该模型的成本约为 75 万美元——相比同一时期的前沿模型（Frontier model），成本低 3 到 4 个数量级。