用户头像
icefighter
 · 广东  

//为什么 Datadog 在利用 AI 实现这一愿景方面具有独特优势。
Datadog 的独特之处在于我们获取的数据规模、数据体量,以及我们对现实世界中运行的基础设施、应用程序和系统的理解程度。我们以极大的规模摄取数据——数万亿个数据点、数十亿条追踪记录、EB 级别的日志数据。
同时,我们拥有高度多样化的数据类型。用户向我们发送的关于其系统的数据,包括指标、追踪、日志、用户会话、数据作业、数据血缘、LLM 和代理追踪、团队结构、服务名称以及大量其他信息。这些数据来自我们的 SDK、代理程序以及集成爬虫。
这些数据不仅支撑着当今 Datadog 的可观测性能力,也构成了实现完全自主化运维所需 AI 的基础。
几年前,我们成立了一个 AI 研究实验室,因为我们坚信:凭借我们拥有的数据规模以及研发能力,我们可以在为可观测性和安全构建 AI 方面成为领导者。
我们是如何开始的?
我们想证明:拥有大量领域专属数据会带来优势。因此,我们开发了第一个时间序列基础模型,名为 Toto。
如果你寻找公开可用的最大时间序列数据集,大约是 3000 亿个数据点,涵盖金融、医疗、能源、交通、网络流量等领域。
而我们用 3 倍于这个规模的数据训练 Toto。并且其中绝大多数数据是 Datadog 独有的,与应用程序、基础设施和软件系统直接相关。
结果是,当我们将 Toto 与其他时间序列模型在预测能力上进行对比时,它表现远优于其他模型。我们达到了当前最先进水平。
随后,我们将其作为开放权重模型发布在 Hugging Face 上——大约是去年 5 月。至今已有约 900 万次下载。
你可能会问,为什么要开放权重?
原因有三:
第一,我们希望为这一新兴领域做出贡献。
第二,我们希望确立我们作为 AI 实验室的可信度。
第三,下载量可以反映这些模型的重要性。
但更重要的是成本差异。2025 年,我们训练该模型的成本约为 75 万美元——相比同一时期的前沿模型(Frontier model),成本低 3 到 4 个数量级。