Datadog Agent是啥?它消耗什么资源?

在资本市场不那么喜人的 2015 年融资 9450 万美元的 Datadog,在运维圈刮起了一阵小旋风。作为国外很值得学习的一款平台监控产品,公司人数不足 100 的 Datadog 为什么吸引了投资人的目光?我们先来了解一下他们的 Agent。

本文系国内 ITOM 行业领军企业 OneAPM 工程师翻译整理自文章 What is the Datadog Agent, What Resources does it Consume?,原作者 Dustin Lawler。

简介

Data dog Agent 是运行在你主机上的一款轻量级软件。它的作用就是忠心耿耿地为你收集事件和性能指标,传到 Datadog 中,以便你利用这些监控和运行数据来做点什么。

点击此处获得 Datadog Agent 的源代码。

enter image description here

Datadog Agent的架构

Data dog Agent 主要由四个用 Python 编写的组件构成,每个组件都是单独运行的进程。

  • Collector(agent.py)-- Collector 会检查当前运行机器的集成环境,抓取系统性能指标,如内存和 CPU 数据。
  • Dogstatsd(dogstatsd.py)-- 这是 StatsD 的后台服务器,它致力于收集从你代码中发送出去的本地性能指标。
  • Forwarder(ddagent.py)-- Forwarder 负责把 Dogstatsd 和 Collector 收集到的数据推到一个队列中,这些数据将会被发往 Datadog。
  • SupervisorD -- 由一个单独的管理进程控制。我们把它与其他组件分隔开来,因此如果你担心资源消耗而不想运行所有组件的话(虽然我们建议你这么做),可以单独运行它。

学习如何在现有基础上,扩展 agent 的检查内容,或者编写自己的一套版本,请点击此处

Datadog Agent消耗的资源

Datadog Agent的资源消耗大致如下:

  • 常驻内存:50MB
  • CPU时间:平均小于1%
  • 硬盘空间:
    Linux:120MB
    Windows:60MB
  • 带宽占用:每分钟 10-50 KB

上述数据是基于一个运行了十多天的 EC2 m1.large 实例。

监控、权限和网络端口

Supervisors 作为一个主控根进程运行,可以 fork 所有的子进程为user dd-agent,其配置文件在/etc/dd-agent/datadog.conf/etc/dd-agent/conf.d下可以找到。所有的配置对 dd-agent 来说都必须可读。推荐使用权限 0600,因为配置文件中包含你的 API key,以及其它访问性能指标(如 mysql,postgresql metrics)所需的证书。

以下端口对一般操作开放:

  • 为一般操作提供的 forwarder tcp/17123 端口和启用了 graphite 服务时的 tcp/17124端口
  • dogstatsd udp/8125

在 3.4.1 或以上版本中,所有监听进程都默认绑定 127.0.0.1 和 / 或者 ::1。而早期版本中,他们则绑定至 0.0.0.0 (例如所有的接口)。

关于如何通过代理运行agent,请戳这里;关于允许的范围,请看这里

Collector

这是收集所有标准性能指标的地方,每十五秒收集一次。
Collector 也支持运行基于 python 的用户定义的检查内容。这些内容应存储于/etc/dd-agent/checks.d下。用户定义的检查内容必须从抽象类 AgentCheck 继承,这个类定义在 checks/init.py中。

Forwarder

Forwarder 监听并缓存传入的HTTP请求,接着通过 HTTPS 转发到 Datadog 中心。缓存请求使得网络可以一分为二,不影响性能指标的上报。性能指标将被缓存在内存中,直到达到必须发送的大小或数目才会被发送。接着,最老的性能数据包就会被丢弃,以确保 forwarder 有足够的存储空间。

DogStatsD

DogStatsD 是用 python 实现的 esty statsD 性能指标整合进程,用于通过UDP协议接收和积累任意的性能指标,这样我们就可以度量自定义代码,而不会增加延迟。

关于dgostatsd的更多信息请看这里

Agent的优点

想要了解使用 Datadog agent 究竟有什么好处,可以参考下面的两篇文章:

再说几句

Dustin Lawler 关于 Datadog Agent 的原理的讲解思路清晰。Datadog 本身在国外拥有 Facebook、Airbnb 等重量级客户,被业界极力看好。而国内一些大公司的运维人员往往只知道 Zabbix 等开源产品,对 StatsD 系监控产品的了解比较少。而 StatsD 作为新世代的系统监控的核心,目前还处于技术累计过程。越来越多的开源项目加入到它的怀抱中,也有越来越多的公司,在此基础之上加入了研发的资源,或者在与之相关的其他领域中投入成本。

国内也有一款像 Datadog 一样基于 StatsD,提供一体化监控解决方案的产品 Cloud Insight,能够监控大规模集群、云主机、Docker 容器,支持多种操作系统、数据库、中间件等,在数据采集、计算和展现的基础上,还拥有跨部门事件流展现、报警等功能,是一款 DevOps+ChatOps 理念的产品。

有关 StatsD 和 Cloud Insight 的更多内容,可以参考以下文章:

本文转自 OneAPM 官方博客

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,335评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,895评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,766评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,918评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,042评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,169评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,219评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,976评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,393评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,711评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,876评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,562评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,193评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,903评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,142评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,699评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,764评论 2 351

推荐阅读更多精彩内容