Alertmanager
conf
- Global:全局配置,主要用来配置一些通用的配置,比如邮件通知的账号、密码、SMTP服务器、微信告警等。Global 块配置下的配置选项在本配置文件内的所有配置项下可 见,但是文件内其它位置的子配置可以覆盖 Global 配置;
- Templates:用于放置自定义模板的位置;
- Route:告警路由配置,用于告警信息的分组路由,可以将不同分组的告警发送给不同 的收件人。比如将数据库告警发送给 DBA,服务器告警发送给 OPS;
- nhibit_rules:告警抑制,主要用于减少告警的次数,防止“告警轰炸”。比如某个宿主机 宕机,可能会引起容器重建、漂移、服务不可用等一系列问题,如果每个异常均有告警, 会一次性发送很多告警,造成告警轰炸,并且也会干扰定位问题的思路,所以可以使用 告警抑制,屏蔽由宿主机宕机引来的其他问题,只发送宿主机宕机的消息即可;
- Receivers:告警收件人配置,每个 receiver 都有一个名字,经过 route 分组并且路由后 需要指定一个 receiver,就是在此位置配置的
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29
| global: #"resolved"或"firing",firing->time->resolved resolve_timeout: 5m http_config: follow_redirects: true enable_http2: true smtp_hello: localhost smtp_require_tls: true # 邮件 smtp_smarthost: 'smtp.exmail.qq.com:25' smtp_from: 'xxx@xxx.com' smtp_auth_username: 'xxx@xxx.com' smtp_auth_password: 'xxx' #企业微信 # wechat_api_url: https://qyapi.weixin.qq.com/cgi-bin/
route: # 默认告警通知接收者,凡未被匹配进入各子路由节点的告警均被发送到此接收者 receiver: default-receiver continue: false group_wait: 10s # 再次告警时间间隔 group_interval: 5m # 通知成功未恢复,再次告警时间间隔 repeat_interval: 3h receivers: - name: default-receiver templates: - /etc/alertmanager/*.tmpl
|
点击打赏
会心一笑