Prometheus企业级运维自动监控平台 K8s部署Grafana AlertManager自动化监控报警平台
Prometheus监控平台主要是提供了数据采集和存储功能,如果要根据事件触发告警则需要依赖Alertmanager组件来完成(或者使用Grafana Alerting)。AlertManager支持告警分组,可以将同个分组下的多个告警告警到一封邮件中进行发送,减少骚扰;另外还有告警抑制功能,和Zabbix的告警依赖同理,避免发生某个故障出现后导致其他一系列故障一起告警形成告警风暴的问题;最后还有告警静默功能,让同时间段内的告警不重复发出。
Grafana是一款用Go语言开发的开源数据可视化工具,可以做数据监控和数据统计,带有告警功能。目前使用grafana的公司有很多,如paypal、ebay、intel等。
Alertmanager是一个独立的告警模块,接收Prometheus等客户端发来的警报,之后通过分组、删除重复等处理,并将它们通过路由发送给正确的接收器;告警方式可以按照不同的规则发送给不同的模块负责人,Alertmanager支持Email, Slack,等告警方式, 也可以通过webhook接入钉钉等国内IM工具。
===============课程目录===============
├─01.监控介绍.mp4
├─02.prometheus的组件介绍.mp4
├─03.prometheus数据及安全模型介绍.mp4
├─04.prometheus在centos7上安装.mp4
├─05.prometheus在docker容器中运行.mp4
├─06.使用Node-exporter监控节点.mp4
├─07.使用容器cAdvisor监控节点.mp4
├─08.label标签的配置使用.mp4
├─09.监控cpu利用率.mp4
├─10.监控内存使用率.mp4
├─11.监控磁盘空间及预算磁盘饱满时间.mp4
├─12.监控服务状态.mp4
├─13.通过文本获取metric.mp4
├─14.通过记录规则持久查询.mp4
├─15.通过grafana监控metric.mp4
├─16.基于文件目标发现.mp4
├─17.基于DNS服务的目标发现.mp4
├─18.AlertManager介绍.mp4
├─19.AlertMangeager安装配置及设置邮件报警.mp4
├─20.添加磁盘和节点告警.mp4
├─21.添加prometheus和systemd服务.mp4
├─22.AlertManager路由配置.mp4
├─23.AlertManager静默配置.mp4
├─24.prometheus和alertmanager高可用.mp4
├─25.alaertmanager集群配置.mp4
├─26.prometheus集群配置.mp4
├─27.远端探测介绍.mp4
├─28.black_exporter配置使用.mp4
├─29.PushGateway推送网关介绍.mp4
├─30.PushGateway配置.mp4
├─31.prometheus在k8s安装环境介绍.mp4
├─32.Node_exporter在k8s上的部署.mp4
├─33.prometheus在k8s上部署.mp4
├─34.Grafana在k8s行的部署.mp4
├─35.解决Grafana中CPU不显示数据问题.mp4
├─36.AlertManager在k8s上的部署.mp4
下载地址:
|