使用夜莺系统,主要是使用其告警功能,其告警功能方便易用。
1.设置人员组织
最后的告警是落在业务组管理的,用户-团队-业务组
1.1创建用户
1.2创建用户团队
创建用户团队并把用户添加到对应的团队中,其中团队是可以层级创建的
1.3创建业务组
业务组也是可以按照层级创建的,告警规则都是落在各个业务组里的,是按照业务组来划分的规则。业务组管理就是将团队也业务组进行绑定。
2.设置告警通知
2.1邮件通知
在告警通知-通知设置里面需要设置SMTP设置,按照实际情况修改其默认配置。
2.1.1邮件模板email
在告警通知-通知模板中设置邮件模板email
2.1.2邮件头
在告警通知-通知模板中设置邮件头模板mailsubject
设置为当集群为kubernetes-prod,kubernetes-dev,kubernetes-shuiwu的时候,发送带有K8S的邮件头,否则没有K8S头
通知模板
3.设置告警规则
3.1系统告警
3.1.1 pod数量
3.1.2内存利用率
3.1.3cpu利用率
3.1.4Node未就绪
3.1.5有PID压力
3.1.6有内存压力
3.1.7有磁盘压力
3.1.8网络不可用
3.1.9Node不可调度
3.1.10cpu请求率
3.1.11磁盘利用率
3.1.12内存请求率
3.1.13写IO
3.1.14读IO
3.2项目告警
项目是按照命名空间来区分的,所以需要在每个项目的指标中设置命名空间namespace=~"xxx.*",其中xxx为项目的命名空间名
THE END