加入收藏 | 设为首页 | 会员中心 | 我要投稿 辽源站长网 (https://www.0437zz.com/)- 云专线、云连接、智能数据、边缘计算、数据安全!
当前位置: 首页 > 服务器 > 安全 > 正文

一篇文章全面了解监控知识体系

发布时间:2021-01-11 20:15:22 所属栏目:安全 来源:网络整理
导读:《一篇文章全面了解监控知识体系》要点: 本文介绍了一篇文章全面了解监控知识体系,希望对您有用。如果有疑问,可以联系我们。 作者简介 徐亮伟 ? 江湖人称标杆徐,曾负责大规模集群架构自动化运维工作.擅长自动化运维,并且在分布式、Python自动化、云计算虚

上面介绍了这么多,那么到底选择什么监控工具最合适呢,我这里推荐几款开源监控工具:Zabbix、Open-Falcon、LEPUS 天兔(专用于监控数据库).
但是本文还是基于 Zabbix 来构建整个监控体系生态圈.
那么下面我们就来聊聊,Zabbix 的整个流程:

  1. 数据采集:Zabbix 通过 SNMP、Agent、ICMP、SSH、IPMI 等对系统进行数据采集;
  2. 数据存储:Zabbix 存储在 MySQL 上,也可以存储在其他数据库服务;
  3. 数据分析:当我们事后需要复盘分析故障时,Zabbix 能给我们提供图形以及时间等相关信息,方面我们确定故障所在;
  4. 数据展示:web 界面展示、(移动 APP、java_php 开发一个 web 界面也可以) ;
  5. 监控报警:电话报警、邮件报警、微信报警、短信报警、报警升级机制等(无论什么报警都可以);
  6. 报警处理:当接收到报警,我们需要根据故障的级别进行处理,比如:重要紧急、重要不紧急等.根据故障的级别,配合相关的人员进行快速处理;

6、监控指标

我们上面了解了监控方法、目标、流程、也了解了监控有哪些工具,可能有人会疑惑,我们具体要监控些什么东西?那么我在这里进行了分类整理:

6.1 硬件监控

早期我们通过机房巡检的方式,查看硬件设备灯光闪烁情况判断是否故障,这样非常浪费人力,并且是重复性无技术含量的工作,大家懂得.

当然我们现在可以通过IPMI对硬件详细情况进行监控,并对 CPU、内存、磁盘、温度、风扇、电压等设置报警阈值(自行对监控报警内容编写合理的报警范围)
IPMI监控硬件服务参考资料

IPMI

6.2 系统监控

中小型企业基本全是 Linux 服务器,那么我们肯定要监控系统资源的使用情况,系统监控是监控体系的基础.

监控主要对象:

CPU 有几个重要的概念:上下文切换、运行队列和使用率.

这也是我们 CPU 监控的几个重点指标.
通常情况,每个处理器的运行队列不要高于3,CPU 利用率中“用户态/内核态”比例维持在70/30,空闲状态维持在50%,上下文切换要根据系统繁忙程度来综合考量.

针对 CPU 常用的工具有:htop、top、vmstat、mpstat、dstat、glances

Zabbix 提供系统监控模板:Zabbix Agent Interface

CPU整体状态

上下文切换

负载状态

内存:通常我们需要监控内存的使用率、SWAP 使用率、同时可以通过 zabbix 描绘内存使用率的曲线图形发现某服务内存溢出等.

针对内存常用的工具有: free、top、vmstat、glances

内存使用率

IO 分为磁盘 IO 和网络 IO.除了在做性能调优我们要监控更详细的数据外,那么日常监控,只关注磁盘使用率、磁盘吞吐量、磁盘写入繁忙程度,网络也是监控网卡流量即可.

常用工具有:iostat、iotop、df、iftop、sar、glances

(编辑:辽源站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读