Linux运维监控基础采集项

2019年1月12日11:55:35 发表评论 5,404 ℃

内存：

mem.memfree.percent：内存剩余的百分比

CPU：

cpu.idle：CPU空闲百分比

cpu.iowait：CPU的IO等待的百分比

磁盘：

disk.io.write_bytes/device=vdb：磁盘的写入速率

disk.io.read_bytes/device=vdb：磁盘的读取速率

disk.io.await：每一个IO请求的处理的平均时间（单位是毫秒），这里可以理解为IO的响应时间，一般地系统IO响应时间应该低于5ms，如果大于10ms就比较大了。

disk.io.util：IO使用率

网络net

net.if.in.bytes/iface=eth0 网络上传速率（M/s）

net.if.in.packets/iface=eth0 网络上传速率（数据包/s）

net.if.out.bytes/iface=eth0 网络下载速率（M/s）

net.if.out.packets/iface=eth0 网络下载速率（数据包/s）

net.if.total.bytes/iface=eth0 网络总传输速率（M/s

net.if.total.packets/iface=eth0 网络总传输速率（数据包/s）

负载：

load.15min：15分钟运行进程队列中平均负载

load.1min：1分钟运行进程队列中平均负载

load.5min：5分钟运行进程队列中平均负载

解释：

系统平均负载是CPU的Load，它所包含的信息不是CPU的使用率状况，而是在一段时间内CPU正在处理以及等待CPU处理的进程数之和的统计信息，也就是CPU使用队列的长度的统计信息。这个数字越小越好。（建议最大是内核数*0.7）

补充：

df.bytes.free：磁盘可用量

df.bytes.free.percent：磁盘可用量占总量的百分比

df.bytes.total：磁盘总大小

df.bytes.used：磁盘已用大小

df.bytes.used.percent：磁盘已用大小占总量的百分比（监控这个指标报警）

df.inodes.total：inode总数

df.inodes.free：磁盘可用inode数目

df.inodes.free.percent：可用inode百分比

df.inodes.used：磁盘已用的inode数据

df.inodes.used.percent：已用inode百分比（监控这个指标报警）

disk.io.ios_in_progress：当前正在运行的实际I / O请求数

disk.io.msec_read：所有读取花费的总计ms数

disk.io.msec_total：ios_in_progress> = 1的时间量

disk.io.msec_weighted_total：统计最近的I / O完成时间和积压。

disk.io.msec_write：所有写入所花费的总时间

disk.io.read_merged：相邻的读取请求合并在单个req中

disk.io.read_requests：读取成功完成的总数（汇总）

disk.io.read_sectors：成功读取的扇区总数

disk.io.write_merged：相邻的写请求合并在单个请求中

disk.io.write_requests：成功写入磁盘的总次数

disk.io.write_sectors：成功写入扇区数的总次数

disk.io.read_bytes：单位是byte的数字

disk.io.write_bytes：单位是byte的数字

Linux运维监控基础采集项

发表评论取消回复

微信

发表评论取消回复

登录 找回密码

微信

登录找回密码