阿汤博客-承接中小企业服务器维护和网站维护,有意者可以联系博主!

Linux运维监控基础采集项

运维文档 431℃ 0评论

内存: 

mem.memfree.percent:内存剩余的百分比

CPU: 

cpu.idle:CPU空闲百分比 

cpu.iowait:CPU的IO等待的百分比

磁盘: 

disk.io.write_bytes/device=vdb:磁盘的写入速率 

disk.io.read_bytes/device=vdb:磁盘的读取速率 

disk.io.await:每一个IO请求的处理的平均时间(单位是毫秒),这里可以理解为IO的响应时间,一般地系统IO响应时间应该低于5ms,如果大于10ms就比较大了。 

disk.io.util:IO使用率

网络net 

net.if.in.bytes/iface=eth0 网络上传速率(M/s) 

net.if.in.packets/iface=eth0 网络上传速率(数据包/s) 

net.if.out.bytes/iface=eth0 网络下载速率(M/s) 

net.if.out.packets/iface=eth0 网络下载速率(数据包/s) 

net.if.total.bytes/iface=eth0 网络总传输速率(M/s 

net.if.total.packets/iface=eth0 网络总传输速率(数据包/s)

负载: 

load.15min:15分钟运行进程队列中平均负载 

load.1min:1分钟运行进程队列中平均负载 

load.5min:5分钟运行进程队列中平均负载 

解释: 

系统平均负载是CPU的Load,它所包含的信息不是CPU的使用率状况,而是在一段时间内CPU正在处理以及等待CPU处理的进程数之和的统计信息,也就是CPU使用队列的长度的统计信息。这个数字越小越好。(建议最大是内核数*0.7)

补充: 

df.bytes.free:磁盘可用量 

df.bytes.free.percent:磁盘可用量占总量的百分比 

df.bytes.total:磁盘总大小 

df.bytes.used:磁盘已用大小 

df.bytes.used.percent:磁盘已用大小占总量的百分比(监控这个指标报警) 

df.inodes.total:inode总数 

df.inodes.free:磁盘可用inode数目 

df.inodes.free.percent:可用inode百分比 

df.inodes.used:磁盘已用的inode数据 

df.inodes.used.percent:已用inode百分比(监控这个指标报警)

disk.io.ios_in_progress:当前正在运行的实际I / O请求数 

disk.io.msec_read:所有读取花费的总计ms数 

disk.io.msec_total:ios_in_progress> = 1的时间量 

disk.io.msec_weighted_total:统计最近的I / O完成时间和积压。 

disk.io.msec_write:所有写入所花费的总时间 

disk.io.read_merged:相邻的读取请求合并在单个req中 

disk.io.read_requests:读取成功完成的总数(汇总) 

disk.io.read_sectors:成功读取的扇区总数 

disk.io.write_merged:相邻的写请求合并在单个请求中 

disk.io.write_requests:成功写入磁盘的总次数 

disk.io.write_sectors:成功写入扇区数的总次数 

disk.io.read_bytes:单位是byte的数字 

disk.io.write_bytes:单位是byte的数字

转载请注明:阿汤博客 » Linux运维监控基础采集项

喜欢 (0)or分享 (0)