dstat 监控命令详解

一、工具介绍

  dstat的man手册对于该工具的解释:

    dstat – versatile tool for generating system resource statistics 系统资源多用途的统计工具  

  Dstat is a versatile replacement for vmstat, iostat and ifstat. Dstat overcomes some of the limitations and adds some extra features.

  dstat可以替代vmstat、iostat、ifstat。dstat突破了vmstat、iostat、ifstat的一些限制并增加了一些额外特性。  

  Dstat allows its data to be directly written to a CSV file to be imported and used by OpenOffice,Gnumeric or Excel to create graphs.

  dstat可以将数据重定向写入csv文件,并支持通过office工具导出和使用,也可以用excel绘图表。

二、dstat基本用法

  dstat命令不加任何参数时,会收集CPU、磁盘、网络、分页、系统的数据信息,每秒收集一次。缺省参数时相当于dstat -cdngy 1或dstat -a 1。

  命令格式

  dstat [-afv] [options..] [delay [count]]  

  常用选项

 
-c,–cpu 开启cpu统计
-d, –disk 开启disk统计
-D 改选跟具体的设备名(多个用逗号隔开)如:total,hda,hdb表示分别统计total、hda、hdb设备块
-i, – -int 开启中断统计
 -l, –load 开启负载均衡统计,分别是1m,5m,15m
-m, –mem 开启内存统计,包括used,buffers,cache,free
-n, –net 开启net统计,包括接受和发送
-N 该选项可以跟网络设备名多个用逗号隔开,如eth1,total
-g, –page 开启分页统计
-p, –proc 开启进程统计,包括runnable, uninterruptible, new
-r, –io io开启请求统计,包括read requests, write requests
-s, –swap 开启swap统计,包括used, free
-S 该选项可以跟具体的交换区,多个用逗号隔开如swap1,total
-t, –time 启用时间和日期输出
-y, –sys 开启系统统计,包括中断和上下文切换
–fs 开启文件系统统计,包括 (open files, inodes)
–ipc 开启ipc统计,包括 (message queue, semaphores, shared memory)
–output file 输出结果到cvs文件中
-a, –all 是默认值相当于 -cdngy (default)
-f, –full 相当于 -C, -D, -I, -N and -S

 

  参数

参数名称 参数描述
delay 两次输出之间的时间间隔,默认是1s
count 报告输出的次数,默认是没有限制,一直输出知道ctrl+c

 

常用选项的判断方法

  进程相关

    -p,–proc

      

-p , --proc
    展示当前时刻的进程状态:可运行态(就绪态),无法中断的睡眠态(等待态),新进程,
    文档原文为:runnable, uninterruptible, new。
    就绪态进程多代表负载较高,配合-l参数确认,比如run为80,即当前有80个进程等待CPU处理,等待态进程多代表当前IO可能有问题,等待态进程是内存中等待非CPU资源的进程,一般是等待IO,可以根据-c的wai列确认, 进一步根据-g的in列确认是否是内存瓶颈后的恢复期,配合-s参数查看换页使用情况,
    -d查看当前bio情况,如果-d的bio的read和-g的in差不多,表名当前IO主要是换页到内存加载造成的,即内存不足后的恢复期,
     如果-g和-s表名换页未使用,但是-d居高,则说明当前有大量进程等待磁盘IO,
     使用--top-bio-adv确定bio最高的进程,
     如果-d也不高,但是-n较高,说明进程等待网络IO
     使用--top-io-adv确定IO最高的进程。         

  

--proc-count:展示进程数量,侧面反映系统负载

  

 

 

 

-y, --sys:展示系统中断次数int和上限文切换次数csw,
    上下文切换:CPU运行任务1,切换运行就绪态任务2,
    任务1可能变成就绪态(CPU时间片耗光),
    也可能变成等待态(等待IO等非CPU资源),
    CPU的处理时间片较短,中断和上下文切换次数数字会很大,
    也能从侧面反映负载,如果中断和上下文切换暴涨,
    表明负载过大,或者程序设计不合理,或者kernel级别的BUG。

 

 

 

 

--ipc:展示IPC(进程间通信)状态, 
       包括msg消息队列 ,sem线程队列,shm共享内存使用

 

 

 

进程最耗资源统计

--top-cpu
       展示最耗CPU的进程名和CPU占比

 

 

 

--top-cpu-adv
       展示最耗CPU的进程名、PID和CPU占比以及读写信息,
       这个读写信息是一个差值,推测是内存的读写。

 

 

 

--top-cputime
       展示耗费CPU时间最多的进程名和耗费时间(ms)

 

 

--top-latency
       显示延迟最高的进程名和延迟时间(ms)

 

 

--top-bio-adv
       展示当前最耗block I/O的进程名、PID和读写容量以及CPU占比
       即最高磁盘IO的进程。

 

 

 

--top-io
       展示最耗IO的进程名和IO读写信息,
       被统计的IO信息包括blockIO和内存还有网络等全部,
       因此如果要判定最耗磁盘读写的进程,应该使用--top-bio,
       某一时刻,最耗IO和最耗blockIO的进程不一定是同一个。

 

 

 

 

 

 

 

--top-mem
       展示最耗内存的进程名和内存消耗

 

 

 

 

--top-oom
       展示最先OOM杀死的进程,OOM是内存回收机制

  

 

 

 内存相关参数

-m, --mem
       展示内存状态,包括used, buffers, cache, free

 

 

 

 

网络相关参数

-n, --net
       展示总体网络收发状态,折算后附带单位友好展示

 

 

 

-N 必须和-n配合使用:dstat -n -N eth0,total
       当存在多网卡时,可以分别指定展示各个网卡的收发状态

 

 

 

 

--socket
       展示套接字状态,包括tot总数量,tcp套接字数量,udp套接字数量,
       raw原始套接字数量,frg(ip-fragments IP碎片)套接字数量。

 

 

 

 

--tcp  (listen, established, syn, time_wait, close)
       展示tcp网络连接状态,lis监听的数量,act(established)活动的确立的数量,
       synTCP/IP的握手数量,tim(time_wait)发起关闭后的等待关闭态数量,
       clo关闭态数量,即命令netstat -tpln对应记录的搂取合并。

 

 

 

 

硬盘相关参数

-d, --disk
       展示磁盘设备读写总计,折算后附带单位友好展示

 

 

 

-D 必须和-d配合使用:dstat -dD sda,sda2,total
       分别展示设备sda和sda2以及总体的读写状态

 

 

 

--disk-tps
       展示每个磁盘每秒事物读写数量

 

 

 

MYSQL相关参数

# mysql相关参数使用配置:
yum -y install MySQL-python
export DSTAT_MYSQL_HOST=127.0.0.1
export DSTAT_MYSQL_USER=root
export DSTAT_MYSQL_PWD='ecpss@123'
mkdir /var/lib/mysql
ln -s /usr/local/mysql/mysql.sock /var/lib/mysql/mysql.sock
# 如果功能报错,请修改/usr/share/dstat目录内对应脚本
# 如果参数--mysql5-cmds报错,则修改dstat_mysql5_cmds.py
--innodb-buffer
       show innodb buffer stats
--innodb-io
       show innodb I/O stats
--innodb-ops
       show innodb operations counters
# 以上三个参数信息都由"show engine innodb status\G\n"获得,
# 因涉及os.popen3兼容问题,暂不研究
--mysql5-cmds
       展示mysql库所有的dml操作次数,包括:
       sel查询次数,ins插入次数,upd更新次数,del删除次数,
       加大dstat_mysql5_cmds.py的self.width参数,以免数据展示不全,
       该参数是展示数据的最大长度,数据由以下mysql库SQL提供:
       show global status like 'Com_select';
       show global status like 'Com_insert';
       show global status like 'Com_update';
       show global status like 'Com_delete';
       是mysql库的内存状态,重启后数据清零。

版权声明:本文为zh-dream原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/zh-dream/p/12081455.html