Linux 系统监控命令整理汇总

码农天地 -
Linux 系统监控命令整理汇总

以下命令以Ubuntu 18.04 LTS 系统为准。

命令功能实例free查看内存使用情况,包括物理内存和虚拟内存free -h 或 free -mvmstat对系统的整体情况进行统计,包括内核进程、虚拟内存、磁盘、陷阱和 CPU 活动的统计信息vmstat 2 100top实时显示系统中各个进程的资源占用状况及总体状况topmpstat实时系统监控工具,它会报告与CPU相关的统计信息mpstatsar收集、报告和保存CPU、内存、输入输出端口使用情况sar -n DEV 3 100netstat检验本机各端口的网络连接情况,用于显示与IP、TCP、UDP和ICMP协议相关的统计数据netstat -atcpdump用于捕捉或者过滤网络上指定接口上接收或者传输的TCP/IP包tcpdump -i eth0 -c 3iptraf用来生成包括TCP信息、UDP计数、ICMP和OSPF信息、以太网负载信息、节点状态信息、IP校验和错误等等统计数据iptrafiostat收集显示系统存储设备输入和输出状态统计iostat -x -k 2 100lsof查看进程打开的文件的工具,查看监听端口lsof -i :3000atop显示的是各种系统资源(CPU, memory, network, I/O, kernel)的综合,并且在高负载的情况下进行了彩色标注atophtop它和top命令十分相似,高级的交互式的实时linux进程监控工具htopps最基本同时也是非常强大的进程查看命令ps auxgrep phpglances监视 CPU,平均负载,内存,网络流量,磁盘 I/O,其他处理器 和 文件系统 空间的利用情况glancesdstat全能系统信息统计工具,可用于替换vmstat、iostat、netstat、nfsstat和ifstat这些命令的工具dstatuptime用于查看服务器运行了多长时间以及有多少个用户登录,快速获知服务器的负荷情况uptimedmesg主要用来显示内核信息。使用dmesg可以有效诊断机器硬件故障或者添加硬件出现的问题dmesgmpstat用于报告多路CPU主机的每颗CPU活动情况,以及整个主机的CPU情况mpstat 2 3nmon监控CPU、内存、I/O、文件系统及网络资源。对于内存的使用,它可以实时的显示 总/剩余内存、交换空间等信息nmonmytop用于监控 mysql 的线程和性能。它能让你实时查看数据库以及正在处理哪些查询mytopiftop用来监控网卡的实时流量(可以指定网段)、反向解析IP、显示端口信息等iftopjnettop以相同的方式来监测网络流量但比 iftop 更形象。它还支持自定义的文本输出,并能以友好的交互方式来深度分析日志jnettopngrep网络层的 grep。它使用 pcap ,允许通过指定扩展正则表达式或十六进制表达式来匹配数据包ngrepnmap可以扫描你服务器开放的端口并且可以检测正在使用哪个操作系统nmap localhostdu查看Linux系统中某目录的大小du -sh *fdisk查看硬盘及分区信息fdisk -l内存监控free

free命令可以显示当前系统未使用的和已使用的内存数目,还可以显示被内核使用的内存缓冲区。

语法

free (选项)

常用选项:
-b:以Byte为单位显示内存使用情况;
-k:以KB为单位显示内存使用情况;
-m:以MB为单位显示内存使用情况;
-g:以GB为单位显示内存使用情况;
-o:不显示缓冲区调节列;
-t:显示内存总和列;
-V:显示版本信息。

字段说明:

total:内存总数;used:已经使用的内存数,包括 cached 和应用程序实际使用的内存;free:空闲的内存数;shared:当前已经废弃不用;buffers:缓存内存数;cached:缓存内存数。

关系:total = used + free

vmstat

vmstat命令 的含义为显示虚拟内存状态(“Viryual Memor Statics”),但是它可以报告关于进程、内存、I/O等系统整体运行状态。

语法

vmstat (选项) (参数)

选项
-a:显示活动内页;
-f:显示启动后创建的进程总数;
-m:显示slab信息;
-n:头信息仅显示一次;
-s:以表格方式显示事件计数器和内存状态;
-d:报告磁盘状态;
-p:显示指定的硬盘分区状态;
-S:输出信息的单位。

参数

事件间隔:状态信息刷新的时间间隔;次数:显示报告的次数。

字段说明:
Procs(进程)

r: 运行和等待CPU时间片的进程数,这个值如果长期大于系统CPU个数,就说明CPU资源不足,可以考虑增加CPUb: 等待资源的进程数,比如正在等待I/O或者内存交换等

Memory(内存)

swpd: 使用虚拟内存大小,如果swpd的值不为0,但是SI,SO的值长期为0,这种情况不会影响系统性能。free: 空闲物理内存大小(以KB为单位)。buff: 用作缓冲的内存大小。cache: 用作缓存的内存大小,如果cache的值大的时候,说明cache处的文件数多。如果此时IO中的bi比较小,就说明文件系统效率比较好。

Swap

si: 每秒从交换区写到内存的大小,由磁盘调入内存。so: 每秒写入交换区的内存大小,由内存调入磁盘。

注意:内存够用的时候,这2个值都是0,如果这2个值长期大于0时,系统性能会受到影响,磁盘IO和CPU资源都会被消耗。有些朋友看到空闲内存(free)很少的或接近于0时,就认为内存不够用了,不能光看这一点,还要结合si和so,如果free很少,但是si和so也很少(大多时候是0),那么不用担心,系统性能这时不会受到影响的。

IO(现在的Linux版本块的大小为1kb)

bi: 每秒读取的块数bo: 每秒写入的块数

注意:随机磁盘读写的时候,这2个值较大(如超出1024k),而且wa值比较大,则表示系统磁盘IO性能瓶颈。

system(系统)

in: 每秒中断数,包括时钟中断。cs: 每秒上下文切换数。

注意:上面2个值越大,会看到由内核消耗的CPU时间会越大。

CPU(以百分比表示)
us: 用户进程执行时间百分比(user time)
us的值比较高时,说明用户进程消耗的CPU时间多,但是如果长期超50%的使用,那么我们就该考虑优化程序算法或者进行加速。

sy: 内核系统进程执行时间百分比(system time)

sy的值高时,说明系统内核消耗的CPU资源多,这并不是良性表现,我们应该检查原因。

id: 空闲时间百分比wa: IO等待时间百分比

wa的值高时,说明IO等待比较严重,这可能由于磁盘大量作随机访问造成,也有可能磁盘出现瓶颈(块操作)。

st:一般不关注,虚拟机占用的时间百分比。CPU 监控top

top命令 可以实时动态地查看系统的整体运行情况。

语法:

top (选项)

选项:
-b:以批处理模式操作;
-c:显示完整的治命令;
-d:屏幕刷新间隔时间;
-I:忽略失效过程;
-s:保密模式;
-S:累积模式;
-i<时间>:设置间隔时间;
-u<用户名>:指定用户名;
-p<进程号>:指定进程;
-n<次数>:循环显示的次数。

字段说明:

top:系统当前时间up xxx days:系统运行时间1 users:当前登录用户个数load average:系统负载。即任务队列的平均长度。三个数值分别为最近1分钟、最近5分钟、最近15分钟的平均负载。——超过N(CPU核数)说明系统满负荷运行。

Tasks

total:总进程数running:正在运行的进程数sleeping:睡眠的进程数stopped:停止的进程数zombie:冻结的进程数

%Cpu(s)

us:用户进程消耗的CPU百分比sy:内核进程消耗的CPU百分比ni:改变过优先级的进程占用CPU的百分比id:空闲CPU的百分比wa:IO等待消耗的CPU百分比

Mem

total:物理内存总量free:空闲物理内存总量used:已用物理内存总量buff:用作内核缓存内存总量

Swap

total:虚拟内存总量free:空闲虚拟内存总量used:已用虚拟内存总量mpstat

mpstat命令 指令主要用于多CPU环境下,它显示各个可用CPU的状态系你想。

语法:

mpstat (选项) (参数)

选项:

-P:指定CPU编号。

参数:

间隔时间:每次报告的间隔时间(秒);次数:显示报告的次数。

ALL表示显示所有CPUs,也可以指定某个CPU;2表示刷新间隔。

网络监控sar

sar命令 是Linux下系统运行状态统计工具,它将指定的操作系统状态计数器显示到标准输出设备。

字段说明:

IFACE:网络设备的名称rxpck/s:每秒钟接收到的包数目txpck/s:每秒钟发送出去的包数目rxkB/s:每秒钟接收到的字节数txkB/s:每秒钟发送出去的字节数netstat

netstat命令一般用于检验本机各端口的网络连接情况,用于显示与IP、TCP、UDP和ICMP协议相关的统计数据。

常用实例:

netstat -aup      # 输出所有UDP连接状况
netstat -atp      # 输出所有TCP连接状况
netstat -s        # 显示各个协议的网络统计信息
netstat -i        # 显示网卡列表
netstat -r        # 显示路由表信息
netstat -l        # 只显示监听端口
netstat -lt       # 只列出所有监听 tcp 端口
netstat -lu       # 只列出所有监听 udp 端口
netstat -lx       # 只列出所有监听 UNIX 端口
磁盘监控df

df命令 用于显示磁盘分区上的可使用的磁盘空间。如果没有文件名被指定,则显示当前所有被挂载的文件系统,默认以 KB 为单位。

语法:

df (选项) (参数)

选项:
-a 全部文件系统列表
-h 以方便阅读的方式显示
-i 显示inode信息
-T 显示文件系统类型
-l 只显示本地文件系统
-k 以KB为单位
-m 以MB为单位

参数:

文件:指定文件系统上的文件。

iostat

iostat命令 被用于监视系统输入输出设备和CPU的使用情况。

语法:

iostat (选项) (参数)

选项:
-c:仅显示CPU使用情况;
-d:仅显示设备利用率;
-k:显示状态以千字节每秒为单位,而不使用块每秒;
-m:显示状态以兆字节每秒为单位;
-p:仅显示块设备和所有被使用的其他分区的状态;
-t:显示每个报告产生时的时间;
-V:显示版号并退出;
-x:显示扩展状态。

参数:

间隔时间:每次报告的间隔时间(秒);次数:显示报告的次数。

字段说明:

r/s: 每秒完成的读 I/O 设备次数。w/s: 每秒完成的写 I/O 设备次数。rkB/s: 每秒读K字节数.是 rsect/s 的一半,因为每扇区大小为512字节。wkB/s: 每秒写K字节数.是 wsect/s 的一半。avgrq-sz: 平均每次设备I/O操作的数据大小 (扇区)。avgqu-sz: 平均I/O队列长度。await: 平均每次设备I/O操作的等待时间 (毫秒)。svctm: 平均每次设备I/O操作的服务时间 (毫秒)。%util: 一秒中有百分之多少的时间用于 I/O 操作,或者说一秒中有多少时间 I/O 队列是非空的。iotop

iotop命令 是一个用来监视磁盘I/O使用状况的top类工具。

iotop具有与top相似的UI,其中包括PID、用户、I/O、进程等相关信息。Linux下的IO统计工具如iostat,nmon等大多数是只能统计到per设备的读写情况,如果你想知道每个进程是如何使用IO的就比较麻烦,使用iotop命令可以很方便的查看。

语法:

iotop (选项)

选项:
-o:只显示有io操作的进程
-b:批量显示,无交互,主要用作记录到文件。
-n: NUM:显示NUM次,主要用于非交互式模式。
-d SEC:间隔SEC秒显示一次。
-p PID:监控的进程pid。
-u USER:监控的进程用户。

iotop常用快捷键:

左右箭头:改变排序方式,默认是按IO排序。r:改变排序顺序。o:只显示有IO输出的进程。p:进程/线程的显示方式的切换。a:显示累积使用量。q:退出。

进程ps

ps(Process Status,进程状态)命令 用于报告当前系统的进程状态。

ps 的用法非常多,这里仅列举一些常用的:

ps -aux | grep <name>      # 查看name 进程详细信息
ps -p <pid> -L             # 显示进程<pid> 的所有线程
ps -o lstart <pid>         # 显示进程的启动时间
ps -f --forest -C <name>   # 用树的风格显示进程的层次关系
ps -e -o pid,uname,pcpu,pmem,comm,etime  # 定制显示的列
ps -o lstart <pid>         # 显示进程的启动时间
系统监控全能工具glances

glances 是一个用来监视 GNU/Linux 和 FreeBSD 操作系统的 GPL 授权的全能工具。

Glances 会用一下几种颜色来代表状态:

绿色:OK(一切正常)蓝色:CAREFUL(需要注意)紫色:WARNING(警告)红色:CRITICAL(严重)。

阀值可以在配置文件中设置,一般阀值被默认设置为(careful=50、warning=70、critical=90)。

dstat

dstat命令 是一个用来替换vmstat、iostat、netstat、nfsstat和ifstat这些命令的工具。

直接使用dstat,默认使用的是-cdngy参数,分别显示cpu、disk、net、page、system信息,默认是1s显示一条信息。

参考链接Linux系统监控命令整理汇总-掌握CPU,内存,磁盘IO等找出性能瓶颈
特别申明:本文内容来源网络,版权归原作者所有,如有侵权请立即与我们联系(cy198701067573@163.com),我们将及时处理。

Tags 标签

加个好友,技术交流

1628738909466805.jpg