2021-07-18发表2021-07-18更新Linux6 分钟读完 (大约860个字)

Linux平均负载

一、什么是平均负载

平均负载（Load Average）是指一段时间内，系统处于可运行状态和不可中断状态的平均进程数，这个一段时间一般取 1 分钟、5 分钟、15 分钟。

CPU 使用率是单位时间内 CPU 繁忙情况的统计，跟平均负载并不完全对应，平均负载不仅包括正在使用 CPU 的进程，还包括等待 CPU 和等待 I/O的进程，比如：

CPU 密集型进程，使用大量 CPU 回导致平均负载升高
I/O 密集型进程，等待 I/O 也会使平均负载升高，但 CPU 使用率不一定高
大量等待 CPU 的进程调度也会导致平均负载升高，此时 CPU 使用率也会比较高

2018-12-21发表2020-04-19更新Linux6 分钟读完 (大约873个字)

CPU使用率

什么是 CPU 使用率

CPU 使用率就是除了空闲时间外的其他时间占总 CPU 时间的百分比

事实上，为了计算 CPU 使用率，性能工具一般都会取间隔一段时间（比如 3 秒）的两次值，作差后，再计算出这段时间内的平均 CPU 使用率，即

需要注意的是，**>性能分析工具给出的都是间隔一段时间的平均 CPU 使用率，所以要注意间隔时间的设置**，特别是用多个工具对比分析时，你一定要保证它们用的是相同的间隔时间。

怎么查看 CPU 使用率

top 显示了系统总体的 CPU 和内存使用情况，以及各个进程的资源使用情况。
- 系统的 CPU 使用率(%Cpu)
pidstat 专门分析每个进程 CPU 使用情况的工具
- 用户态 CPU 使用率（%usr）；
- 内核态 CPU 使用率（%system）；
- 运行虚拟机 CPU 使用率（%guest）；
- 等待 CPU 使用率（%wait）；
- 以及总的 CPU 使用率（%CPU）。
perf 分析 CPU 性能问题
pstree 用树状形式显示所有进程之间的关系,可以用来查找一个进程的父进程
execsnoop 专为短时进程设计的工具

CPU 使用率过高怎么办？

CPU 使用率是最直观和最常用的系统性能指标，更是我们在排查性能问题时，通常会关注的第一个指标。所以我们更要熟悉它的含义，尤其要弄清楚用户（%user）、Nice（%nice）、系统（%system）、等待 I/O（%iowait）、中断（%irq）以及软中断（%softirq）这几种不同 CPU 的使用率。比如说：
- 用户 CPU 和 Nice CPU 高，说明用户态进程占用了较多的 CPU，所以应该着重排查进程的性能问题。
- 系统 CPU 高，说明内核态占用了较多的 CPU，所以应该着重排查内核线程或者系统调用的性能问题。
- I/O 等待 CPU 高，说明等待 I/O 的时间比较长，所以应该着重排查系统存储是不是出现了 I/O 问题。
- 软中断和硬中断高，说明软中断或硬中断的处理程序占用了较多的 CPU，所以应该着重排查内核中的中断服务程序。
碰到 CPU 使用率升高的问题，你可以借助 top、pidstat 等工具，确认引发 CPU 性能问题的来源；再使用 perf 等工具，排查出引起性能问题的具体函数。
碰到常规问题无法解释的 CPU 使用率情况时，首先要想到有可能是短时应用导致的问题，比如有可能是下面这两种情况。
- 应用里直接调用了其他二进制程序，这些程序通常运行时间比较短，通过 top 等工具也不容易发现
- 应用本身在不停地崩溃重启，而启动过程的资源初始化，很可能会占用相当多的 CPU

2018-12-17发表2020-04-19更新Linux10 分钟读完 (大约1480个字)

CPU上下文切换

什么是 CPU 上下文切换

CPU 寄存器，是 CPU 内置的容量小、但速度极快的内存。程序计数器，则是用来存储 CPU 正在执行的指令位置、或者即将执行的下一条指令位置。它们都是 CPU 在运行任何任务前，必须的依赖环境，因此也被叫做CPU 上下文。

CPU 上下文切换，就是先把前一个任务的 CPU 上下文（也就是 CPU 寄存器和程序计数器）保存起来，然后加载新任务的上下文到这些寄存器和程序计数器，最后再跳转到程序计数器所指的新位置，运行新任务。

进程上下文切换

Linux 按照特权等级，把进程的运行空间分为内核空间和用户空间。

内核空间（Ring 0）具有最高权限，可以直接访问所有资源。
用户空间（Ring 3）只能访问受限资源，不能直接访问内存等硬件设备，必须通过系统调用陷入到内核中，才能访问这些特权资源。
系统调用(特权模式切换):一个进程用户态与内核态的互相转变
上下文切换:从一个进程切换到另一个进程运行
- 虚拟内存、栈、全局变量等用户空间的资源
- 内核堆栈、寄存器等内核空间的状态

一次系统调用的过程，发生了两次 CPU 上下文切换。

什么时候会发生？

进程 CPU 时间片耗尽，被系统挂起，切换到其他正在等待 CPU 的进程
系统资源不足时进程被系统挂起，系统调度其他进程运行
进程通过睡眠函数 sleep 这样的方法将自己主动挂起
有优先级更高的进程运行，当前程序会被挂起
发生硬件中断，转而执行内核中的终端服务程序

线程上下文切换

线程与进程的区别

线程是调度的基本单位，而进程是资源拥有的基本单位
当进程只有一个线程时，可以认为进程就等于线程
当进程拥有多个线程时，这些线程会共享相同的虚拟内存和全局变量等资源，在上下文切换时，这些资源不需要修改
线程有自己的私有数据，例如栈和寄存器等，在上下文切换时需要保存

什么时候会发生

前后两个线程属于不同进程。此时因为资源不共享，因此等同于进程上下文切换
前后两个线程属于同一个进程，因为虚拟内存共享，所以只需要切换私有数据、寄存器等不共享的数据

虽然同为上下文切换，但同进程内的线程切换，要比多进程间的切换消耗更少的资源，而这，也正是多线程代替多进程的一个优势。

中断上下文切换

中断处理会打断进程的正常调度和执行
对同一个 CPU 来说，中断处理比进程拥有更高的优先级

怎么查看系统的上下文切换情况

vmstat

vmstat 是一个常用的系统性能分析工具，主要用来分析系统的内存使用情况，也常用来分析 CPU 上下文切换和中断的次数。

需要特别关注的四列内容：
- cs(context switch) 表示每秒上下文切换的次数
- in(interrupt)表示每秒中断次数
- r(Running or Runnable)表示就绪队列的长度，也就是正在运行和等待 CPU 的进程数
- b(Blocked)表示处于不可中断睡眠状态的进程数 #每隔 5 秒输出一组数据

pidstat

vmstat 只给出了系统总体的上下文切换情况，要想查看每个进程的详细情况，就需要使用 pidstat 了。给它加上 -w 选项，你就可以查看每个进程上下文切换的情况了。

需要特别关注的两列内容
- cswch 表示每秒自愿上下文切换的次数
- nvcswch 表示每秒非自愿上下文切换的次数

自愿上下文切换：进程无法获取所需资源
非自愿上下文切换：进程由于时间片已到等原因，被系统强制调度

自愿上下文切换变多了，说明进程都在等待资源，有可能发生了 IO 等其他问题
非自愿上下文切换变多了，说明进程都在被强制调度，即在争抢 CPU，说明 CPU 成为瓶颈
中断次数变多了，说明 CPU 被中断处理程序占用，还需要通过查看/proc/interrupts 文件来分析具体的中断类型

小结：

不管是哪种场景导致的上下文切换，我们应该知道：

CPU 上下文切换，是保证 Linux 系统正常工作的核心功能之一，一般情况下不需要我们特别关注。
但过多的上下文切换，会把 CPU 时间消耗在寄存器、内核栈以及虚拟内存等数据的保存和恢复上，从而缩短进程真正运行的时间，导致系统的整体性能大幅下降。

碰到上下文切换次数过多的问题时，我们可以借助 vmstat 、 pidstat 和 /proc/interrupts 等工具，来辅助排查性能问题的根源。

2018-09-30发表2020-04-19更新Linux4 分钟读完 (大约570个字)

netstat命令详解

功能说明

netstat 命令用来打印 Linux 中网络系统的状态信息，它可以用来查询整个 Linux 系统的网络情况，包括 tcp,udp 以及 Unix 套接字；另外它还能列出路由表，接口状态和多播成员等信息。

选项

-a 或–all：显示所有连线中的 Socket；
-A<网络类型>或–<网络类型>：列出该网络类型连线中的相关地址；
-c 或–continuous：持续列出网络状态；
-C 或–cache：显示路由器配置的快取信息；
-e 或–extend：显示网络其他相关信息；
-F 或–fib：显示 FIB；
-g 或–groups：显示多重广播功能群组组员名单；
-h 或–help：在线帮助；
-i 或–interfaces：显示网络界面信息表单；
-l 或–listening：显示监控中的服务器的 Socket；
-M 或–masquerade：显示伪装的网络连线；
-n 或–numeric：直接使用 ip 地址，而不通过域名服务器；
-N 或–netlink 或–symbolic：显示网络硬件外围设备的符号连接名称；
-o 或–timers：显示计时器；
-p 或–programs：显示正在使用 Socket 的程序识别码和程序名称；
-r 或–route：显示 Routing Table；
-s 或–statistice：显示网络工作信息统计表；
-t 或–tcp：显示 TCP 传输协议的连线状况；
-u 或–udp：显示 UDP 传输协议的连线状况；
-v 或–verbose：显示指令执行过程；
-V 或–version：显示版本信息；
-w 或–raw：显示 RAW 传输协议的连线状况；
-x 或–unix：此参数的效果和指定”-A unix”参数相同；
–ip 或–inet：此参数的效果和指定”-A inet”参数相同。

常用命令

#列出所有端口（LISTEN，ESTABLISHED）
netstat -a     #列出所有端口
netstat -at    #列出所有tcp端口
netstat -au    #列出所有udp端口

#查看程序运行的端口（LISTEN，ESTABLISHED）
netstat -ap
netstat -ap | grep '程序名'
netstat -ap | grep 8080

#显示路由表的信息
netstat -r

#持续输出netstat信息
netstat -c   #每隔一秒输出网络信息

#显示网络接口列表
netstat -i