4.6.1 CPU工作原理与调度机制概览

CPU 是系统执行指令与调度任务的核心资源，其工作原理与调度机制直接影响进程运行效率与整体性能稳定性。本节从运维视角概览 CPU 执行模型与 Linux 调度机制，并配套可执行示例、排错要点与练习。

1. CPU 基本执行模型（概览）
- 指令周期：取指→译码→执行→访存→回写。
- 核心与线程：多核并行；超线程提升吞吐但不等于性能翻倍。
- 上下文切换：切换保存/恢复寄存器、页表与栈，频繁切换会带来额外开销。

原理草图（调度与运行队列）

2. 调度目标与设计原则
- 公平性：确保任务获得合理 CPU 时间。
- 响应性：交互式任务快速响应。
- 吞吐量：单位时间完成任务更多。
- 负载均衡：多核之间平衡运行队列。

3. Linux 调度机制概览
- CFS（完全公平调度器）：基于虚拟运行时间，红黑树维护可运行任务。
- 调度实体：进程/线程以权重（nice 值）参与分配。
- 时间片与抢占：支持抢占式调度，保证高优先级任务及时运行。
- CPU 亲和性：固定任务到指定 CPU 核心，减少迁移与缓存失效。

关键命令与示例（含解释）#

示例 1：查看 CPU 拓扑与超线程

lscpu
# 关注字段：CPU(s)、Core(s) per socket、Thread(s) per core、NUMA node(s)

示例 2：查看进程/线程调度与 CPU 迁移

# 查看 PID 1234 的调度策略与优先级
chrt -p 1234

# 查看线程级别 CPU 分配与迁移
ps -eLo pid,tid,psr,cls,pri,ni,cmd | head -n 10
# psr: 当前运行的 CPU 核心编号

示例 3：设置进程优先级（nice）与解释

# 启动任务并设置 nice 值为 10（值越大优先级越低）
nice -n 10 bash -c 'while :; do :; done' &
# 调整正在运行进程的 nice
renice -n 5 -p $!

示例 4：CPU 亲和性绑定

# 查看进程亲和性
taskset -cp 1234

# 将 PID 1234 绑定到 CPU0 和 CPU1
taskset -cp 0,1 1234
# 预期效果：进程 psr 多数时间只在 0/1 核切换

示例 5：实时观察上下文切换与中断

# 1 秒刷新一次
vmstat 1
# 关注字段：
# cs = 上下文切换次数
# in = 中断次数

运维排错要点（含步骤）#

场景：CPU 使用率高但吞吐低
1. 检查上下文切换与中断：

vmstat 1 5
# 若 cs/in 过高，可能存在频繁唤醒或锁竞争

查看进程迁移与亲和性：

ps -eLo pid,tid,psr,cmd | awk 'NR==1 || $3==0 {print}'
taskset -cp <PID>

检查是否存在高优先级任务挤占：

ps -eo pid,cls,pri,ni,cmd --sort=-pri | head
# cls=RT 说明实时调度，需谨慎

场景：单核跑满，其它核空闲
1. 查看是否绑定了 CPU：

taskset -cp <PID>

若绑定不合理，恢复全核：

taskset -cp 0-$(($(nproc)-1)) <PID>

小练习（带预期效果）#

练习 1：制造 CPU 负载并观察调度

# 启动 2 个满负载任务
bash -c 'while :; do :; done' &
bash -c 'while :; do :; done' &

# 观察在哪些 CPU 核运行
ps -eLo pid,tid,psr,cmd | grep "while :; do :; done"

# 预期：任务分布在不同 CPU，psr 显示多个核心

练习 2：比较绑定前后缓存友好性

# 绑定进程到 CPU0
taskset -cp 0 <PID>

# 观察 5 秒内 psr 是否保持为 0
ps -eLo pid,tid,psr,cmd | grep "<PID>"
# 预期：psr 持续为 0，迁移减少

小结#

CFS 通过虚拟运行时间实现公平调度；
频繁上下文切换与中断会显著影响 CPU 有效吞吐；
亲和性与优先级是运维调度优化的主要抓手。

4.6.1 CPU工作原理与调度机制概览

关键命令与示例（含解释）#

运维排错要点（含步骤）#

小练习（带预期效果）#

小结#

本页内容