
vm.dirty_ratio / dirty_background_ratio 写脏页过多导致写入卡顿的调优
vm.dirty_ratio和vm.dirty_background_ratio引发写入卡顿是因为脏页占比超阈值时,前者导致write()阻塞,后者触发后台刷盘;当磁盘吞吐不足,脏页持续堆积至vm.dirty_ratio,所有写操作被内核阻...


vm.dirty_ratio和vm.dirty_background_ratio引发写入卡顿是因为脏页占比超阈值时,前者导致write()阻塞,后者触发后台刷盘;当磁盘吞吐不足,脏页持续堆积至vm.dirty_ratio,所有写操作被内核阻...

Linux中删除文件后空间未释放,主因是进程仍占用已删文件句柄;需用lsof +L1定位,再重启进程或平滑重载日志,而非直接kill -9。 文件被进程占用导致空间无法释放 Linux 中删除文件只是移除了目录项(unlink),如果仍有进...

perf record 不能直接抓到丢包动作,需配合 skb:kfree_skb 等 tracepoint 定位丢包环节;bpftrace 可动态过滤丢包条件;ping 与业务包路径分离,RPS 不均是常见原因;perf 与 bpftrac...

Linux改用CFS调度器基于vruntime动态调度而非固定时间片,以实现按权重公平分配CPU时间;高nice值进程vruntime增长快、调度少,交互进程唤醒时vruntime被调低而优先运行。 Linux 不再用固定时间片分配 CPU...

RCU stall 是软锁或中断风暴的症状而非原因;关键依据是softirq堆积、idle=000/0/0及ksoftirqd高CPU占用;可用sysrq实时抓栈,ftrace定位耗时函数,参数调优仅缓解不根治。 确认 stall 是否真由...

chrony 显示 stratum 16 表示主动拒绝同步,非网络不通,而是因严格校验 stratum、leap 状态、refid 自引用或 maxdistance 超限;ntpdate 则无视协议规则直接跳变时间。 chrony 显示 s...

Load Average 是活跃进程队列长度的指数加权平均,统计 R 和 D 状态进程数,非 CPU 使用率;需结合 CPU 核数归一化判断,三值斜率反映趋势,D 状态多时 Load 高但 CPU 可能很低。 Load Average 不是...

僵尸进程无法被kill -9终止,因其已死亡,仅剩进程表条目需父进程调用wait()回收;唯一有效方法是让父进程收尸或重启父进程使其被init接管。 僵尸进程根本杀不死,只能让父进程“收尸” 直接说结论:你 kill -9 一个状态为 Z ...

大量TIME_WAIT会耗尽端口并占用内存,导致“Cannot assign requested address”等错误;根本解法是应用层复用连接(如HTTP Keep-Alive、连接池),而非仅依赖内核参数调优。 为什么大量 TIME_...

小文件过多会拖慢ls、find等工具,因元数据操作成瓶颈;inode耗尽比磁盘满更早发生;rm -rf删海量小文件极慢且不可中断;根本解法是应用层规避小文件堆积。 小文件过多会拖慢 ls、find 和备份 不是因为单个文件读取慢,而是元数据...