
chronyc tracking Root dispersion 异常高的上游 NTP 服务器问题处理
Root dispersion过高表示从权威时间源到本地时钟的累计最大误差估计值过大(通常>0.1s),说明NTP同步链路不可靠,可能导致chronyd拒绝校准或降权该源。 chronyc tracking 显示 Root dispersi...


Root dispersion过高表示从权威时间源到本地时钟的累计最大误差估计值过大(通常>0.1s),说明NTP同步链路不可靠,可能导致chronyd拒绝校准或降权该源。 chronyc tracking 显示 Root dispersi...

/dev/shm 被塞满会直接触发 OOM Killer 或导致进程写入失败,Redis、PostgreSQL、Java 等依赖共享内存的应用可能静默崩溃或拒绝服务;根本原因是 fork()、shm_open() 等系统调用在 /dev/s...

cron脚本找不到命令或环境变量是因为其使用非交互式、非登录式shell,不加载用户配置文件且PATH被限制为/usr/bin:/bin。应显式设置PATH、关键变量,用绝对路径调用命令,或通过bash -l -c加载profile;调试时...

UEFI/GPT与BIOS/MBR混搭导致无法启动的主因是引导模式与分区表类型不匹配;Swap大小应按内存容量和用途合理设置;根分区建议60–80GB;SSD分区须1MiB对齐;操作前务必备份分区表。 UEFI/GPT 与 BIOS/MBR...

这是典型的“已删除但未释放文件”问题:进程仍占用已被rm删除的文件句柄,导致df显示满而du统计小;可用lsof +L1或lsof|grep deleted定位,重启进程或kill释放,禁用echo>/proc//fd/清空。 df ...

负载高但CPU空闲是因为大量进程处于D状态(不可中断睡眠),它们不占CPU却计入load average;主因是I/O阻塞(如慢盘、NFS hard挂载、驱动异常)或内存直接回收。 top 显示 CPU 使用率低,但 load averag...

top和htop看不到带宽占用进程,因其不采集网络I/O数据;真实原因包括iptables转发、AF_PACKET抓包、eBPF程序、容器桥接绕过协议栈等,需用nethogs、ss、tc、bpftool等工具分层排查。 top 和 htop...

available 接近 0 就该警觉——它才是真实可用内存,低于总内存10%(如8G机器长期≤800M)表明内核正频繁交换,响应延迟明显;dmesg中“Killed process”即OOM已发生,需查oom_score_adj和RSS定...

平滑重启是在不中断现有连接、不丢弃处理中请求的前提下完成新旧进程切换,要求客户端无感知、TCP连接不断、长连接持续有效,依赖SO_REUSEPORT内核支持与进程协作机制。 什么是平滑重启(graceful restart) 平滑重启不是 ...

“No Space Left on Device”常因inode耗尽而非磁盘空间不足;每个文件独占一个inode,总数在格式化时固定,df -h无法反映,须用df -i查看IUse%;高危目录包括/var/log、/tmp、/var/spo...