为什么需要巡检
个人博客最常见问题不是“不会搭”,而是“跑一阵后变慢、报错、忘备份”。这篇给你一套每周 15 分钟可执行 SOP。
巡检架构
链路:访问可用性 → 资源健康(CPU/内存/磁盘)→ 备份状态 → 安全更新 → 日志复盘。
每周 SOP(15 分钟)
- 可用性:打开首页、文章页、后台页各1次
- 性能:检查响应速度、是否出现 502/超时
- 备份:确认最近一次备份成功并可恢复
- 安全:更新高风险插件/主题,删除无用插件
- 日志:记录本周异常与修复动作
指标
- 可用性:7天内无持续不可访问
- 恢复能力:最近备份可用
- 变更可追溯:每次修改有记录
结论
站点稳定性靠小步快跑的维护节奏,不靠一次性大修。
附:巡检记录模板(直接复制)
日期 | 可用性 | 性能 | 备份状态 | 安全更新 | 异常记录 | 处理结果
建议固定每周同一时间执行,形成连续记录,方便定位趋势问题。
巡检架构图(建议固定在值班手册)
建议按“入口层(Nginx) → 应用层(PHP-FPM/WordPress) → 数据层(MySQL/Redis) → 备份层(Updraft/快照)”顺序检查,避免遗漏。
每周 15 分钟 SOP(细化版)
0-3 分钟:系统健康快照
uptime
free -h
df -h
sudo systemctl --failed
3-7 分钟:Web 与应用链路
sudo nginx -t
sudo systemctl status nginx --no-pager
sudo systemctl status php8.2-fpm --no-pager
异常关键词:failed / timeout / too many open files。
7-11 分钟:日志与错误趋势
sudo tail -n 120 /var/log/nginx/error.log
sudo tail -n 120 /var/log/php8.2-fpm.log
若出现重复错误,记录频率和时间段,进入“下周修复清单”。
11-13 分钟:备份可用性验证
- 确认最近一次备份时间与文件完整性
- 随机下载一个备份包校验可读性
- 确认恢复入口可访问
13-15 分钟:复盘与动作闭环
- 更新巡检表(日期、异常、处理人)
- 新增一个可执行改进项(例如:调高FPM子进程)
- 标注风险等级(高/中/低)
模块分类优化(本篇)
本篇核心是运维SOP,分类建议保留:服务器运维 + 计算机技术,去掉“建站实战”以减少语义重叠。