记录一次网站响应慢的问题排查

2025-07-08 18:35:00
丁国栋
原创 16
摘要:记录一次网站响应慢的问题排查。

测试同学反映有个网站很慢,需要排查一下。


  1. 打开网站发现确实比较慢,比平时和预期相差很多,但还是能打开
  2. 根据域名和IP找到对应的服务器,这是一台典型的 LNMP web 网站
  3. 通过 top 命令发现系统平均负载(load average)很高且从1分钟到5分钟、15分钟数值有增大趋势,但CPU整体利用率用在了user上,sys和wait较少可以排除磁盘性能问题
  4. 通过 vmstat、iotop 命令确认读写速率正常,通过 df -h 命令确认磁盘利用率正常
  5. 通过 top 命令查看到 MySQL 进程负载最高,4核 CPU占用了 300%,内存 6%
  6. 登录 MySQL 服务器,使用 show full processlist 发现某个表存在大量读写,同时伴有表级锁(该表的表引擎是MyiSAM)
  7. 查看 Nginx 网站访问日志,日志滚动速率不高
  8. 通过 netstat 命令查询已经建立连接的连接(ESTABLISHED状态),发现数量不多,且每个IP也不算多
  9. 通过 nethogs 检查网络带宽,发现没有进程网络带宽很高
  10. 检查系统计划任务查看是否有网站计划任务执行可能导致的性能问题,发现没有这个时间的相关计划任务
  11. 排查过程中发现负载逐渐降低,恢复到正常水平,再查看 MySQL 进程,发现查询已经恢复到正常数量


发表评论
博客分类