首页  杂七杂八  正文

网站突然502，PHP进程全挂了，原因竟然是日志暴涨

2025.6.23 33blog 杂七杂八 838

33BLOG智能摘要

凌晨2点17分，电商网站突发502错误，PHP-FPM进程全部消失。排查发现系统盘空间已满，/var/log目录占用47GB，原因是新上线的支付接口记录完整请求数据，包括base64编码图片，导致日志迅速膨胀。每分钟调用2000+次，单小时日志增长3GB。紧急处理采用truncate清空日志并配置logrotate，长期优化则包括过滤敏感信息与关闭生产环境的DEBUG日志。经验总结为预留系统盘空间、遵循日志最小必要原则、新功能需配监控。

— 此摘要由33BLOG基于AI分析文章内容生成，仅供参考。

深夜惊魂：网站突发502，PHP进程集体罢工的真相

网站突然502，PHP进程全挂了，原因竟然是日志暴涨

凌晨2点17分，手机突然疯狂震动——监控报警！我负责的电商网站突然大面积502，后台显示所有PHP-FPM进程全部消失。作为经历过无数次深夜故障的老司机，这次的情况却让我头皮发麻…

一、故障现象：毫无征兆的集体阵亡

登录服务器后看到这样的场景：

$ systemctl status php-fpm
● php-fpm.service - The PHP FastCGI Process Manager
   Loaded: loaded (/usr/lib/systemd/system/php-fpm.service; enabled)
   Active: failed (Result: timeout) since Thu 2023-05-18 02:15:32 CST

更诡异的是，重启服务后不到5分钟又会崩溃。查看/var/log/php-fpm.log发现大量这样的记录：

WARNING: [pool www] seems busy (you may need to increase pm.start_servers)

二、抽丝剥茧：从磁盘空间突破

正当我准备调整PHP进程参数时，突然发现df -h显示：

/dev/vda1        50G   50G   20K 100% /

好家伙，磁盘居然被塞满了！用du -sh /* | sort -rh快速定位，发现/var/log目录占用了惊人的47GB。

三、真相大白：失控的日志洪水

进一步检查发现，某个新上线的支付接口在疯狂写日志：

// 错误示范：未关闭的调试日志
$log->debug('支付请求参数：', $_REQUEST); // 包含整个$_REQUEST数组！

这个接口每分钟被调用2000+次，每次记录完整的请求数据（包含base64编码的图片），单个日志文件每小时就能涨到3GB！

四、止血与预防：我的组合拳

紧急处理：

用truncate -s 0 /var/log/payment.log清空日志文件（比rm更安全）
临时增加logrotate配置，按小时切割日志

长期方案：

// 1. 敏感信息过滤
$log->debug('支付请求', [
    'order_id' => $request['order_id'],
    'amount' => $request['amount']
    // 过滤掉$_REQUEST原始数据
]);

// 2. 生产环境关闭DEBUG日志
if (env('APP_ENV') === 'production') {
    $log->setLevel(Logger::INFO);
}