Nginx反代失效排查记录，坑在了一个细节上

记一次Nginx反向代理失效的排查：原来是被这个细节坑了

大家好，我是33blog的技术博主。今天想分享一个最近遇到的Nginx反向代理失效的案例，整个过程就像侦探破案一样，最终发现是一个很容易被忽略的配置细节导致的。如果你也遇到过类似问题，不妨看看这篇排查记录。

问题现象：反向代理突然失效

那天我正在给客户部署一个新的Web服务，按照常规操作配置了Nginx反向代理。这本来是个很简单的任务，我闭着眼睛都能完成——至少我是这么认为的。

配置完成后，访问代理地址时却直接返回502 Bad Gateway。更奇怪的是，直接访问后端服务是正常的，但通过Nginx代理就不行。

第一轮排查：检查基础配置

我首先检查了最基本的Nginx配置：

看起来一切正常，proxy_pass指向了正确的后端地址，header设置也没问题。我开始怀疑是不是网络连通性问题。

第二轮排查：网络连通性测试

我在Nginx服务器上执行了telnet测试：

连接成功！这说明网络层面没有问题。那么问题可能出在Nginx和后端服务的交互上。

深入排查：查看Nginx错误日志

这时候我才想起来应该看看Nginx的错误日志（/var/log/nginx/error.log），果然发现了关键线索：

这很奇怪，因为telnet明明能连通。我开始怀疑是不是DNS解析的问题。

关键发现：原来是这个细节在作怪

经过一番折腾，我终于发现问题所在：后端服务容器重启后IP变了，但Nginx没有重新解析DNS！

Nginx默认会缓存上游服务的DNS解析结果，直到重启或重载配置。这意味着当容器IP变化时，Nginx还在尝试连接旧的IP地址。

解决方案：配置DNS解析刷新

解决方法很简单，在proxy_pass配置中添加resolver并设置有效期：

这里的关键点：

使用变量$backend来存储代理地址
配置resolver并设置valid=10s，让Nginx每10秒重新解析DNS

经验总结

这次踩坑让我学到了：

Nginx默认会缓存DNS解析结果，这在容器环境中特别容易出问题
排查问题时，日志永远是第一手资料
看似简单的配置，往往藏着意想不到的陷阱

希望这篇记录能帮到遇到类似问题的朋友。如果你有更好的解决方案，欢迎在评论区交流！

幻光迷踪 • 06-23回复

这个坑我也踩过！Nginx的DNS缓存问题在容器编排环境里简直是个隐形杀手 😅

泡泡糖气球 • 06-23回复

博主日志排查思路很清晰，学到了，下次遇到502知道从哪儿下手了

浅草未央 • 06-23回复

遇到过一模一样的问题，折腾了半天才发现是DNS缓存，加了resolver立马解决

头顶西红柿 • 06-25回复

建议加上proxy_next_upstream相关配置，这样即使某个后端挂了也能自动切到正常的

小风铃 • 06-25回复

这种细节问题最坑人了，感谢分享经验 👍

Nginx反代失效排查记录，坑在了一个细节上

记一次Nginx反向代理失效的排查：原来是被这个细节坑了

问题现象：反向代理突然失效

第一轮排查：检查基础配置

第二轮排查：网络连通性测试

深入排查：查看Nginx错误日志

关键发现：原来是这个细节在作怪

解决方案：配置DNS解析刷新

经验总结

热门话题

评论

图文推荐

解决《巫师3》游戏卡顿问题的几种方式

Linux 下如何优雅地切换多个网络配置文件

使用Rank Math设置TDK模板，让每篇文章更SEO

网站突然502，PHP进程全挂了，原因竟然是日志暴涨

宝塔9.6版本安全设置全面解读

标签云