首页  杂七杂八  正文

实测配置多个反向代理的负载均衡方案

2025.7.9 33blog 杂七杂八 2003

33BLOG智能摘要

公司网站因业务暴增导致单台 Nginx 反向代理性能不足，运维人员搭建了基于 HAProxy 和 Nginx 的多节点负载均衡方案。第一层使用 2 台 HAProxy 通过 TCP 实现主备，第二层分配 3 台 Nginx 处理 HTTP 请求，第三层是业务服务器集群。HAProxy 配置需开启 TCP keepalive 并设置好连接检测参数，Nginx 通过 keepalive 和 HTTP 1.1 连接复用实现性能优化。监控方面采用 Prometheus + Grafana 和 Elastic Stack 组合，保证系统稳定性与安全性。该方案最终实现日均 500 万 PV、单点故障切换时间低于 3 秒、整体延迟降低 15% 的效果。

— 此摘要由33BLOG基于AI分析文章内容生成，仅供参考。

实战笔记：我用 Nginx + HAProxy 搭建高可用负载均衡的踩坑实录

实测配置多个反向代理的负载均衡方案

大家好，我是 33blog 的运维老司机。上周公司业务量突然暴增，单台 Nginx 反向代理服务器直接被打爆，被迫连夜搭建多节点负载均衡。今天就把这次实战中趟过的坑和最终方案分享给大家，特别适合中小型网站从单节点向高可用架构过渡的场景。

为什么需要多层代理？

最开始我觉得 Nginx 本身就有负载均衡功能，直接 upstream 不就行了？但实际压测时发现：当后端服务达到 20+ 个时，单 Nginx 的 CPU 成了瓶颈。更可怕的是，这台机器如果宕机，整个服务就全挂了。

最终方案变成了：

第一层：2 台 HAProxy 做 TCP 层负载均衡（主备+keepalived）
第二层：3 台 Nginx 做 HTTP 反向代理
第三层：业务服务器集群

这样既解决了单点故障，又能根据协议特性分层处理。

HAProxy 配置的魔鬼细节

配置 HAProxy 时我犯了个低级错误：没开 TCP keepalive。结果长连接被中间路由器悄悄掐断，导致诡异的 502 错误。后来加上这些参数才稳定：

frontend web
    bind *:80
    mode tcp
    option tcplog
    timeout client 1h
    default_backend nginx_nodes

backend nginx_nodes
    mode tcp
    balance roundrobin
    option tcp-check
    server nginx1 192.168.1.101:80 check inter 5s
    server nginx2 192.168.1.102:80 check inter 5s
    server nginx3 192.168.1.103:80 check inter 5s

特别注意 mode tcp 和 option tcp-check 的配合，比单纯用 HTTP 检查更节省资源。

Nginx 的调优技巧

第二层 Nginx 的优化重点在连接复用。我们的业务包含大量小图片请求，默认配置根本扛不住：

upstream backend {
    keepalive 32;  # 连接池大小
    server 10.0.1.1:8080;
    server 10.0.1.2:8080;
}

server {
    location / {
        proxy_http_version 1.1;
        proxy_set_header Connection "";
        proxy_pass http://backend;
    }
}

关键点在于 keepalive 和 proxy_http_version 1.1 的组合，这比短连接模式减少了 60% 的 TCP 握手开销。不过要注意监控内存使用情况，连接数太多会 OOM。