在一个WEB项目中需要用到NGINX做反向代理的负载,项目的服务器情况如下:

121.199.64.178该服务器安装nginx作为负载接入入口

192.168.0.2 安装APACHE ,作为后端的主WEB1

192.168.0.3 安装APACHE ,作为后端的主WEB2

每台服务器的具体配置情况如下:

(1) 121.199.64.178 作为接入的入口服务器的配置如下:

 #--------------------------- Load Balance --------------------------------#

  upstream  www  {

              server   192.168.0.2:80 weight=1;

              server   192.168.0.3:80 weight=1;

              ip_hash;

    }  

    server {

        listen       88;

        server_name  www.fuzai.com;

        location / {

                       proxy_pass        http://www;

                       proxy_set_header   Host             $host;

                       proxy_set_header   X-Real-IP        $remote_addr;

                       proxy_set_header   X-Forwarded-For  $proxy_add_x_forwarded_for;

              }

    }

该配置是将访问 这个域名的用户流量全部通过反向代理的方式负载到后端 192.168.0.2  和 192.168.0.3 两个服务器上。

(2)192.168.0.2 和 192.168.0.3 安装的APACHE,配置是一样的,具体配置如下:

<VirtualHost *:80>

DocumentRoot /alidata/www/new

ServerName www.fuzai.com

ServerAlias .com

<Directory "/alidata/www/new">

   Options -Indexes FollowSymLinks

   AllowOverride all

   Order allow,deny

   Allow from all

</Directory>

ErrorLog "/alidata/log/httpd/access/fuzai-error.log"

CustomLog "/alidata/log/httpd/access/fuzai.log" common

</VirtualHost>

通过以上配置,分别启动NGINX和APACHE的服务,一切顺利,NGINX服务的入口流量分别等负荷方式平均分担后端的两个APACHE服务器。运行了几天似乎挺顺畅,就在以为就此告一段落的情况下,问题产生了,就是这个WEB项目有个导出报表的功能,该功能在月底才会用,导出的数量非常大,很多人反馈数据无法导出。我自己也测试了一下,也无法导出。

    在无法定位故障原因的情况下,我在后端192.168.0.2服务器上上为这个WEB项目配置了另外一个域名,这样可以访问直接访问192.168.0.2服务器f,就跳开NGINX的反向代理,测试数据导出功能,能够正常导出,就是时间比较长大约在3分钟左右。

    我又重新通过NGINX入口的方式访问该项目,在测试导出数据这个环节,进行了抓包跟踪,发现从出

发导数据的之后之后大约过了60S,系统就自动终止,并其跳转到登陆URL.通过抓包分析确定应该nginx的超时机制导致,查阅资料发现,NGINX的默认超时机制是60S,具体需要修改的超时参数如下,该参数是在NGINX 的HTTP模块中添加:

    proxy_connect_timeout 600; \\跟后端服务器连接的超时时间,发起握手等候响应超时时间 

    proxy_read_timeout 600;\\连接成功 _等候后端服务器的响应时间_其实已经进入后端的排队中等候处理

    proxy_send_timeout 600;  \\后端服务器回传时间_就是在规定时间内后端服务器必须传完所有的数据。设置代理服务器转发请求的超时时间,同样指完成两次握手后的时间,如果超过这个时间代理服务器没有数据转发到后端服务器,nginx将关闭连接。 

将这三个参数的时间全部设置为600S之后,重新启动NGINX服务,测试数据的导出功能,一切正常。