在一个WEB项目中需要用到NGINX做反向代理的负载,项目的服务器情况如下:
121.199.64.178该服务器安装nginx作为负载接入入口
192.168.0.2 安装APACHE ,作为后端的主WEB1
192.168.0.3 安装APACHE ,作为后端的主WEB2
每台服务器的具体配置情况如下:
(1) 121.199.64.178 作为接入的入口服务器的配置如下:
#--------------------------- Load Balance --------------------------------#
upstream www {
server 192.168.0.2:80 weight=1;
server 192.168.0.3:80 weight=1;
ip_hash;
}
server {
listen 88;
server_name www.fuzai.com;
location / {
proxy_pass http://www;
proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
}
}
该配置是将访问 这个域名的用户流量全部通过反向代理的方式负载到后端 192.168.0.2 和 192.168.0.3 两个服务器上。
(2)192.168.0.2 和 192.168.0.3 安装的APACHE,配置是一样的,具体配置如下:
<VirtualHost *:80>
DocumentRoot /alidata/www/new
ServerName www.fuzai.com
ServerAlias .com
<Directory "/alidata/www/new">
Options -Indexes FollowSymLinks
AllowOverride all
Order allow,deny
Allow from all
</Directory>
ErrorLog "/alidata/log/httpd/access/fuzai-error.log"
CustomLog "/alidata/log/httpd/access/fuzai.log" common
</VirtualHost>
通过以上配置,分别启动NGINX和APACHE的服务,一切顺利,NGINX服务的入口流量分别等负荷方式平均分担后端的两个APACHE服务器。运行了几天似乎挺顺畅,就在以为就此告一段落的情况下,问题产生了,就是这个WEB项目有个导出报表的功能,该功能在月底才会用,导出的数量非常大,很多人反馈数据无法导出。我自己也测试了一下,也无法导出。
在无法定位故障原因的情况下,我在后端192.168.0.2服务器上上为这个WEB项目配置了另外一个域名,这样可以访问直接访问192.168.0.2服务器f,就跳开NGINX的反向代理,测试数据导出功能,能够正常导出,就是时间比较长大约在3分钟左右。
我又重新通过NGINX入口的方式访问该项目,在测试导出数据这个环节,进行了抓包跟踪,发现从出
发导数据的之后之后大约过了60S,系统就自动终止,并其跳转到登陆URL.通过抓包分析确定应该nginx的超时机制导致,查阅资料发现,NGINX的默认超时机制是60S,具体需要修改的超时参数如下,该参数是在NGINX 的HTTP模块中添加:
proxy_connect_timeout 600; \\跟后端服务器连接的超时时间,发起握手等候响应超时时间
proxy_read_timeout 600;\\连接成功 _等候后端服务器的响应时间_其实已经进入后端的排队中等候处理
proxy_send_timeout 600; \\后端服务器回传时间_就是在规定时间内后端服务器必须传完所有的数据。设置代理服务器转发请求的超时时间,同样指完成两次握手后的时间,如果超过这个时间代理服务器没有数据转发到后端服务器,nginx将关闭连接。
将这三个参数的时间全部设置为600S之后,重新启动NGINX服务,测试数据的导出功能,一切正常。