xiaoyu966

浏览: 254100 次
性别:
来自: 北京

最近访客更多访客>>

又迟到了

fanan_666

jintao1982

xfworld

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

记录：解决后端server因一个timeout导致的雪崩

博客分类：

linux c
性能/优化

nginx proxy_read_timeout fail_timeout max_fails timeout

问题描述

问题分析

这里有三个问题：

1. httpclient超时后，一直retry，nginx会把请求分发到后端的所有webservice里，导致所有webservice全都去执行全表扫描，无法再对外服务。

2. httpclient的超时设置和nginx的超时设置不一致，导致nginx返回了结果，但是httpclient却始终无法接收到。

3. webservice被一个全表扫描的请求阻塞时，并没有被nginx的upstream策略剔除，会有新的请求分配到这个webservice，导致新的请求也timeout。

问题解决

对于三个问题，分别的解决方式如下：

1. 对于可能执行全表扫描这种危险操作的请求，通过添加索引等方式进行优化，缩短查询时间，并且禁止进行retry。

2. 将proxy_read_timeout设置成19秒（也就是小于等于httpclient的超时时间），保证超时的统一性。避免httpclient超时，而nginx还没有超时的情况。

3. nginx有max_fails和fail_timeout两个设置，max_fails=1 fail_timeout=120s; 表示server如果在120s内发生一次失败（超时或者拒绝连接）则将该server剔除出去，不再向其分发请求，120秒后再恢复服务。

如下例子：

upstream webService {
server 127.0.0.1:9001 max_fails=1 fail_timeout=120s;
server 127.0.0.1:9002 max_fails=1 fail_timeout=120s;
server 127.0.0.1:9003 max_fails=1 fail_timeout=120s;
}

这表示，如果webservice中的server发生一次超时，就停止服务2分钟。2分钟以后再恢复服务。

1
顶

2
踩

分享到：

买房四部曲之纪念自己人生中第一次买房 | python之记录一次内存泄露

2015-12-23 11:26
浏览 11606
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

记录：解决后端server因一个timeout导致的雪崩

问题描述

问题分析

问题解决

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

记录：解决后端server因一个timeout导致的雪崩

问题描述

问题分析

问题解决

评论

发表评论

相关推荐

nginx代理websocket连接上限

聊聊同步异步、阻塞非阻塞

记录：解决后端server因一个timeout导致的雪崩

python之记录一次内存泄露

nginx大量连接时，出现502错误

【转载】MySQL索引原理及慢查询优化

centos/rhel 下 nginx 自启动脚本

制作nginx的RPM包

软件设计之状态机

开源备份软件之bacula--介绍与源码框架

性能测试之观测---iostat

性能测试之观测---Atop

性能测试之----Netperf

性能测试之----IOZONE

一个简单的timer/watchdog程序

core文件自动生成的配置

XRDP在Windows下用远程桌面连接，键盘失效问题

最近访客更多访客>>