先说下我们网站的架构,由于目前网站访问量不是很大,但是由于最近公司网站要推广,所以将网站由单机切换成前端用nginx做负载均衡,带动两台web服务器,所有网页和静态文件都通过NFS共享调用,NFS服务装在其中的一个web服务器上,后端用mysql主从的方式,是很典型的架构。
切换成这个架构才2天,就收到nagios的报警,报警信息显示有一台web服务器负载很高,于是通过SecureCRT登录到服务器上,用top命令看了一下,发现有几个php-cgi进程占用了大量的CPU,如下:
13889 www 25 0 228m 14m 9344 S 100.4 0.1 14:51.22 php-cgi 13882 www 25 0 227m 13m 9284 S 100.1 0.1 10:53.18 php-cgi 13924 www 25 0 227m 9936 5732 S 100.1 0.1 23:20.80 php-cgi 13927 www 25 0 226m 5228 2064 R 100.1 0.0 24:44.24 php-cgi 13827 www 25 0 228m 15m 10m R 99.7 0.1 12:57.60 php-cgi 13900 www 25 0 228m 19m 13m R 99.7 0.1 9:03.09 php-cgi
由上面的截图我们可以看出那几个php-cgi进程不但占用了大量的CPU,而且运行时间非常长,本来php-cgi接到一个请求运行很快的,怎么这几个运行那么久还没释放?于是采用命令ls -l /proc/13827/fd/查看这个长时间的进程到底在干什么事情,结果如下:
lrwx------ 1 www www 64 Dec 11 12:03 0 -> socket:[68444030] l-wx------ 1 www www 64 Dec 11 12:03 1 -> pipe:[68444057] l-wx------ 1 www www 64 Dec 11 12:03 2 -> pipe:[68444058] lrwx------ 1 www www 64 Dec 11 12:03 3 -> socket:[68468225] lrwx------ 1 www www 64 Dec 11 12:03 4 -> socket:[68469788] lrwx------ 1 www www 64 Dec 11 12:03 5 -> socket:[68457928]
看到里面没有打开文件或者写入文件,这个进程没干什么事情,比较奇怪,然后采用strace命令跟踪下看看这个进程在做什么东西呢?
strace -p 13827 poll([{fd=4, events=POLLIN}], 1, 0) = 0 (Timeout) select(5, [4], [4], [], {15, 0}) = 1 (out [4], left {15, 0}) poll([{fd=4, events=POLLIN}], 1, 0) = 0 (Timeout) select(5, [4], [4], [], {15, 0}) = 1 (out [4], left {15, 0}) poll([{fd=4, events=POLLIN}], 1, 0) = 0 (Timeout) select(5, [4], [4], [], {15, 0}) = 1 (out [4], left {15, 0}) poll([{fd=4, events=POLLIN}], 1, 0) = 0 (Timeout) select(5, [4], [4], [], {15, 0}) = 1 (out [4], left {15, 0}) poll([{fd=4, events=POLLIN}], 1, 0) = 0 (Timeout) select(5, [4], [4], [], {15, 0}) = 1 (out [4], left {15, 0}) poll([{fd=4, events=POLLIN}], 1, 0) = 0 (Timeout) select(5, [4], [4], [], {15, 0}) = 1 (out [4], left {15, 0}) poll([{fd=4, events=POLLIN}], 1, 0) = 0 (Timeout) …….
可以看出,这个进程不断的超时,到底为何会超时呢???看来需要从php-cgi的日志中查找问题了,由于原来php-fpm.conf配置的超时时间为0,也就是不设置超时时间。于是先将php-fpm.conf的超时时间设置成5s,然后超过5s的php-cgi的请求就会记录到php的慢日志中,设置如下:
3s
logs/slow.log
设置完成,利用命令/usr/local/php/sbin/php-fpm restart重启php-fpm,过一会查看slow.log的内容发现很多如下内容:
script_filename = /data/htdocs/bbs.hrloo.com/apl.php
[0x00007fffb060fd70] file_get_contents() /data/htdocs/bbs.hrloo.com/apl.php:10
查看/data/htdocs/bbs.hrloo.com/apl.php第十行的内容如下:
echo file_get_contents('http://121.10.108.227:86/yh.asp');
网上查了一下发现了介绍php这个函数当里面网址响应很慢的时候就会出现CPU占用很高的情况,而且会一直卡住,不会超时,再看看这个链接,访问一下指向到了一个小说网站,是别人攻击后嵌入的,将这个文件还原后恢复正常。奇怪的是那个安装NFS的web服务器却不会出现那个问题,看来是由于本来那个站点又慢,通过NFS调用就更慢了,因此出现了这个故障。感谢这次故障,才发现了这个严重的问题。
故障修复了,但是问题还远远没有解决,重点要找到文件是如何被修改的,防止再出现类似的事故。看来下面还有很多事情要忙乎了。呵呵!
php-cgi.exe,cpu
《魔兽世界》大逃杀!60人新游玩模式《强袭风暴》3月21日上线
暴雪近日发布了《魔兽世界》10.2.6 更新内容,新游玩模式《强袭风暴》即将于3月21 日在亚服上线,届时玩家将前往阿拉希高地展开一场 60 人大逃杀对战。
艾泽拉斯的冒险者已经征服了艾泽拉斯的大地及遥远的彼岸。他们在对抗世界上最致命的敌人时展现出过人的手腕,并且成功阻止终结宇宙等级的威胁。当他们在为即将于《魔兽世界》资料片《地心之战》中来袭的萨拉塔斯势力做战斗准备时,他们还需要在熟悉的阿拉希高地面对一个全新的敌人──那就是彼此。在《巨龙崛起》10.2.6 更新的《强袭风暴》中,玩家将会进入一个全新的海盗主题大逃杀式限时活动,其中包含极高的风险和史诗级的奖励。
《强袭风暴》不是普通的战场,作为一个独立于主游戏之外的活动,玩家可以用大逃杀的风格来体验《魔兽世界》,不分职业、不分装备(除了你在赛局中捡到的),光是技巧和战略的强弱之分就能决定出谁才是能坚持到最后的赢家。本次活动将会开放单人和双人模式,玩家在加入海盗主题的预赛大厅区域前,可以从强袭风暴角色画面新增好友。游玩游戏将可以累计名望轨迹,《巨龙崛起》和《魔兽世界:巫妖王之怒 经典版》的玩家都可以获得奖励。
更新动态
- 凤飞飞《我们的主题曲》飞跃制作[正版原抓WAV+CUE]
- 刘嘉亮《亮情歌2》[WAV+CUE][1G]
- 红馆40·谭咏麟《歌者恋歌浓情30年演唱会》3CD[低速原抓WAV+CUE][1.8G]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[320K/MP3][193.25MB]
- 【轻音乐】曼托凡尼乐团《精选辑》2CD.1998[FLAC+CUE整轨]
- 邝美云《心中有爱》1989年香港DMIJP版1MTO东芝首版[WAV+CUE]
- 群星《情叹-发烧女声DSD》天籁女声发烧碟[WAV+CUE]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[FLAC/分轨][748.03MB]
- 理想混蛋《Origin Sessions》[320K/MP3][37.47MB]
- 公馆青少年《我其实一点都不酷》[320K/MP3][78.78MB]
- 群星《情叹-发烧男声DSD》最值得珍藏的完美男声[WAV+CUE]
- 群星《国韵飘香·贵妃醉酒HQCD黑胶王》2CD[WAV]
- 卫兰《DAUGHTER》【低速原抓WAV+CUE】
- 公馆青少年《我其实一点都不酷》[FLAC/分轨][398.22MB]
- ZWEI《迟暮的花 (Explicit)》[320K/MP3][57.16MB]