记一次服务器故障排查

一同事M因127服务器上Jenkins无法构建成功来找我,说:构建卡住了。

访问127的Jenkins取消同事M的构建进程,重构建一次,发现确实是卡住的,查看Jenkins日志无异常。

想起群里上周有人说127服务器cpu和io不高,负载超高,无法ps,找不到原因,寻求帮助,当时因在处理其他事情没回复。
image.png

使用top发现,负载90多-比上周高了,sar看到的信息正常,df -lh查看磁盘空间-没有看到使用100%的。

唯一可疑的就是Jenkins所在目录/var已使用97%,只有4.5G的可用空间,理论上排除空间不足而上下文切换频繁产生的负载高,但/var目录总空间为197G,一般情况下这个目录不会有这么大的使用量,所以还不能排除嫌疑。
于是对/var目录进行排查,查看哪个目录有大文件,发现是confluence(一个文档管理应用)目录使用了80多G,一层层目录(du -sh /var/*)查进去看到是/var/atlassian/confluence/application-data/confluence/backups 使用了60G左右,是一个备份目录,单个备份文件大小12G,日志是每日凌晨2点多生成,可以确定是一个每日备份的目录。

假设:/var空间可用80G,备份文件一个12G,每日生成一个,也就是到第7天的时候 就会因为空间不足而无法备份,进程就会卡住,在第8天定时任务又会运行备份,然后进程又卡住了,负载就会越来越高。

到这里就可以确定,找到问题的原因了,处理起来就非常容易,因无法ps 看不到cron的进程,第一反应重启服务器(重启服务器过程卡住了-耽搁10分钟,手动进行了重启。)

第一步:停掉confluence
第二步:删除掉老的备份,只留了最新的一个
第三步:更改备份目录的配置,目录改到/opt为数据盘空大。
/var/atlassian/confluence/application-data/confluence/backups
改成/opt/atlassian/confluence/application-data/confluence/backups
第四步:移动/var/atlassian/confluence/application-data 到/opt/atlassian/confluence 目录下
第五步:启动confluence
第六步:将confluence每日备份 改成每月1日2点备份(管理界面更改cron)==需要根据使用频率来决定备份的周期,当前confluence主要查文档,上传/修改文档较少,可以不用每日备份。
第七步:写一个脚本,每日0点检查backups的目录,保留最新的2个备份文件即可,其他的删除。

#!/bin/bash -l
DATADIR=/opt/atlassian/confluence/application-data/confluence/backups/
cd ${DATADIR}
declare -i filesum=`ls backup-*.zip | wc -l`
declare -i delnum=$filesum-2
if [ "${delnum}" -ge 1 ];then
rm -rf `ls -tr backup-*.zip* | sort | head -${delnum}`
fi

因为/var空间足够了,重新对Jenkins上的项目进行构建也不卡了。
没有使用复杂的技术,Jenkins恢复到可用-花费40分钟,confluence处理好-花费50分钟。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,117评论 4 362
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,328评论 1 293
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,839评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,007评论 0 206
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,384评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,629评论 1 219
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,880评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,593评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,313评论 1 243
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,575评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,066评论 1 260
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,392评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,052评论 3 236
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,082评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,844评论 0 195
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,662评论 2 274
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,575评论 2 270

推荐阅读更多精彩内容