Elasticsearch6.3启动失败, 获取不到cgroup信息

概述

Es在启动的过程中, 由于获取不到cgroup的系统资源控制的信息, 导致启动失败, 下面对该问题进行具体排查

解决方案

重启异常的机器, 执行reboot

异常信息

  从异常的堆栈中发现在, readSysFsCgroupCpuAcctCpuAcctCfsQuota, getCgroupMemoryLimitInBytes等操作时发生空指针异常, 从PathUtil, UnixFileSystem这些信息来看是和操作系统相关, 会出现空指针, 一般来说应该是这个文件不存在

获取不到内存控制信息
获取不到Cpu控制信息

排查过程

粗略查看Es的源码这块的处理逻辑, 定位异常

参考 聊聊Elasticsearch的OsProbe, 概括的说就是去获取cgroup的资源信息, 主要是cpu、cpuacct和memory; 用作Es的资源监控, 如cat接口的机器负载信息, 磁盘超过阈值后触发写入拒绝操作等等

Cgroup 是 Linux kernel 的一项功能:它是在一个系统中运行的层级制进程组,你可对其进行资源分配(如 CPU 时间、系统内存、网络带宽或者这些资源的组合)。通过使用 cgroup,系统管理员在分配、排序、拒绝、管理和监控系统资源等方面,可以进行精细化控制。硬件资源可以在应用程序和用户间智能分配,从而增加整体效率。

执行命令对比

cat  /proc/self/cgroup(或cat /proc/cgroup)  -->  cd /sys/fs/group/memory

从结果来看, 异常机器的确缺失了大部分的cgroup信息, memory目录为空, 例如刚才的异常中需要获取的memory.limit_in_bytes;

既然缺失这些文件, 那么从正常机器copy过去便可以了, 上传的时候会提示失败 failed to upload; 查看权限得知该目录支持目录创建和读取, 不支持其他的操作, 也无法通过chmod授权;  在正常机器,memory下可以创建目录, 创建时下图右下角的那些文件也会一同创建; 但是在异常的机器上, 创建失败,提示只读文件系统, 这里可以进一步确定是机器环境的问题

对比1
对比2

无法创建目录

查看操作系统日志

在/sys/fs/group/memory下无法创建目录, 目录下也没有文件, 那应该是操作系统级别的异常了; 这时候应该去查看一下系统的操作日志, 根据一些关键字进行grep, 如fail, error,bar,cgroup ;  Linux的日志作用说明, 可参考 在linux中怎么查看错误日志,

这里重点关注 message和dmesg日志, message的日志包含了dmesg的部分; dmesg同时还是一个Linux命令, 用法很简单, 在出现问题的时候, 可以实时查看操作记录

过滤dmesg和message日志

执行 more dmesg | egrep -i 'error|fail|bar' , 在dmesg中出现no space for [io size 0x100] , failed to assign,

那应该是和io或者磁盘空间有关, 查看df -hl空间足够, 那么no space的嫌疑可以初步排除; 使用刚才的命令过滤messages日志, 找到异常的时间点, 和相关人员确定发生问题的时间点,  确定在这个时间点有在做es的大量读写操作

依照我的理解, 这时候系统IO请求过于密集, 加上虚拟机的性能比较差, 导致短时间内系统进入部分瘫痪状态;在重启机器后, cgroup的信息获取恢复正常,memory下也可以创建目录 , Es启动成功

dmseg日志
messages日志

参考

docker cgroup 技术之memory(首篇)

Linux系统中‘dmesg’命令处理故障和收集系统信息的7种用法

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,233评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,013评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,030评论 0 241
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,827评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,221评论 3 286
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,542评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,814评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,513评论 0 198
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,225评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,497评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,998评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,342评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,986评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,055评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,812评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,560评论 2 271
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,461评论 2 266