LVS 之 高可用性

1  概述

在lvs的集群设计中,存在两个地方不可用的问题,Director不可用 和RS不可用

A)Director不可用

Director不可用整个系统将不可用;SPoF  Single Point of Failure,单点故障导致

解决方案:

通过keepalived  heartbeat/corosync实现高可用

B)某RS不可用时

当后端服务器存在某一台RS不可用,Director依然会调度请求至此RS,导致请求不能被处理,服务失败

解决方案:由Director对各RS健康状态进行检查,失败时禁用,成功时启用

工具有keepalived   heartbeat/corosync, ldirectord

同时,也可以通过脚本对后端RS监控状态进行监控

检测方式:

(a)网络层检测,icmp

(b)传输层检测,端口探测

(c)应用层检测,请求某关键资源

RS全不可用时,可以通过back server或者sorryserver来提示用户

本文将介绍ldirectord软件和通过脚本的方式来实现对后端服务器的监控

2  ldirectord

ldirectord:监控和控制LVS守护进程,可管理LVS规则,该软件解决了ipvs不能监控后端服务器的状态的问题。

原理是根据配置文件设定好的规则,去检查服务器端的应用是否正常。通过配置文件配置服务后,只要启动该软件就会按设定的规则进行配置和监测

service ldirectord  start

那么该软件就会根据配置文件的规则创建lvs集群类型,添加RS服务器,并进行监控,如果后端服务失败,就移除对应的RS,如果RS服务恢复正常,会自动将RS加入调度计划里。

如后端监控http服务时,该软件会通过抓取后端服务器指定页面的关键字来决定后端http服务是否正常运行。

.包名:ldirectord-3.9.6-0rc1.1.1.x86_64.rpm,该服务包在base源中没有,要另外下载,存在依赖性,下载后用yum安装,解决依赖性。

.软件相关文件:

/etc/ha.d/ldirectord.cf主配置文件

/usr/share/doc/ldirectord-3.9.6/ldirectord.cf配置模版

/usr/lib/systemd/system/ldirectord.service服务

/usr/sbin/ldirectord主程序

/var/log/ldirectord.log 日志

/var/run/ldirectord.ldirectord.pidpid文件

Ldirectord配置文件示例

checktimeout=3 #多长时间为超时时间,如3s没回应,表示超时

checkinterval=1 # 检查的间隔

autoreload=yes #更改策略后,不需要重启服务就自动生效

fallback=127.0.0.1:80 #这里是定义sorry server,当后端的RS都宕机了,本机给用户提示信息

logfile=“/var/log/ldirectord.log“#日志文件

quiescent=no #down时yes权重为0,no为删除

virtual=5#指定VS的FWM或IP:port

real=172.16.0.7:80 gate 2 # gate表示dr模式,2是权重

real=172.16.0.8:80 gate 1

fallback=127.0.0.1:80 gate#sorryserver

service=http

scheduler=wrr #调度算法

checktype=negotiate #默认就可以

checkport=80 #检查端口,这样会给服务器的负载加大。因为对外提供服务是80端口。可以另外在监听一个http的端口,如listen8080但是这里有个矛盾,万一80异常了,但是8080还是正常的,所以就导致了检查结果不准确

request="index.html" #监控的主页面

receive=“Test Ldirectord" #抓到默认的几个字符,就认为服务是正常的。大小写敏感

例子

#监控后端的http服务是否正常,通过抓取后端服务器index.html页面的关键字centos

cp  /usr/share/doc/ldirectord-3.9.6/ldirectord.cf /etc/ha.d/ldirectord.cf

vim /etc/ha.d/ldirectord.cf

virtual=192.168.32.66:80

real=192.168.32.63:80 gate

real=192.168.32.73:80 gate

fallback=127.0.0.1:80 gate

service=http

scheduler=wrr

#persistent=600

#netmask=255.255.255.255

protocol=tcp

checktype=negotiate

checkport=80

request="index.html"

receive="centos"

3  自动化脚本

脚本使用需要注意事项

脚本中的VIP,RIP,RW(权重)监控端口VPORT和RPORT这些变量需要根据实际情况进行调整

脚本设置了循环监测,建议使用如下语句执行脚本

nohup /PATH/TO/script/monitorRS.sh > /root/RSout.file 2>&1 &

脚本默认是3s对后端的RS进行一次监测,该值可以根据实际情况调整,命令在脚本后sleep 3.调整数字3即可。

一键监控脚本如下

​#!/bin/bash

#

#******************************************************************************

#Author:              Sunny

#Date:                2017-10-23

#FileName:            monitorRS.sh

#version:              1.0

#Your change info:

#Description:          For auto monitor RS status

#Copyright(C):        2017  All rights reserved

#*****************************************************************************

echo "This is a script to auto monitor RS status,if you want to run the scirpt ,suggest you to excute cmd below"

echo

echo " nohup /PATH/TO/script/monitorRS.sh > /root/RSout.file 2>&1 & "

echo

echo "If you want to stop the script,you should run two cmds below,first you find the PID,then kill it"

echo

echo "ps -ef | grep monitorRS.sh"

echo  "kill -9 PID"

VIP=10.10.10.10

VPORT=80

RS=("192.168.32.63" "192.168.32.73")

RW=("3" "1")

RPORT=80

TYPE=g

LOG=/var/log/monitorRS.log

[ -e /var/log/monitorRS.log ] || touch /var/log/monitorRS.log

addrs() {

ipvsadm -a -t $VIP:$VPORT -r $1:$RPORT -$TYPE -w $2

[ $? -eq 0 ] && return 0 || return 1

}

delrs() {

ipvsadm -d -t $VIP:$VPORT -r $1:$RPORT

[ $? -eq 0 ] && return 0 || return 1

}

while true; do

let COUNT=0

for rip in ${RS[*]}; do

if ipvsadm -Ln | grep "$rip:$RPORT" &> /dev/null ; then

RS_status=online

else

RS_status=offline

fi

if $(curl --connect-timeout 1 http://$rip &>/dev/null) ; then

RS_test=yes

else

RS_test=no

fi

case $RS_test in

yes)

case ${RS_status} in

online)

echo "`date +'%F %H:%M:%S'`, $rip is work nice now." >> $LOG

;;

offline)

addrs $rip ${RW[$COUNT]} &>/dev/null;

addstatus=$?

if  [ $? -eq 0 ] && RS_status=online ;

then

echo "`date +'%F %H:%M:%S'`, $rip has been added to work." >> $LOG

else

echo "something wrong when add $rip back to work,please check,maybe your should do it manual"

echo "`date +'%F %H:%M:%S'`, $rip is added failed." >> $LOG

fi

;;

*)

echo "Something wrong when read RS_status"

;;

esac

;;

no)

case ${RS_status} in

online)

delrs $rip &>/dev/null;

[ $? -eq 0 ] && RS_status=offline && echo "`date +'%F %H:%M:%S'`, $rip is out of work,it is delete." >> $LOG

;;

offline)

echo "`date +'%F %H:%M:%S'`,$rip is still out of  work" >> $LOG

;;

*)

echo "Something wrong when read RS_status"

;;

esac

;;

*)

echo "Something wrong when read RS_test"

;;

esac

let COUNT++

done

sleep 3

done

4  总结

本文通过介绍工具ldirectord 和 编写了自己设计的脚本对后端的RS进行监控,但是监控的方式都是对后端RS进行轮询访问,这种方式会对服务器造成一定的压力,因此,使用时要权衡。总体来说,如果要使用LVS进行调度,建议是要对后端RS进行监控,否则当RS异常时,将导致服务不可用。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 157,012评论 4 359
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,589评论 1 290
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 106,819评论 0 237
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,652评论 0 202
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 51,954评论 3 285
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,381评论 1 210
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,687评论 2 310
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,404评论 0 194
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,082评论 1 238
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,355评论 2 241
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,880评论 1 255
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,249评论 2 250
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,864评论 3 232
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,007评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,760评论 0 192
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,394评论 2 269
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,281评论 2 259

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 134,087评论 18 139
  • 本文部分观点图片采用于:http://chenx1242.blog.51cto.com 随着智能机的逐渐普及,大量...
    BossHuang阅读 3,027评论 0 16
  • 1.Cluster(集群)概念 (1)系统扩展方式: Scale UP:向上扩展,增强Scale Out:向外扩展...
    尛尛大尹阅读 1,068评论 0 4
  • 一、高可用集群 (一)提升系统高可用性的解决方案:冗余(redundant) 工作模式active/passive...
    哈喽别样阅读 1,686评论 2 5
  • 1 概述 本文将介绍三个Keepalive高可用的实现案例,分别是keepalive实现LVS高可用,keepal...
    ghbsunny阅读 10,254评论 0 3