负载均衡小结

最近被负载均衡这个问题搞得很难受,我遇到的是最简单的均衡问题,并不是服务器集群,多core等高级负载均衡的问题。

我们的问题简单描述就是:通过网卡接收数据包,然后把数据包放入N个队列。要求:1.每个队列里数据包的数量差不多相等。2.同一会话的包放入同一个队列。

下面对考虑过的一些算法作一个总结。

一.轮回调度 顾名思义就是把数据包一个一个地放入N个队列中。第1个包放入0号队列,第2个包放入1号队列,放完N个队列,再从0号队列开始放。

二.取余 解出数据包的sip和dip.队列索引index=(sip+dip)%N.很明了,没什么要说的。

三.异或取余 解聘数据包的sip和dip.队列索引index=((sip+dip)^sip^dip)%N.据说分散程度会比方法二要好。但找不到数学依据。

四.依照RSS. RSS是一种网卡多队列技术,要完整介绍它,需要写一篇论文。这里用到的是symmetric rss即对称RSS。网卡内部大致是这样做的:利用数据包的二元/四元/五元组和一个40字节的固定值,通过一种hash算法,算出一个hash值。然后取这个hash值的低7位,这个低7位与队列索引号形成一张RETA表,通过这张表,只要知道hash值的低7位就能知道数据包要放入哪个队列。至于为什么是低7位呢?我猜测这是一个适中的值,如果取8位或9位,表的数据量就会比较大,查询相对耗时,如果取少了,随机程度就得不到保证。根据上面的知识,就可以得出队列索引 index=hash_value%N.这里对N取余相对于维护了一张

(0,1,2....N-1,0,1,2...N-1,0,1,2....N-1)的表。如果要修改表的排列,可自己新建一张自定义的表.

五.仿一致性hash 至于为什么有一个“仿”字,那是因为我们这里的应用场景与其真正的定义不一样,只是运用其思想。一致性hash没有图我是表达不清楚了,可自行百度。反正对于我这里的场景,相当于自定义了一张第四步中的RETA表,定义格式如下

default_tbl[128]=

{0,0,0,...

1,1,1,...

2,2,2,...

...,...

N-1,N-1,N-1...}

与第四步的表相比,只不过是形式不同。

所以这种方法的做法就是通过sip和dip求出hash值,通过hash值的低7位,找到表中对应的队列序号,把数据包放入该队列。

对于以上几种算法,第一种虽然说最均匀,但不行,因为确保不了同一会话的数据包在同一队列。

第三种的散列度比第二种要好。

第四种和第五种基本差不多,就是RETA表中的对应关系不一样,如果是确定的流量,通过修改那张表,一定能做到负载均衡的。就算是未知的流量,也能做到大致均匀,但要是同一会话的量太大了,爱因斯坦也没办法,现在遇到的就是这种情况,好烦。

晚安。

推荐阅读更多精彩内容

  • 1.ios高性能编程 (1).内层 最小的内层平均值和峰值(2).耗电量 高效的算法和数据结构(3).初始化时...
    欧辰_OSR阅读 24,435评论 8 239
  • 序 当你我隔着无尽的历史相遇,什么言辞都显得苍白无力。 “你将必死。” “没有人可以不死。我终将死去。” “你会爱...
    柠檬蜂蜜要加冰阅读 99评论 0 2
  • 说一件大家伙儿都有的蠢事吧,肯定不止我一人发生同样的情况。 小时候因为工作需要或者其他原因,爸爸会买手机,而且,全...
    a户阅读 91评论 0 0
  • 本来计划好 将你安放于家山 绿水草草流过 算得上一种温暖教义 舍弃生锈的牛轭 结束一次耕种 是谁把禾苗晒死了 于唇...
    海子三月归阅读 271评论 11 29