Redis:分布式锁

Java多线程开发中锁提供了原子性、可见性。但是在分布式系统中,一个进程下的多个线程分布到一个集群中的多台机器上,需要其他方式来保证原子性、可见性。通过封装Redis的SETNX命令,可以实现分布式锁,提供分布式环境下的原子性。

测试代码

测试代码启动三个名称为test-1、test-2、test-3线程,线程内部会对同一个静态变量执行一万次++操作,如果代码正确,最终静态变量的值应该为3万。测试代码如下:

public class LockTest {

    public static int i = 0;

    public static void main(String[] args) throws InterruptedException {
        CountDownLatch countDownLatch = new CountDownLatch(3);
        CyclicBarrier cyclicBarrier = new CyclicBarrier(3);
        new Thread(new CountRunnable(countDownLatch, cyclicBarrier), "test-1").start();
        new Thread(new CountRunnable(countDownLatch, cyclicBarrier), "test-2").start();
        new Thread(new CountRunnable(countDownLatch, cyclicBarrier), "test-3").start();
        countDownLatch.await();
        System.out.println(LockTest.i);
    }

    static class CountRunnable implements Runnable{

        private CountDownLatch countDownLatch;
        private CyclicBarrier cyclicBarrier;

        public CountRunnable(CountDownLatch countDownLatch, CyclicBarrier cyclicBarrier){
            this.countDownLatch = countDownLatch;
            this.cyclicBarrier = cyclicBarrier;
        }

        @Override
        public void run() {
            try {
                cyclicBarrier.await();
            } catch (Exception e) {
                e.printStackTrace();
            }
            for(int j = 0; j < 10000; j++){
                LockTest.i++;
            }
            countDownLatch.countDown();
        }
    }
}

在不使用锁的情况下,执行三次输出结果分别为:24404、21768、17539。

简单版本

SETNX命令只有当key不存在时才能设值成功,返回值为1;key存在设值失败,返回0。根据命令特性,可以有以下实现:

public class SimpleRedisLock {

    public static ThreadLocal<Jedis> holder = new ThreadLocal<>();

    public static JedisPool jedisPool = new JedisPool(new JedisPoolConfig(), "localhost");

    public static void acquire(String lock){
        Jedis jedis = jedisPool.getResource();
        while(jedis.setnx(lock, "") == 0){}
        holder.set(jedis);
    }

    public static void release(String lock){
        Jedis jedis = holder.get();
        jedis.del(lock);
        jedis.close();
    }

}

在acquire方法内部,获取jedis对象,循环设置某个key的值,直到设置成功。release方法中删除这个key,代表释放锁。修改LockTest代码:

for(int j = 0; j < 10000; j++){
    SimpleRedisLock.acquire("lock");
    LockTest.i++;
    SimpleRedisLock.release("lock");
}

重新执行测试代码,输入值:30000。

简单版本的问题

测试代码中启动了3个线程竞争同一个分布式锁,如果三个线程中,有任意一个线程在调用SimpleRedisLock的acquire成功之后异常退出,没有释放锁,另外两个线程会死循环等待在SETNX命令上,简单修改一下LockTest,模拟test-1异常退出的情况:

@Override
public void run() {
    try {
        cyclicBarrier.await();
        for(int j = 0; j < 10000; j++){
            SimpleRedisLock.acquire("lock");
            if(Thread.currentThread().getName().equals("test-1")){
                throw new RuntimeException();
            }
            LockTest.i++;
            SimpleRedisLock.release("lock");
        }
    } catch (Exception e) {
        e.printStackTrace();
    }finally {
        countDownLatch.countDown();
    }
}

线程test-�1在获取到分布式锁之后,因为运行时异常退出(也有可能是因为进程、机器crash,OOM等各种问题),没有正确的释放锁,导致线程test-2、test-3死循环执行SETNX命令。

死锁

解决死锁问题

按照Redis文档给出的一种解决方法,重新修改acquire方法:

public static void acquire(String lock){
    Jedis jedis = jedisPool.getResource();
    //1.先尝试用setnx命令获取锁,key为参数lock,值为当前时间+要持有锁的时间hold_time
    while(jedis.setnx(lock, String.valueOf(System.currentTimeMillis() + hold_time)) == 0){
        //2.如果获取失败,检查lock对应的值是否已超时
        String expireTime = jedis.get(lock);
        if(expireTime != null && Long.parseLong(expireTime) < System.currentTimeMillis()){
            //3.如果已经超时了,使用getset命令,设置新的超时时间
            String oldExpire = jedis.getSet(lock, String.valueOf(System.currentTimeMillis() + hold_time));
            if(oldExpire != null && Long.parseLong(expireTime) < System.currentTimeMillis()){
                //4.如果setget命令返回的值,依然是过期时间,认为获取锁成功
                break;
            }
        }
    }
    holder.set(jedis);
} 

测试代码执行结果:

test-1异常退出情况

在test-1线程退出后,程序正常执行,并得到了正确结果2万。但这个版本依旧有两个问题没有解决:

  1. test-1线程异常退出,test-2、test-3线程同时执行setnx失败,获取expireTime,发现已经小于currentTime,开始执行getset命令。假设test-2先执行了getset,获取锁成功。test-3线程在执行getset时,返回的是test-2设置的未超时的时间戳,是一个未超时的时间,获取锁失败。功能上没有问题,但test-2线程持有的锁的有效期时间戳已经被test-3修改了。

  2. 如果test-2线程在持有锁的期间,因为网络抖动等原因,操作(测试代码中对应++操作部分)还没有完成,但锁已经超时了。 如何确定是否要释放锁(即使客户端记录自己的超时时间戳也没用,问题1中已经描述了时间戳被其他线程修改的情况)?在需要互斥访问资源的场景,执行时间超过锁超时时间的情况下,怎么解决多个节点同时访问资源的情况(同时执行++操作)?

解决问题

重新修改获取锁的代码:

public class SimpleRedisLock {

    public static long hold_time = 3000;

    public static ThreadLocal<Jedis> holder = new ThreadLocal<>();

    public static ThreadLocal<String> expireHolder = new ThreadLocal<>();

    public static JedisPool jedisPool = new JedisPool(new JedisPoolConfig(), "localhost");

    public static void acquire(String lock){
        Jedis jedis = jedisPool.getResource();
        //1.先尝试用setnx命令获取锁,key为参数lock,值为当前时间+要持有锁的时间hold_time
        while(jedis.setnx(lock, String.valueOf(System.currentTimeMillis() + hold_time)) == 0){
            //2.如果获取失败,先watch lock key
            jedis.watch(lock);
            //3.获取当前超时时间
            String expireTime = jedis.get(lock);
            if(expireTime != null && Long.parseLong(expireTime) < System.currentTimeMillis()){
                //4.如果超时时间小于当前时间,开事务准备更新lock值
                Transaction transaction = jedis.multi();
                Response<String> response = transaction.getSet(lock, String.valueOf(System.currentTimeMillis() + hold_time));
                //5.步骤2设置了watch,如果lock的值被其他线程修改,不是执行事务中的命令
                if(transaction.exec() != null){
                    String oldExpire = response.get();
                    if(oldExpire != null && Long.parseLong(expireTime) < System.currentTimeMillis()){
                        //6.如果setget命令返回的值依然是过期时间,认为获取锁成功(加了watch之后,这里返回的应该一直是超时时间)
                        break;
                    }
                }
            }else{
                //如果key未超时,解除watch
                jedis.unwatch();
            }
        }
        //设置客户端超时时间
        expireHolder.set(jedis.get(lock));
        holder.set(jedis);
    }

    public static void release(String lock){
        Jedis jedis = holder.get();
        //比较客户端超时时间与lock值,判断是否还由自己持有锁
        if(jedis.get(lock).equals(expireHolder.get())){
            jedis.del(lock);
        }
        jedis.close();
    }

}  

新的acquire方法,通过watch、redis事务,保证只有一个客户端能执行getset,并记录了锁超时时间,解决了问题一和问题二的前半部分。对于锁超时导致的两个客户端同时访问资源,只能靠业务代码保证锁超时时间内可以完成处理(可以在release时检查是否超时,如果超时回滚所有操作,但对不能回滚的,例如++操作就比较麻烦),或者放弃死锁容错功能,需要看场景衡量。

代码 :SimpleRedisLock

扩展

以上只是单点redis服务器情况下的分布式锁。在redis master-slaver架构下,如果master节点down机,由于redis主从复制是异步的,会有明显的race-condition。Redis文档中提供了一种解决方案:RedLock

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 158,560评论 4 361
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,104评论 1 291
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 108,297评论 0 243
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,869评论 0 204
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,275评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,563评论 1 216
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,833评论 2 312
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,543评论 0 197
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,245评论 1 241
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,512评论 2 244
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,011评论 1 258
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,359评论 2 253
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,006评论 3 235
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,062评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,825评论 0 194
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,590评论 2 273
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,501评论 2 268

推荐阅读更多精彩内容