来讨论一下用数据库实现简单分布式锁的问题

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 583 天前的主题，其中的信息可能已经有所发展或是发生改变。

来讨论一下用数据库实现简单分布式锁的问题

单纯做技术讨论，使用 PG 数据库实现一个分布式锁。仅考虑锁的正确性，不考虑可重入等功能。我的想法如下。

表

create table distribute_locks
(
    id         varchar     not null primary key,
    expire_at  timestamptz not null,
    created_at timestamptz not null default current_timestamp,
    updated_at timestamptz not null default current_timestamp
);

id 作为加锁的 key
expire_at 作为锁的过期时间。锁不存在或过期都算锁已被释放，此时其它方可以获取到该锁

用法

加锁

insert into distribute_locks (id, expire_at)
values (:id, now() + interval '1 minute')
on conflict (id) 
do update set expire_at = now() + interval '1 minute'
where distribute_locks.expire_at < current_timestamp
returning id

有内容返回时获取锁成功，否则获取锁失败

锁续期

update distribute_locks
set expire_at = now() + interval '1 minute'
where id = :id and expire_at > current_timestamp

只有锁存在且过期才能续期，否则续期无效

释放锁

delete from distribute_locks
where id = :id

疑问点

这样设计的锁能满足基本需求了，但还有一个问题没有解决，即如何稳定续期。

问题点在于，如果我在获取到锁时启动一个线程去续期，那如果当前线程结束，没有主动释放锁。该续期线程要如何结束呢？

我用的是 python 来做

第 1 条附言 · 2023-06-27 17:50:09 +08:00

修正锁续期的说法：只有锁存在且在有效期内才能续期，否则续期无效

expire_at

续期

null

SQL

15 条回复 • 2023-06-27 23:29:44 +08:00

opengps

2023-06-27 16:35:25 +08:00

我没看明白，这个 distribute_locks 表存在哪，因为我始终都想知道怎么实现的分布式锁。
因为我关注点是：这到底是多个数据库的锁，还是分布式应用的共享一个库里的行数据作为锁

zuisong

2023-06-27 17:38:38 +08:00

设置一个最大续期次数？

liprais

2023-06-27 17:39:35 +08:00

先想想隔离级别的事

zou8944

2023-06-27 17:51:01 +08:00

@opengps 后者

zou8944

2023-06-27 17:51:47 +08:00

@zuisong 不可行，这个和设置一个超长的锁有效期没有本质区别

zou8944

2023-06-27 17:52:02 +08:00

@liprais 为什么要想隔离级别的事情？

leonshaw

2023-06-27 18:04:55 +08:00

续期的时候不看所有权？

zou8944

2023-06-27 18:06:40 +08:00

@leonshaw 所有权也要看，这里漏掉了

lolizeppelin

2023-06-27 18:14:24 +08:00

直接 zk 或者 etcd 做不就行了....为什么折腾 pg
数据库做锁没法支持连接断开后清理锁,用 expire_at 很别扭的

字段里加个 lokcer 存放 uuid, 这个 uuid 由于获得上锁的客户端生成, 由于这个 uuid 只有上锁的客户端才知道,这样就可以做到过期前只有指定的 locker 才能释放

上锁
update lock set locker = 'fffffffffffffffffffffffffffffffffffff' where id = 'locker-id' and locker is null

放锁
update lock set locker = null where id = 'locker-id' and locker = 'fffffffffffffffffffffffffffffffff'