什么是持久化?
redis所有数据都是保存在内存当中的,对数据的更新将保存在磁盘上,称之为持久化。
如果没有持久化,那么断电,宕机,就会导致数据的丢失。
持久化的两种方式:RDB和AOF
RDB(Relational Database)
RDB的数据都是存储在内存当中的,RDB通过快照的方式,将内存中的数据存储到硬盘中的一个文件,这个文件就是RDB文件。
RDB的三种触发机制
- save(同步):占用的内存比较小,对性能开销没那么大,但是一旦数据比较多的时候,就会导致阻塞
- bgsave(异步):fork出子进程,子进程来进行一个save操作,不会导致阻塞,但是相对内存的消耗会比较大
- 自动(根据配置文件的配置)
- 全量复制
当有主从节点的情况下,从节点会复制主节点的数据,此时主节点会进行一个RDB的生成 - debug reload
RDB的缺点
- 耗时,耗性能
耗时:全部数据要写进一个新的文件,O(N)
fork(),数据量很大的情况下,写的时候会占用很大内存 - 不可控,丢失数据
为什么会丢失数据呢?因为save和bgsave是手动触发的,而配置文件的自动生成RDB文件也是有间隔的,总会存在丢失数据的可能。
AOF(append only file)
AOP就解决了上述一个问题,AOP的原理是这样子的,我每次执行一个set k1 v1的时候就回去AOF文件中去进行一个记录,说白了就是一个日志功能,万一,我执行完set后宕机了,只需要把日志里的动作再做一遍就可以保证数据的恢复
AOF的三种策略
- always:每次写进
- everysec:每一秒写进一次
- no:根据操作系统决定
一般来说,折中考虑,会选择everysec,即可保证数据的丢失不会太大,也可以保证IO的开销会没那么大
AOF的重写的两种方式
- bgrewriteaof,会fork出一个子进程来进行AOF的重写
- 修改配置文件
RDB的选择
- 在单机操作大多数情况下,建议关闭
- 当数据恢复的量级比较大的情况下建议开启
- 在集群的情况下,建议从节点开
AOF的选择
- 在单机大多数操作情况下,建议开启
- AOF重写集中管理(防止Redis自动做重写操作而导致fork太多引起的内存不足等问题)
- 建议使用everysec策略