Redis++:Redis 内存爆满 之 淘汰策略
前言:
我们的redis使用的是内存空间来存储数据的,但是内存空间毕竟有限,随着我们存储数据的不断增长,当超过了我们的内存大小时,即在redis中设置的缓存大小(maxmeory 4GB),redis会怎么处理呢?
Redis内存淘汰策略,是被很多小伙伴忽略的知识盲区,注意,是盲区。
注意,Redis如果内存淘汰策略配置不合理,可能会导致Redis无法服务。
今天就来聊聊redis的缓存淘汰策略:↓ ↓ ↓
首先,介绍一下Redis过期删除策略,然后,再介绍Redis淘汰策略.
1):Redis过期删除策略
Redis对于过期的key,有三种删除策略:
- 定期删除(主动删除:由于惰性删除策略无法保证冷数据被及时删掉,所以Redis会定期主动淘汰一批已过期的key)
- 惰性删除(被动删除:当读/写一个已经过期的key时,会触发惰性删除策略,直接删除掉这个过期key)
- 当前已用内存超过maxmemory限定时,触发主动清理策略
定期删除:
redis 会将每个设置了过期时间的 key 放入到一个独立的字典中,以后会定期遍历这个字典来删除到期的 key。
Redis 默认会每秒进行十次过期扫描(100ms一次),过期扫描不会遍历过期字典中所有的 key,而是采用了一种简单的贪心策略。
1、从过期字典中随机 20 个 key;
2、删除这 20 个 key 中已经过期的 key;
3、如果过期的 key 比率超过 1/4,那就重复步骤 1;
redis默认是每隔 100ms就随机抽取一些设置了过期时间的key,检查其是否过期,如果过期就删除。
注意这里是随机抽取的。为什么要随机呢?
你想一想假如 redis 存了几十万个 key ,每隔100ms就遍历所有的设置过期时间的 key 的话,就会给 CPU 带来很大的负载。
惰性删除:
所谓惰性策略就是在客户端访问这个key的时候,redis对key的过期时间进行检查,如果过期了就立即删除,不会给你返回任何东西。
为啥需要两种删除策略呢?
定期删除可能会导致很多过期key到了时间并没有被删除掉。
所以就有了惰性删除。假如你的过期 key,靠定期删除没有被删除掉,还停留在内存里,除非你的系统去查一下那个 key,才会被redis给删除掉。
这就是所谓的惰性删除,即当你主动去查过期的key时,如果发现key过期了,就立即进行删除,不返回任何东西.
总结:定期删除是集中处理,惰性删除是零散处理
2):Redis 内存爆满 淘汰置换策略
当 Redis 内存使用达到 maxmemory
时,需要选择设置好的 maxmemory-policy
进行对老数据的置换。
下面是可以选择的置换策略:
不同于之前的版本,redis5.0为我们提供了八个不同的内存置换策略;很早之前提供了6种。
- volatile-lru:从已设置过期时间的数据集中挑选最近最少使用的数据淘汰。
- volatile-ttl:从已设置过期时间的数据集中挑选将要过期的数据淘汰。
- volatile-random:从已设置过期时间的数据集中任意选择数据淘汰。
- volatile-lfu:从已设置过期时间的数据集挑选使用频率最低的数据淘汰。
- allkeys-lru:从数据集中挑选最近最少使用的数据淘汰
- allkeys-lfu:从数据集中挑选使用频率最低的数据淘汰。
- allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰
- no-enviction(驱逐):禁止驱逐数据,这也是默认策略。
意思是当内存不足以容纳新入数据时,新写入操作就会报错,请求可以继续进行,线上任务也不能持续进行,采用no-enviction策略可以保证数据不被丢失。
这八种大体上可以分为4中:
- lru(Least Recently Used,最近最少使用)
- lfu(Least Frequently Used,最不经常使用)、
- random(随机)
- ttl
设置 maxmemory-policy
的方法 和 设置 maxmemory
方法类似,通过 redis.conf
或是通过 CONFIG SET
动态修改。
选择合适的置换策略是很重要的,这主要取决于你的应用的访问模式,当然你也可以动态的修改置换策略;
并通过用 Redis 命令——INFO
去输出 cache 的命中率情况,进而可以对置换策略进行调优。
置换策略是如何工作的?
- 客户端执行一条新命令,导致数据库需要增加数据(比如set key value)
- Redis会检查内存使用,如果内存使用超过 maxmemory,就会按照置换策略删除一些 key
- 新的命令执行成功
我们持续的写数据会导致内存达到或超出上限 maxmemory,但是置换策略会将内存使用降低到上限以下。
如果一次需要使用很多的内存(比如一次写入一个很大的set),那么,Redis 的内存使用可能超出最大内存限制一段时间。
LRU 算法机制:
LRU算法的全称叫做Least Recently Used,也就是最近最少使用原则来进行数据的淘汰算法。
其原理就是,会将数据放入到一个链表中,当链表中的某个元素被访问时,这个元素就被会提到链表的前面,其他元素,默认向后移动;
当这个时候我们想缓存中新增一个元素时,也会被增加到链表的头部,那么尾部的最后一个元素就被淘汰了。
lru的实现思想就是:就是刚被访问的数据,在接下来的时间里,更容易被再次访问,而一段时间没有被访问的数据,之后也不会再次访问。
但是要将redis的全部数据都放入这样一个链表中的话,redis的数据被频繁访问时,需要不停的移动链表的位置,降低redis的性能。
所以redis对LRU算法进行了优化 ↓
在redis中,会给每个数据记录一个最近访问的时间戳(记录在RedisObject的lru字段中),
当需要进行数据淘汰时,redis就随机筛选出N个数据放入到候选集合中去,然后比较这N个数据中的lru的值,最小的就会被淘汰。
当再次需要淘汰数据时,这个时候筛选数据放入到第一次创建的淘汰集合中,那么这次筛选就不在是随机筛选,而是能进入候选集合的数据的 lru 字段值必须小于候选集合中最小的 lru 值,
然后再次将最小的lru的值的数据进行淘汰。
其中N的配置项为:
maxmemory-samples 100 # 表示N为100
LFU 算法机制:
LFU(Least frequently used)称为最近使用最少的数据将被淘汰,redis在就是在LRU的基础上增加一个次数统计。
其步骤就是根据数据的访问次数进行筛选,淘汰访问次数少的数据,如果访问次数相同,在根据访问时间进行比较,淘汰访问时间久远的数据。
redis中的实现方式:就是在RedisObject的字段lru上,拆分为两个部分:
- ldt值:lru字段的前16bit位,还是用来表示时间戳。
- counter值:lru字段的后8bit位,用来表示数据的访问次数。
当 LFU 策略筛选数据时,Redis 会在候选集合中,根据数据 lru 字段的后 8bit 选择访问次数最少的数据进行淘汰。
当访问次数相同时,再根据 lru 字段的前 16bit 值大小,选择访问时间最久远的数据进行淘汰。
但是8个bit位,最大只能记录255的值,但是redis中的数据,有时候会被访问成千上万次,那么这个问题如何进行解决呢?
redis对计数进行了优化,并不是数据被访问一次,counter就会被加1,而是遵循如下规则:↓
当数据被访问一次时,首先用计数器当前的值乘以配置项lfu_log_factor再加1,再取倒数得到一个p值然后把这个p值和一个取值范围在(0,1)的一个随机数r,进行比大小,只有p值大于r时,counter的值才会被加一
lfu-log-factor可以调整计数器counter的增长速度,lfu-log-factor越大,counter增长的越慢。
lfu-decay-time是一个以分钟为单位的数值,可以调整counter的减少速度
#redis部分源码展示
double r = (double)rand()/RAND_MAX;
double p = 1.0/(baseval*server.lfu_log_factor+1);
if (r < p) counter++;
其中 baseval是计数器的当前值。计数器的默认初始值为5(由代码中的 LFU_INIT_VAL 常量设置),并不是为0,这样可以避免数据刚进入缓存,就因为访问次数少而被立即淘汰。
当lfu_log_factor取不同的值时,实际访问次数下,counter的值的变化情况:
在实际的使用场景中,还会有这样一种情况,某些数据可能一开始会被大量的访问,但是过了时间段后,就不会再被访问。
如果这个时候counter的值很大,就算后续不会被访问,也就不会被redis进行数据淘汰。
针对这种情况,在redis中,设计了counter的衰减策略。其实现就是根据lfu_decay_time的配置值,来控制访问次数的衰减。
其流程如下:
- lfu会计算当前时间和数据最近一次访问的时间差值,并将这个差值换算为分钟单位。
- 然后在将这个差值除以lfu_decay_time值,得到的就是我们需要减去的值
- 然后再讲counter的值减去这个值
这样就可以保证在一段时间后,可以淘汰这部分数据。
Redis 的淘汰策略怎么选:
一般来说,有这样一些常用的经验:
- 在所有的 key 都是最近最经常使用,那么就需要选择 allkeys-lru 进行置换最近最不经常使用的 key,如果你不确定使用哪种策略,那么推荐使用 allkeys-lru
- 如果所有的 key 的访问概率都是差不多的,那么可以选用 allkeys-random 策略去置换数据
- 如果对数据有足够的了解,能够为 key 指定 hint(通过expire/ttl指定),那么可以选择 volatile-ttl 进行置换
volatile-lru
和 volatile-random
经常在一个Redis实例既做cache又做持久化的情况下用到,然而,更好的选择使用两个Redis实例来解决这个问题。
设置是失效时间 expire
会占用一些内存,而采用 allkeys-lru
就没有必要设置失效时间,进而更有效的利用内存。