前言:

  我们的redis使用的是内存空间来存储数据的,但是内存空间毕竟有限,随着我们存储数据的不断增长,当超过了我们的内存大小时,即在redis中设置的缓存大小(maxmeory 4GB),redis会怎么处理呢?

Redis内存淘汰策略,是被很多小伙伴忽略的知识盲区,注意,是盲区。

注意,Redis如果内存淘汰策略配置不合理,可能会导致Redis无法服务。

今天就来聊聊redis的缓存淘汰策略:↓ ↓ ↓

首先,介绍一下Redis过期删除策略,然后,再介绍Redis淘汰策略.

1):Redis过期删除策略 

Redis对于过期的key,有三种删除策略:

  • 定期删除(主动删除:由于惰性删除策略无法保证冷数据被及时删掉,所以Redis会定期主动淘汰一批已过期的key)
  • 惰性删除(被动删除:当读/写一个已经过期的key时,会触发惰性删除策略,直接删除掉这个过期key)
  • 当前已用内存超过maxmemory限定时,触发主动清理策略

定期删除:

redis 会将每个设置了过期时间的 key 放入到一个独立的字典中,以后会定期遍历这个字典来删除到期的 key。

Redis 默认会每秒进行十次过期扫描(100ms一次),过期扫描不会遍历过期字典中所有的 key,而是采用了一种简单的贪心策略。

1、从过期字典中随机 20 个 key;

2、删除这 20 个 key 中已经过期的 key;

3、如果过期的 key 比率超过 1/4,那就重复步骤 1;

redis默认是每隔 100ms就随机抽取一些设置了过期时间的key,检查其是否过期,如果过期就删除。

注意这里是随机抽取的。为什么要随机呢?

你想一想假如 redis 存了几十万个 key ,每隔100ms就遍历所有的设置过期时间的 key 的话,就会给 CPU 带来很大的负载。

惰性删除:

所谓惰性策略就是在客户端访问这个key的时候,redis对key的过期时间进行检查,如果过期了就立即删除,不会给你返回任何东西。

为啥需要两种删除策略呢?

定期删除可能会导致很多过期key到了时间并没有被删除掉。

所以就有了惰性删除。假如你的过期 key,靠定期删除没有被删除掉,还停留在内存里,除非你的系统去查一下那个 key,才会被redis给删除掉。

这就是所谓的惰性删除,即当你主动去查过期的key时,如果发现key过期了,就立即进行删除,不返回任何东西.

总结:定期删除是集中处理,惰性删除是零散处理

2):Redis 内存爆满 淘汰置换策略 

当 Redis 内存使用达到 maxmemory 时,需要选择设置好的 maxmemory-policy 进行对老数据的置换。

下面是可以选择的置换策略:

不同于之前的版本,redis5.0为我们提供了八个不同的内存置换策略;很早之前提供了6种。

  1. volatile-lru:从已设置过期时间的数据集中挑选最近最少使用的数据淘汰。
  2. volatile-ttl:从已设置过期时间的数据集中挑选将要过期的数据淘汰。
  3. volatile-random:从已设置过期时间的数据集中任意选择数据淘汰。
  4. volatile-lfu:从已设置过期时间的数据集挑选使用频率最低的数据淘汰。
  5. allkeys-lru:从数据集中挑选最近最少使用的数据淘汰
  6. allkeys-lfu:从数据集中挑选使用频率最低的数据淘汰。
  7. allkeys-random:从数据集(server.db[i].dict)中任意选择数据淘汰
  8. no-enviction(驱逐):禁止驱逐数据,这也是默认策略

意思是当内存不足以容纳新入数据时,新写入操作就会报错,请求可以继续进行,线上任务也不能持续进行,采用no-enviction策略可以保证数据不被丢失。

这八种大体上可以分为4中:

  1. lru(Least Recently Used,最近最少使用)
  2. lfu(Least Frequently Used,最不经常使用)、
  3. random(随机)
  4. ttl

设置 maxmemory-policy 的方法 和 设置 maxmemory 方法类似,通过 redis.conf 或是通过 CONFIG SET 动态修改。

选择合适的置换策略是很重要的,这主要取决于你的应用的访问模式,当然你也可以动态的修改置换策略;

并通过用 Redis 命令——INFO 去输出 cache 的命中率情况,进而可以对置换策略进行调优。

置换策略是如何工作的?

  1. 客户端执行一条新命令,导致数据库需要增加数据(比如set key value)
  2. Redis会检查内存使用,如果内存使用超过 maxmemory,就会按照置换策略删除一些 key
  3. 新的命令执行成功

我们持续的写数据会导致内存达到或超出上限 maxmemory,但是置换策略会将内存使用降低到上限以下。

如果一次需要使用很多的内存(比如一次写入一个很大的set),那么,Redis 的内存使用可能超出最大内存限制一段时间。

LRU 算法机制:

LRU算法的全称叫做Least Recently Used,也就是最近最少使用原则来进行数据的淘汰算法。

其原理就是,会将数据放入到一个链表中,当链表中的某个元素被访问时,这个元素就被会提到链表的前面,其他元素,默认向后移动;

当这个时候我们想缓存中新增一个元素时,也会被增加到链表的头部,那么尾部的最后一个元素就被淘汰了。

lru的实现思想就是:就是刚被访问的数据,在接下来的时间里,更容易被再次访问,而一段时间没有被访问的数据,之后也不会再次访问。

但是要将redis的全部数据都放入这样一个链表中的话,redis的数据被频繁访问时,需要不停的移动链表的位置,降低redis的性能。

所以redis对LRU算法进行了优化 ↓

在redis中,会给每个数据记录一个最近访问的时间戳(记录在RedisObject的lru字段中),

当需要进行数据淘汰时,redis就随机筛选出N个数据放入到候选集合中去,然后比较这N个数据中的lru的值,最小的就会被淘汰。

当再次需要淘汰数据时,这个时候筛选数据放入到第一次创建的淘汰集合中,那么这次筛选就不在是随机筛选,而是能进入候选集合的数据的 lru 字段值必须小于候选集合中最小的 lru 值,

然后再次将最小的lru的值的数据进行淘汰。

其中N的配置项为:

maxmemory-samples 100 # 表示N为100

LFU 算法机制:

LFU(Least frequently used)称为最近使用最少的数据将被淘汰,redis在就是在LRU的基础上增加一个次数统计。

其步骤就是根据数据的访问次数进行筛选,淘汰访问次数少的数据,如果访问次数相同,在根据访问时间进行比较,淘汰访问时间久远的数据。

redis中的实现方式:就是在RedisObject的字段lru上,拆分为两个部分:

  • ldt值:lru字段的前16bit位,还是用来表示时间戳。
  • counter值:lru字段的后8bit位,用来表示数据的访问次数。

当 LFU 策略筛选数据时,Redis 会在候选集合中,根据数据 lru 字段的后 8bit 选择访问次数最少的数据进行淘汰。

当访问次数相同时,再根据 lru 字段的前 16bit 值大小,选择访问时间最久远的数据进行淘汰。

但是8个bit位,最大只能记录255的值,但是redis中的数据,有时候会被访问成千上万次,那么这个问题如何进行解决呢?

redis对计数进行了优化,并不是数据被访问一次,counter就会被加1,而是遵循如下规则:↓

当数据被访问一次时,首先用计数器当前的值乘以配置项lfu_log_factor再加1,再取倒数得到一个p值然后把这个p值和一个取值范围在(0,1)的一个随机数r,进行比大小,只有p值大于r时,counter的值才会被加一

lfu-log-factor可以调整计数器counter的增长速度,lfu-log-factor越大,counter增长的越慢。

lfu-decay-time是一个以分钟为单位的数值,可以调整counter的减少速度
#redis部分源码展示

double r = (double)rand()/RAND_MAX;

double p = 1.0/(baseval*server.lfu_log_factor+1);

if (r < p) counter++;

其中 baseval是计数器的当前值。计数器的默认初始值为5(由代码中的 LFU_INIT_VAL 常量设置),并不是为0,这样可以避免数据刚进入缓存,就因为访问次数少而被立即淘汰。

当lfu_log_factor取不同的值时,实际访问次数下,counter的值的变化情况:

在实际的使用场景中,还会有这样一种情况,某些数据可能一开始会被大量的访问,但是过了时间段后,就不会再被访问。

如果这个时候counter的值很大,就算后续不会被访问,也就不会被redis进行数据淘汰。

针对这种情况,在redis中,设计了counter的衰减策略。其实现就是根据lfu_decay_time的配置值,来控制访问次数的衰减。

其流程如下:

  • lfu会计算当前时间和数据最近一次访问的时间差值,并将这个差值换算为分钟单位。
  • 然后在将这个差值除以lfu_decay_time值,得到的就是我们需要减去的值
  • 然后再讲counter的值减去这个值

这样就可以保证在一段时间后,可以淘汰这部分数据。

Redis 的淘汰策略怎么选:

一般来说,有这样一些常用的经验:

  • 在所有的 key 都是最近最经常使用,那么就需要选择 allkeys-lru 进行置换最近最不经常使用的 key,如果你不确定使用哪种策略,那么推荐使用 allkeys-lru
  • 如果所有的 key 的访问概率都是差不多的,那么可以选用 allkeys-random 策略去置换数据
  • 如果对数据有足够的了解,能够为 key 指定 hint(通过expire/ttl指定),那么可以选择 volatile-ttl 进行置换

volatile-lru 和 volatile-random 经常在一个Redis实例既做cache又做持久化的情况下用到,然而,更好的选择使用两个Redis实例来解决这个问题。

设置是失效时间 expire 会占用一些内存,而采用 allkeys-lru 就没有必要设置失效时间,进而更有效的利用内存。

 

版权声明:本文为codingmode原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/codingmode/p/15244526.html