假设有个百万签到系统,记录用户签到记录,签了记录1,没签记录 0,如果我们用redis的string存储,一年就要存1000000*365个key,会占用大量的内存。
为了解决这个问题,Redis 提供了位图数据结构,这样每天的签到记录只占据一个位,365 天就是 365 个位,46 个字节 (一个稍长一点的字符串) 就可以完全容纳下,这就大大节约了存储空间。
bitmap 存储的是连续的二进制数字(0 和 1),通过 bitmap, 只需要一个 bit 位来表示某个元素对应的值或者状态,key 就是对应元素本身 。我们知道 8 个 bit 可以组成一个 byte,所以 bitmap 本身会极大的节省储存空间。
1.常用命令
byte[] bytes = "hzy".getBytes();
for (byte b : bytes) {
System.out.println(Integer.toBinaryString(b));
}
执行结果
1101000
1111010
1111001
我们使用位图设置一个字符串"hzy",基本命令是"setbit key [offset] [value]",我们先得到ascll码对应的二进制数据:01101000 01111010 01111001
## 零存整取
127.0.0.1:6379> setbit test 1 1
(integer) 0
127.0.0.1:6379> setbit test 2 1
(integer) 0
127.0.0.1:6379> setbit test 4 1
(integer) 0
127.0.0.1:6379> get test
"h"
127.0.0.1:6379> setbit test 9 1
(integer) 0
127.0.0.1:6379> setbit test 10 1
(integer) 0
127.0.0.1:6379> setbit test 11 1
(integer) 0
127.0.0.1:6379> setbit test 12 1
(integer) 0
127.0.0.1:6379> setbit test 14 1
(integer) 0
127.0.0.1:6379> get test
"hz"
127.0.0.1:6379> setbit test 17 1
(integer) 0
127.0.0.1:6379> setbit test 18 1
(integer) 0
127.0.0.1:6379> setbit test 19 1
(integer) 0
127.0.0.1:6379> setbit test 20 1
(integer) 0
127.0.0.1:6379> setbit test 23 1
(integer) 0
127.0.0.1:6379> get test
"hzy"
## 零存零取
127.0.0.1:6379> getbit test 1
(integer) 1
## 整存零取
127.0.0.1:6379> set test2 h
OK
127.0.0.1:6379> getbit test2 1
(integer) 1
2.bitcount&bitpos
我们可以通过 bitcount 统计用户一共签到了多少天。通过 bitpos 指令查找用户从哪一天开始第一次签到,如果指定了范围参数[start, end],就可以统计在某个时间范围内用户签到了多少天。用户自某天以后的哪天开始签到。
但是需要注意的是 start 和 end 参数是字节索引,也就是说指定的位范围必须是 8 的倍数,而不能任意指定。因为这个设计,我们无法直接计算某个月内用户签到了多少天,而必须要将这个月所覆盖的字节内容全部取出来 (getrange 可以取出字符串的子串) 然后在内存里进行统计,这个非常繁琐。
bitcount命令使用,bitcount key [start] [end]
127.0.0.1:6379> set name hzy
OK
127.0.0.1:6379> bitcount name
(integer) 13
127.0.0.1:6379> bitcount name 0 0 # 第一个字符中1的个数
(integer) 3
127.0.0.1:6379> bitcount name 0 1 # 前两个字符中1的个数
(integer) 8
bitpos命令使用,bitpos key bit [start] [end]
hzy对应的ascll码对应的二进制数据:01101000 01111010 01111001
127.0.0.1:6379> bitpos name 0 #第一个0的下标
(integer) 0
127.0.0.1:6379> bitpos name 1 #第一个1的下标
(integer) 1
127.0.0.1:6379> bitpos name 1 2 10 #从第三个字符起,第一个1的下标(也就是说hz不算,只有y参与)
(integer) 17
3.bitfield
我们设置 (setbit) 和获取 (getbit) 指定位的值都是单个位的,如果要一次操作多个位,就必须使用管道来处理。不过 Redis 的 3.2 版本提供了bitfield指令。
bitfield key [GET type offset] [SET type offset value] [INCRBY type offset increment] [OVERFLOW WRAP|SAT|FAIL]
## 模拟用户2021年7月15日签到,偏移量从0开始
127.0.0.1:6379> setbit userid:sign:202107 14 1
(integer) 0
## 模拟用户2021年7月16日签到,偏移量从0开始
127.0.0.1:6379> setbit userid:sign:202107 15 1
(integer) 0
## 模拟用户2021年7月31日签到,偏移量从0开始
127.0.0.1:6379> setbit userid:sign:202107 30 1
(integer) 0
## 获取用户2021年7月的签到数据
127.0.0.1:6379> bitfield userid:sign:202107 get u31 0
1) (integer) 98305
// 这是伪代码,key是我写死的,真实场景下,userid是用户的ID
public static void main(String[] args) {
LocalDate date = LocalDate.now();
Map<String, Boolean> signMap = new TreeMap<>();
List<Long> list = jedis.bitfield("userid:sign:202107", "GET", String.format("u%d", date.lengthOfMonth()), "0");
if (list != null && list.size() > 0) {
// 由低位到高位,为0表示未签,为1表示已签
long v = list.get(0) == null ? 0 : list.get(0);
for (int i = date.lengthOfMonth(); i > 0; i--) {
LocalDate d = date.withDayOfMonth(i);
signMap.put(formatDate(d, "yyyy-MM-dd"), v >> 1 << 1 != v);
v >>= 1;
}
}
System.out.println(signMap.toString());
}
private static String formatDate(LocalDate date, String pattern) {
return date.format(DateTimeFormatter.ofPattern(pattern));
}
// 执行结果
{2021-07-01=false, 2021-07-02=false, 2021-07-03=false,
2021-07-04=false, 2021-07-05=false, 2021-07-06=false,
2021-07-07=false, 2021-07-08=false, 2021-07-09=false,
2021-07-10=false, 2021-07-11=false, 2021-07-12=false,
2021-07-13=false, 2021-07-14=false, 2021-07-15=true,
2021-07-16=true, 2021-07-17=false, 2021-07-18=false,
2021-07-19=false, 2021-07-20=false, 2021-07-21=false,
2021-07-22=false, 2021-07-23=false, 2021-07-24=false,
2021-07-25=false, 2021-07-26=false, 2021-07-27=false,
2021-07-28=false, 2021-07-29=false, 2021-07-30=false,
2021-07-31=true}
注意:i是有符号整数 u是无符号整数,例如u8是一个8位的无符号整数,有符号最多可以获取64位,无符号最多可以获取63位
我们使用bitfield key set子指令,把最后一个字符串y,改为大写的Y,Y的ASCII码是89
127.0.0.1:6379> set name hzy
OK
127.0.0.1:6379> bitfield name set u8 16 89
1) (integer) 121
127.0.0.1:6379> get name
"hzY"