目录

Redis 设计规范指北

概述

本文介绍了在使用阿里云 Redis 的开发规范,从键值设计、命令使用、客户端使用、相关工具等方面进行说明,通过本文的介绍可以减少使用 Redis 过程带来的问题。

一、键值设计

1. key 名设计

  • (1)【建议】: 可读性和可管理性

以业务名(或数据库名)为前缀(防止 key 冲突),用冒号分隔,比如「业务名:表名:id」

1
ugc:video:1
  • (2)【建议】:简洁性

保证语义的前提下,控制 key 的长度,当 key 较多时,内存占用也不容忽视,例如:

1
user:{uid}:friends:messages:{mid}简化为u:{uid}:fr:m:{mid}。
  • (3)【强制】:不要包含特殊字符

反例:包含空格、换行、单双引号以及其他转义字符

详细解析

2. value 设计

  • (1)【强制】:拒绝 bigkey (防止网卡流量、慢查询)

String 类型控制在10 KB 以内,哈希、列表、集合、有序集合元素个数不要超过 5000。

技巧

String 是一组字节。在 Redis 数据库中,字符串是二进制安全的。这意味着它们具有已知长度,并且不受任何特殊终止字符的影响。可以在一个字符串中存储最多 512 兆字节的内容。

哈希、列表、集合、有序集合等可以存储多达 $2^{32} - 1 $ 个元素(超过 40 亿个元素)

反例:一个包含 200 万个元素的 hash。

1
2
3
4
5
6
7
8
> hlen big:hash
2000000
> hgetall big:hash
a
1
b
2
此次省略约 400 万行

非字符串的 bigkey,不要使用 del 删除(redis 4.0 引入了 lazyfree 的机制),使用 hscan、sscan、zscan 方式渐进式删除,同时要注意防止 bigkey 过期时间自动删除问题(例如一个 200 万的 zset 设置 1 小时过期,会触发 del 操作,造成阻塞,而且该操作不会不出现在慢查询中(latency 可查)

详细解析

  • (2)【推荐】:选择适合的数据类型。

例如:实体类型(要合理控制和使用数据结构内存编码优化配置,例如 ziplist,但也要注意节省内存和性能之间的平衡)

反例:

1
2
3
set user:1:name tom
set user:1:age 19
set user:1:favor football

正例:

1
hmset user:1 name tom age 19 favor football

3.过期时间控制

【推荐】:控制 key 的生命周期,redis 不是垃圾桶。

建议使用 expire 设置过期时间(条件允许可以打散过期时间,防止集中过期),不过期的数据重点关注 idletime。

二、命令使用

1.【推荐】 O(N) 命令关注 N 的数量

例如 hgetall、lrange、smembers、zrange、sinter 等并非不能使用,但是需要明确 N 的值。有遍历的需求可以使用hscan、sscan、zscan代替。

2.【推荐】:禁用命令

禁止线上使用 keys、flushall、flushdb 等,通过 redis 的 rename 机制禁掉命令,或者使用 scan 的方式渐进式处理。

3.【推荐】合理使用 select

redis 的多数据库较弱,使用数字进行区分,很多客户端支持较差,同时多业务用多数据库实际还是单线程处理,会有干扰。

4.【推荐】使用批量操作提高效率

1
2
原生命令:例如 mget、mset。
非原生命令:可以使用 pipeline 提高效率。

但要注意控制一次批量操作的元素个数(例如 500 以内,实际也和元素字节数有关)。

注意两者不同:

1
2
3
1. 原生是原子操作,pipeline 是非原子操作。
2. pipeline 可以打包不同的命令,原生做不到
3. pipeline 需要客户端和服务端同时支持。

5.【建议】Redis 事务功能较弱,不建议过多使用

Redis 的事务功能较弱(不支持回滚),而且集群版本(自研和官方)要求一次事务操作的 key 必须在一个 slot 上(可以使用 hashtag 功能解决)

6.【建议】Redis 集群版本在使用 Lua 上有特殊要求:

  • 1.所有 key 都应该由 KEYS 数组来传递,redis.call/pcall 里面调用的 redis 命令,key 的位置,必须是 KEYS array,否则直接返回 error,「ERR bad lua script for redis cluster, all the keys that the script uses should be passed using the KEYS array」
  • 2.所有 key,必须在1个 slot 上,否则直接返回 error, 「ERR eval/evalsha command keys must in same slot」

7.【建议】必要情况下使用 monitor 命令时,要注意不要长时间使用。

三、客户端使用

1.【推荐】

避免多个应用使用一个 Redis 实例

正例:不相干的业务拆分,公共数据做服务化。

2.【推荐】

使用带有连接池的数据库,可以有效控制连接,同时提高效率,标准使用方式:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
执行命令如下:
Jedis jedis = null;
try {
    jedis = jedisPool.getResource();
    //具体的命令
    jedis.executeCommand()
} catch (Exception e) {
    logger.error("op key {} error: " + e.getMessage(), key, e);
} finally {
    //注意这里不是关闭连接,在JedisPool模式下,Jedis会被归还给资源池。
    if (jedis != null) 
        jedis.close();
}

下面是 JedisPool 优化方法的文章:

3.【建议】

高并发下建议客户端添加熔断功能(例如 netflix hystrix)

4.【推荐】

设置合理的密码,如有必要可以使用 SSL 加密访问

5.【建议】

根据自身业务类型,选好 maxmemory-policy(最大内存淘汰策略),设置好过期时间。

默认策略是 volatile-lru,即超过最大内存后,在过期键中使用 lru 算法进行 key 的剔除,保证不过期数据不被删除,但是可能会出现 OOM 问题。

其他策略如下:

  • allkeys-lru:根据 LRU 算法删除键,不管数据有没有设置超时属性,直到腾出足够空间为止。
  • allkeys-random:随机删除所有键,直到腾出足够空间为止。
  • volatile-random:随机删除过期键,直到腾出足够空间为止。
  • volatile-ttl:根据键值对象的ttl属性,删除最近将要过期数据。如果没有,回退到 noeviction 策略。
  • noeviction:不会剔除任何数据,拒绝所有写入操作并返回客户端错误信息「(error) OOM command not allowed when used memory」,此时 Redis 只响应读操作。

四、相关工具

1.【推荐】:数据同步

redis 间数据同步可以使用:redis-port

2.【推荐】:big key搜索

redis大key搜索工具

3.【推荐】:热点key寻找(内部实现使用monitor,所以建议短时间使用)

facebook的redis-faina

参考地址