1. 官方解释
因为Redis是基于内存的操作,CPU不是Redis的瓶颈,Redis的瓶颈最有可能是机器内存的大小或者网络带宽。既然单线程容易实现,而且CPU不会成为瓶颈,那就顺理成章地采用单线程的方案了
2. 详细原因
- 单线程不需要考虑各种锁的性能消耗
- 可以使用单线程多进程集群化方案代替多线程方案来解决性能问题;
- 避免了不必要的上下文切换和竞争条件,也不存在多进程或者多线程导致的切换而消耗CPU
- 一次CPU切换的时间大概要1500ns左右,从内存中读取1MB的连续数据时间大概要250us
- 多线程技术是为了充分利用CPU,但是Redis吞吐量很大,1s能处理十的六次方个请求
- 使用I/O多路复用机制并发处理来自客户端的多个连接,同时等待多个连接发送的请求
以前一直有个误区,以为:高性能服务器 一定是 多线程来实现的原因很简单因为误区而导致的: 多线程 一定比 单线程 效率高。其实不然。
在说这个事前希望大家都能对 CPU 、 内存 、 硬盘的速度都有了解了
Redis 核心就是如果我的数据全都在内存里,我单线程的去操作就是效率最高的,为什么呢,因为多线程的本质就是 CPU 模拟出来多个线程的情况,这种模拟出来的情况就有一个代价,就是上下文的切换。对于一个内存的系统来说,它没有上下文的切换,所以效率最高的。Redis 用单个CPU绑定一块内存的数据,然后针对这块内存的数据进行多次读写的时候,都是在一个CPU上完成的,所以它是单线程处理这个事。在内存的情况下,这个方案就是最佳方案。
一次CPU上下文的切换大概在 1500ns 左右,从内存中读取 1MB 的连续数据,耗时大约为 250us,假设1MB的数据由多个线程读取了1000次,那么就有1000次时间上下文的切换,那么就有1500ns * 1000 = 1500us ,单线程的读完1MB数据才250us,而你光上下文的切换就用了1500us了,还不算每次读一点数据的时间。
那什么时候用多线程的方案呢?
答案是:下层的存储等慢速的情况。比如磁盘。内存是一个 IOPS 非常高的系统,因为我想申请一块内存就申请一块内存,销毁一块内存我就销毁一块内存,内存的申请和销毁是很容易的。而且内存是可以动态的申请大小的。
磁盘的特性是:IPOS很低很低,但吞吐量很高。这就意味着,大量的读写操作都必须攒到一起,再提交到磁盘的时候,性能最高。为什么呢?
如果我有一个事务组的操作(就是几个已经分开了的事务请求,比如写读写读写,这么五个操作在一起),在内存中,因为IOPS非常高,我可以一个一个的完成,但是如果在磁盘中也有这种请求方式的话,我第一个写操作是这样完成的:我先在硬盘中寻址,大概花费10ms,然后我读一个数据可能花费1ms然后我再运算(忽略不计),再写回硬盘又是10ms ,总共21ms。第二个操作去读花了10ms, 第三个又是写花费了21ms ,然后我再读10ms, 写21ms ,五个请求总共花费83ms,这还是最理想的情况下,这如果在内存中,大概1ms不到。
所以对于磁盘来说,它吞吐量这么大,那最好的方案肯定是我将N个请求一起放在一个buff里,然后一起去提交。
方法就是用异步:将请求和处理的线程不绑定,请求的线程将请求放在一个buff里,然后等buff快满了,处理的线程再去处理这个buff。然后由这个buff 统一的去写入磁盘,或者读磁盘,这样效率就是最高。 java里的 IO不就是这么干的么~
对于慢速设备,这种处理方式就是最佳的,慢速设备有磁盘,网络 ,SSD 等等。多线程 ,异步的方式处理这些问题非常常见,大名鼎鼎的netty 就是这么干的。
补一发大师语录:来说说,为何单核cpu绑定一块内存效率最高
“我们不能任由操作系统负载均衡,因为我们自己更了解自己的程序,所以我们可以手动地为其分配CPU核,而不会过多地占用CPU”,默认情况下单线程在进行系统调用的时候会随机使用CPU内核,为了优化Redis,我们可以使用工具为单线程绑定固定的CPU内核,减少不必要的性能损耗!
redis作为单进程模型的程序,为了充分利用多核CPU,常常在一台server上会启动多个实例。而为了减少切换的开销,有必要为每个实例指定其所运行的CPU。
Linux 上 taskset 可以将某个进程绑定到一个特定的CPU。你比操作系统更了解自己的程序,为了避免调度器愚蠢的调度你的程序,或是为了在多线程程序中避免缓存失效造成的开销
3. 为什么Redis4.0以后的版本引入多线程支持
在Redis4.0之后版本,Reids服务在执行一些命令时就会使用主处理线程之外的其他线程,例如ULINK、FLUSHALL ASYNC、FLUSHDB ASYSN等非阻塞的删除操作。
对于删除操作,如果键值对所占用的内存空间较小,单线程同步删除损耗也不会太大,如果键值对占用的内存空间较大,几十兆的文件,毫秒内是无法删除的,且释放内存也会有时间消耗,这些操作会阻塞其它操作,但是这些删除操作对其它操作并没有任何影响,所以可以异步执行,通过多线程非阻塞的释放内存空间,提高执行效率。