Redis高效率原因及數據結構分析
1、什麼是redis?它主要用來幹什麼的?
Redis,英文全稱是Remote Dictionary Server(遠程字典服務),是一個開源的使用ANSI C語言編寫、支持網絡、可基於內存亦可持久化的日志型、Key-Value數據庫,並提供多種語言的API。
與MySQL數據庫不同的是,Redis的數據是存在內存中的。它的讀寫速度非常快,每秒可以處理超過10萬次讀寫操作。因此redis被廣泛應用於緩存,另外,Redis也經常用來做分佈式鎖。除此之外,Redis支持事務、持久化、LUA 腳本、LRU 驅動事件、多種集群方案。
知道redis是什麼後,接下來我們來說一說redis為什麼這麼快。
2、redis為什麼這麼快?
我們來一個一個說明!
基於內存存儲實現
計算機專業的同學我們都知道內存讀寫是要比磁盤快很多的,Redis是基於內存實現的數據庫,相對於數據存在磁盤的mysql等數據庫,省去瞭磁盤I/O的消耗。
高效的數據結構
我們都知道,mysql索引為瞭提高效率,選擇瞭B+樹的數據結構,對於一個應用場景來說合理的數據結構可以讓你的應用或者程序更快。我們來看看Redis的數據結構–內部編碼圖:
String
: 動態字符串SDS
List
: 雙端鏈表LinkedList+壓縮鏈表ziplist
Hash
: 壓縮鏈表ziplist+字典哈希表hashtable
Set
: hashtable(+inset)
Zset
: 壓縮鏈表ziplist+跳表skiplist
我們來說一說這幾種內部編碼:
1、SDS簡單動態字符串
我們來和C語言中的char[ ]對比下
字符串長度處理: Redis獲取字符串長度,時間復雜度為O(1),而C語言中,需要從頭遍歷,復雜度為O(N)。
空間預分配: 字符串修改越頻繁的話,內存分配就越頻繁,就會很消費性能,而SDS修改和空間擴充,會額外分配未使用的空間,減少性能損耗。
惰性空間釋放: SDS縮短時,不是回收多餘的內存空間,而是free記錄下多餘的空間,後續有變更,直接使用free中記錄的空間,減少分配。
二進制安全: Redis可以存儲一些二進制數據,在C語言中字符串遇到’/0’會結束,而SDS中標志字符串結束的是len屬性。
2、字典
Redis 作為 K-V 型內存數據庫,所有的鍵值就是用字典來存儲。字典就是哈希表,比如HashMap,通過key就可以直接獲取到對應的value。而哈希表的特性,在O(1)時間復雜度就可以獲得對應的值。
3、跳表
跳表是Redis特有的數據結構,就是在鏈表的基礎上,增加多級索引提升查找效率。
跳表支持平均O(logN),最壞O(N)復雜度的節點查找,還可以通過順序性操作。
合理的數據編碼
Redis 支持多種數據數據類型,每種基本類型,可能對多種數據結構。什麼時候,使用什麼樣數據結構,使用什麼樣編碼,是redis設計者總結優化的結果。
String: 如果存儲數字的話,是用int類型的編碼;如果存儲非數字,小於等於39字節的字符串,是embstr;大於39個字節,則是raw編碼。
List: 如果列表的元素個數小於512個,列表每個元素的值都小於64字節(默認),使用ziplist編碼,否則使用linkedlist編碼
Hash: 哈希類型元素個數小於512個,所有值小於64字節的話,使用ziplist編碼,否則使用hashtable編碼。
Set: 如果集合中的元素都是整數且元素個數小於512個,使用intset編碼,否則使用hashtable編碼。
Zset: 當有序集合的元素個數小於128個,每個元素的值小於64字節時,使用ziplist編碼,否則使用skiplist(跳躍表)編碼。
合理的線程模型
1、I/O多路復用
多路I/O復用技術可以讓單個線程高效的處理多個連接請求,而Redis使用用epoll作為I/O多路復用技術的實現。並且,Redis自身的事件處理模型將epoll中的連接、讀寫、關閉都轉換為事件,不在網絡I/O上浪費過多的時間。
2、什麼是I/O多路復用?
I/O : 網絡 I/O
多路 : 多個網絡連接
復用: 復用同一個線程。
IO多路復用其實就是一種同步IO模型,它實現瞭一個線程可以監視多個文件句柄;一旦某個文件句柄就緒,就能夠通知應用程序進行相應的讀寫操作;而沒有文件句柄就緒時,就會阻塞應用程序,交出cpu。
3、單線程模型
Redis是單線程模型的,而單線程避免瞭CPU不必要的上下文切換和競爭鎖的消耗。也正因為是單線程,如果某個命令執行過長(如hgetall命令),會造成阻塞。Redis是面向快速執行場景的數據庫。,所以要慎用如smembers和lrange、hgetall等命令。
Redis 6.0 引入瞭多線程提速,它的執行命令操作內存的仍然是個單線程。
虛擬內存機制
redis直接自己構建瞭VM機制,不會像一般的系統會調用系統函數處理,會浪費一定的時間去移動和請求。
Redis的虛擬內存機制是啥呢?
虛擬內存機制就是暫時把不經常訪問的數據(冷數據)從內存交換到磁盤中,從而騰出寶貴的內存空間用於其它需要訪問的數據(熱數據)。通過VM功能可以實現冷熱數據分離,使熱數據仍在內存中、冷數據保存到磁盤。這樣就可以避免因為內存不足而造成訪問速度下降的問題。
以上就是Redis高效原因及數據結構分析的詳細內容,更多關於Redis的資料請關註WalkonNet其它相關文章!