了解 LRU 之前,我們應該了解一下緩存,大家都知道計算機具有緩存內(nèi)存,可以臨時存儲最常用的數(shù)據(jù),當緩存數(shù)據(jù)超過一定大小時,系統(tǒng)會進行回收,以便釋放出空間來緩存新的數(shù)據(jù),但從系統(tǒng)中檢索數(shù)據(jù)的成本比較高。
緩存要求:
- 固定大小:緩存需要有一些限制來限制內(nèi)存使用。
- 快速訪問:緩存插入和查找操作應該很快,最好是 O(1) 時間。
- 在達到內(nèi)存限制的情況下替換條目:緩存應該具有有效的算法來在內(nèi)存已滿時驅(qū)逐條目
如果提供一個緩存替換算法來輔助管理,按照設定的內(nèi)存大小,刪除最少使用的數(shù)據(jù),在系統(tǒng)回收之前主動釋放出空間,會使得整個檢索過程變得非??欤虼?LRU 緩存淘汰算法就出現(xiàn)了。
LRU 原理與實現(xiàn)
LRU (Least Recently Used) 緩存淘汰算法提出最近被頻繁訪問的數(shù)據(jù)應具備更高的留存,淘汰那些不常被訪問的數(shù)據(jù),即最近使用的數(shù)據(jù)很大概率將會再次被使用,拋棄最長時間未被訪問的數(shù)據(jù),目的是為了方便以后獲取數(shù)據(jù)變得更快,例如 Vue
的 keep-live
組件就是 LRU 的一種實現(xiàn)。
實現(xiàn)的中心思想拆分為以下幾步:
- 新的數(shù)據(jù)插入到鏈表頭部。
- 每當緩存命中(即緩存數(shù)據(jù)被訪問),則將數(shù)據(jù)移到鏈表頭部。
- 當緩存內(nèi)存已滿時(鏈表數(shù)量已滿時),將鏈表尾部的數(shù)據(jù)淘汰。
Example
這里使用一個例子來說明 LRU 實現(xiàn)的流程,詳細請參考這里。
- 最開始時,內(nèi)存空間是空的,因此依次進入A、B、C是沒有問題的
- 當加入D時,就出現(xiàn)了問題,內(nèi)存空間不夠了,因此根據(jù)LRU算法,內(nèi)存空間中A待的時間最為久遠,選擇A,將其淘汰
- 當再次引用B時,內(nèi)存空間中的B又處于活躍狀態(tài),而C則變成了內(nèi)存空間中,近段時間最久未使用的
- 當再次向內(nèi)存空間加入E時,這時內(nèi)存空間又不足了,選擇在內(nèi)存空間中待的最久的C將其淘汰出內(nèi)存,這時的內(nèi)存空間存放的對象就是E->B->D
基于雙向鏈表和 HashMap 實現(xiàn) LRU
常見的 LRU 算法是基于雙向鏈表和 HashMap 實現(xiàn)的。
雙向鏈表:用于管理緩存數(shù)據(jù)結(jié)點的順序,新增數(shù)據(jù)和緩存命中(最近被訪問)的數(shù)據(jù)被放置在 Header 結(jié)點,尾部的結(jié)點根據(jù)內(nèi)存大小進行淘汰。
HashMap:存儲所有結(jié)點的數(shù)據(jù),當 LRU 緩存命中(進行數(shù)據(jù)訪問)時,進行攔截進行數(shù)據(jù)置換和刪除操作。
雙向鏈表
雙向鏈表是眾多鏈表中的一種,鏈表都是采用鏈式存儲結(jié)構(gòu),鏈表中的每一個元素,我們稱之為數(shù)據(jù)結(jié)點。
每個數(shù)據(jù)結(jié)點都包含一個數(shù)據(jù)域和指針域,指針域可以確定結(jié)點與結(jié)點之間的順序,通過更新數(shù)據(jù)結(jié)點的指針域的指向可以更新鏈表的順序。
雙向鏈表的每個數(shù)據(jù)結(jié)點包含一個數(shù)據(jù)域和兩個指針域:
- proir 指向上一個數(shù)據(jù)結(jié)點;
- data 當前數(shù)據(jù)結(jié)點的數(shù)據(jù);
- next 指向下一個數(shù)據(jù)結(jié)點;
指針域確定鏈表的順序,那么雙向鏈表擁有雙向指針域,數(shù)據(jù)結(jié)點的之間不在是單一指向,而是雙向指向。即 proir 指針域指向上一個數(shù)據(jù)結(jié)點,next 指針域指向下一個數(shù)據(jù)結(jié)點。
同理:
- 單向鏈表只有一個指針域。
- 循環(huán)(環(huán)狀)鏈表則是擁有雙向指針域,且頭部結(jié)點的指針域指向尾部結(jié)點,尾部結(jié)點的指針域指向頭部結(jié)點。
特殊結(jié)點:Header 和 Tailer 結(jié)點
鏈表中還有兩個特殊的結(jié)點,那就算 Header
結(jié)點和 Tailer
結(jié)點,分別表示頭部結(jié)點和尾部結(jié)點,頭部結(jié)點表示最新的數(shù)據(jù)或者緩存命中(最近訪問過的數(shù)據(jù)),尾部結(jié)點表示長時間未被使用,即將被淘汰的數(shù)據(jù)節(jié)點。
作為算法大家都會關(guān)注其時間和空間復雜度 O(n),基于雙向鏈表雙向指針域的優(yōu)勢,為了降級時間復雜度,因此
為了保證 LRU 新數(shù)據(jù)和緩存命中的數(shù)據(jù)都位于鏈表最前面(Header
),緩存淘汰的時候刪除最后的結(jié)點(Tailer
),又要避免數(shù)據(jù)查找時從頭到尾遍歷,降低算法的時間復雜度,同時基于雙向鏈表帶來的優(yōu)勢,可以改變個別數(shù)據(jù)結(jié)點的指針域從而達到鏈表數(shù)據(jù)的更新,如果提供 Header 和 Tailer 結(jié)點作為標識的話,可以使用頭插法快速增加結(jié)點,根據(jù) Tailer 結(jié)點也可以在緩存淘汰時快速更新鏈表的順序,避免遍歷從頭到尾遍歷,降低算法的時間復雜度。
排序示例
LRU 鏈表中有 [6,5,4,3,2,1]
6個數(shù)據(jù)結(jié)點,其中 6
所在的數(shù)據(jù)結(jié)點為 Header(頭部)結(jié)點,1
所在的數(shù)據(jù)結(jié)點為 Tailer(尾部)結(jié)點。如果此時數(shù)據(jù) 3
被訪問(緩存命中),3
應該被更新至鏈表頭,用數(shù)組的思維應該是刪除 3
,但是如果我們利用雙向鏈表雙向指針的優(yōu)勢,可以快速的實現(xiàn)鏈表順便的更新:
3
被刪除時,4
和2
中間沒有其他結(jié)點,即4
的next
指針域指向2
所在的數(shù)據(jù)結(jié)點;同理,2
的proir
指針域指向2
所在的數(shù)據(jù)結(jié)點。
HashMap
至于為什么使用 HashMap
,用一句話來概括主要是因為 HashMap
通過 Key
獲取速度會快的多,降低算法的時間復雜度。
例如:
- 我們在 get 緩存的時候從
HashMap
中獲取的時候基本上時間復雜度控制在 O(1),如果從鏈表中一次遍歷的話時間復雜度是 O(n)。 - 我們訪問一個已經(jīng)存在的節(jié)點時候,需要將這個節(jié)點移動到
header
節(jié)點后,這個時候需要在鏈表中刪除這個節(jié)點,并重新在header
后面新增一個節(jié)點。這個時候先去HashMap
中獲取這個節(jié)點刪除節(jié)點關(guān)系,避免了從鏈表中遍歷,將時間復雜度從 O(N) 減少為 O(1)
由于前端沒有 HashMap 的相關(guān) API,我們可以使用
Object
或者Map
來代替。
代碼實現(xiàn)
現(xiàn)在讓我們運用所掌握的數(shù)據(jù)結(jié)構(gòu),設計和實現(xiàn)一個,或者參考 LeeCode 146 題。
鏈表結(jié)點 Entry
export class Entry { value: T key: string | number next: Entry prev: Entry constructor(val: T) { this.value = val; }}
雙向鏈表 Double Linked List
主要職責:
- 管理頭部結(jié)點和尾部結(jié)點
- 插入新數(shù)據(jù)時,將新數(shù)據(jù)移到頭部結(jié)點
- 刪除數(shù)據(jù)時,更新刪除結(jié)點前后兩個結(jié)點的指向域
/*** Simple double linked list. Compared with array, it has O(1) remove operation.* @constructor*/export class LinkedList { head: Entry tail: Entry private _len = 0 /** * Insert a new value at the tail */ insert(val: T): Entry { const entry = new Entry(val); this.insertEntry(entry); return entry; } /** * Insert an entry at the tail */ insertEntry(entry: Entry) { if (!this.head) { this.head = this.tail = entry; } else { this.tail.next = entry; entry.prev = this.tail; entry.next = null; this.tail = entry; } this._len++; } /** * Remove entry. */ remove(entry: Entry) { const prev = entry.prev; const next = entry.next; if (prev) { prev.next = next; } else { // Is head this.head = next; } if (next) { next.prev = prev; } else { // Is tail this.tail = prev; } entry.next = entry.prev = null; this._len--; } /** * Get length */ len(): number { return this._len; } /** * Clear list */ clear() { this.head = this.tail = null; this._len = 0; }}
LRU 核心算法
主要職責:
- 將數(shù)據(jù)添加到鏈表并更新鏈表順序
- 緩存命中時更新鏈表的順序
- 內(nèi)存溢出拋棄過時的鏈表數(shù)據(jù)
/*** LRU Cache*/export default class LRU { private _list = new LinkedList() private _maxSize = 10 private _lastRemovedEntry: Entry private _map: Dictionary> = {} constructor(maxSize: number) { this._maxSize = maxSize; } /** * @return Removed value */ put(key: string | number, value: T): T { const list = this._list; const map = this._map; let removed = null; if (map[key] == null) { const len = list.len(); // Reuse last removed entry let entry = this._lastRemovedEntry; if (len >= this._maxSize && len > 0) { // Remove the least recently used const leastUsedEntry = list.head; list.remove(leastUsedEntry); delete map[leastUsedEntry.key]; removed = leastUsedEntry.value; this._lastRemovedEntry = leastUsedEntry; } if (entry) { entry.value = value; } else { entry = new Entry(value); } entry.key = key; list.insertEntry(entry); map[key] = entry; } return removed; } get(key: string | number): T { const entry = this._map[key]; const list = this._list; if (entry != null) { // Put the latest used entry in the tail if (entry !== list.tail) { list.remove(entry); list.insertEntry(entry); } return entry.value; } } /** * Clear the cache */ clear() { this._list.clear(); this._map = {}; } len() { return this._list.len(); }}
其他 LRU 算法
除了以上常見的 LRU 算法,隨著需求的復雜多樣,基于 LRU 的思想也衍生出了許多優(yōu)化算法,例如: