了解 LRU 之前,我們應該了解一下緩存,大家都知道計算機具有緩存內(nèi)存,可以臨時存儲最常用的數(shù)據(jù),當緩存數(shù)據(jù)超過一定大小時,系統(tǒng)會進行回收,以便釋放出空間來緩存新的數(shù)據(jù),但從系統(tǒng)中檢索數(shù)據(jù)的成本比較高。

緩存要求:

  • 固定大小:緩存需要有一些限制來限制內(nèi)存使用。
  • 快速訪問:緩存插入和查找操作應該很快,最好是 O(1) 時間。
  • 在達到內(nèi)存限制的情況下替換條目:緩存應該具有有效的算法來在內(nèi)存已滿時驅(qū)逐條目

如果提供一個緩存替換算法來輔助管理,按照設定的內(nèi)存大小,刪除最少使用的數(shù)據(jù),在系統(tǒng)回收之前主動釋放出空間,會使得整個檢索過程變得非??欤虼?LRU 緩存淘汰算法就出現(xiàn)了。

LRU 原理與實現(xiàn)

LRU (Least Recently Used) 緩存淘汰算法提出最近被頻繁訪問的數(shù)據(jù)應具備更高的留存,淘汰那些不常被訪問的數(shù)據(jù),即最近使用的數(shù)據(jù)很大概率將會再次被使用,拋棄最長時間未被訪問的數(shù)據(jù),目的是為了方便以后獲取數(shù)據(jù)變得更快,例如 Vuekeep-live 組件就是 LRU 的一種實現(xiàn)。

實現(xiàn)的中心思想拆分為以下幾步:

  • 新的數(shù)據(jù)插入到鏈表頭部。
  • 每當緩存命中(即緩存數(shù)據(jù)被訪問),則將數(shù)據(jù)移到鏈表頭部。
  • 當緩存內(nèi)存已滿時(鏈表數(shù)量已滿時),將鏈表尾部的數(shù)據(jù)淘汰。

Example

這里使用一個例子來說明 LRU 實現(xiàn)的流程,詳細請參考這里。

  1. 最開始時,內(nèi)存空間是空的,因此依次進入A、B、C是沒有問題的
  2. 當加入D時,就出現(xiàn)了問題,內(nèi)存空間不夠了,因此根據(jù)LRU算法,內(nèi)存空間中A待的時間最為久遠,選擇A,將其淘汰
  3. 當再次引用B時,內(nèi)存空間中的B又處于活躍狀態(tài),而C則變成了內(nèi)存空間中,近段時間最久未使用的
  4. 當再次向內(nèi)存空間加入E時,這時內(nèi)存空間又不足了,選擇在內(nèi)存空間中待的最久的C將其淘汰出內(nèi)存,這時的內(nèi)存空間存放的對象就是E->B->D

基于雙向鏈表和 HashMap 實現(xiàn) LRU

常見的 LRU 算法是基于雙向鏈表HashMap 實現(xiàn)的。

雙向鏈表:用于管理緩存數(shù)據(jù)結(jié)點的順序,新增數(shù)據(jù)和緩存命中(最近被訪問)的數(shù)據(jù)被放置在 Header 結(jié)點,尾部的結(jié)點根據(jù)內(nèi)存大小進行淘汰。

HashMap:存儲所有結(jié)點的數(shù)據(jù),當 LRU 緩存命中(進行數(shù)據(jù)訪問)時,進行攔截進行數(shù)據(jù)置換和刪除操作。

雙向鏈表

雙向鏈表是眾多鏈表中的一種,鏈表都是采用鏈式存儲結(jié)構(gòu),鏈表中的每一個元素,我們稱之為數(shù)據(jù)結(jié)點。

每個數(shù)據(jù)結(jié)點都包含一個數(shù)據(jù)域指針域,指針域可以確定結(jié)點與結(jié)點之間的順序,通過更新數(shù)據(jù)結(jié)點的指針域的指向可以更新鏈表的順序。

雙向鏈表的每個數(shù)據(jù)結(jié)點包含一個數(shù)據(jù)域和兩個指針域

  • proir 指向上一個數(shù)據(jù)結(jié)點;
  • data 當前數(shù)據(jù)結(jié)點的數(shù)據(jù);
  • next 指向下一個數(shù)據(jù)結(jié)點;

指針域確定鏈表的順序,那么雙向鏈表擁有雙向指針域,數(shù)據(jù)結(jié)點的之間不在是單一指向,而是雙向指向。即 proir 指針域指向上一個數(shù)據(jù)結(jié)點,next 指針域指向下一個數(shù)據(jù)結(jié)點。

同理:

  • 單向鏈表只有一個指針域。
  • 循環(huán)(環(huán)狀)鏈表則是擁有雙向指針域,且頭部結(jié)點的指針域指向尾部結(jié)點,尾部結(jié)點的指針域指向頭部結(jié)點。

特殊結(jié)點:Header 和 Tailer 結(jié)點

鏈表中還有兩個特殊的結(jié)點,那就算 Header 結(jié)點和 Tailer 結(jié)點,分別表示頭部結(jié)點尾部結(jié)點,頭部結(jié)點表示最新的數(shù)據(jù)或者緩存命中(最近訪問過的數(shù)據(jù)),尾部結(jié)點表示長時間未被使用,即將被淘汰的數(shù)據(jù)節(jié)點。

作為算法大家都會關(guān)注其時間和空間復雜度 O(n),基于雙向鏈表雙向指針域的優(yōu)勢,為了降級時間復雜度,因此
為了保證 LRU 新數(shù)據(jù)和緩存命中的數(shù)據(jù)都位于鏈表最前面(Header),緩存淘汰的時候刪除最后的結(jié)點(Tailer),又要避免數(shù)據(jù)查找時從頭到尾遍歷,降低算法的時間復雜度,同時基于雙向鏈表帶來的優(yōu)勢,可以改變個別數(shù)據(jù)結(jié)點的指針域從而達到鏈表數(shù)據(jù)的更新,如果提供 Header 和 Tailer 結(jié)點作為標識的話,可以使用頭插法快速增加結(jié)點,根據(jù) Tailer 結(jié)點也可以在緩存淘汰時快速更新鏈表的順序,避免遍歷從頭到尾遍歷,降低算法的時間復雜度。

排序示例

LRU 鏈表中有 [6,5,4,3,2,1] 6個數(shù)據(jù)結(jié)點,其中 6 所在的數(shù)據(jù)結(jié)點為 Header(頭部)結(jié)點,1 所在的數(shù)據(jù)結(jié)點為 Tailer(尾部)結(jié)點。如果此時數(shù)據(jù) 3 被訪問(緩存命中),3 應該被更新至鏈表頭,用數(shù)組的思維應該是刪除 3,但是如果我們利用雙向鏈表雙向指針的優(yōu)勢,可以快速的實現(xiàn)鏈表順便的更新:

  • 3 被刪除時,42 中間沒有其他結(jié)點,即 4next 指針域指向 2 所在的數(shù)據(jù)結(jié)點;同理,2proir 指針域指向 2 所在的數(shù)據(jù)結(jié)點。

HashMap

至于為什么使用 HashMap,用一句話來概括主要是因為 HashMap 通過 Key 獲取速度會快的多,降低算法的時間復雜度。

例如:

  • 我們在 get 緩存的時候從 HashMap 中獲取的時候基本上時間復雜度控制在 O(1),如果從鏈表中一次遍歷的話時間復雜度是 O(n)。
  • 我們訪問一個已經(jīng)存在的節(jié)點時候,需要將這個節(jié)點移動到 header 節(jié)點后,這個時候需要在鏈表中刪除這個節(jié)點,并重新在 header 后面新增一個節(jié)點。這個時候先去 HashMap 中獲取這個節(jié)點刪除節(jié)點關(guān)系,避免了從鏈表中遍歷,將時間復雜度從 O(N) 減少為 O(1)

由于前端沒有 HashMap 的相關(guān) API,我們可以使用 Object 或者 Map 來代替。

代碼實現(xiàn)

現(xiàn)在讓我們運用所掌握的數(shù)據(jù)結(jié)構(gòu),設計和實現(xiàn)一個,或者參考 LeeCode 146 題。

鏈表結(jié)點 Entry

export class Entry {    value: T    key: string | number    next: Entry    prev: Entry    constructor(val: T) {        this.value = val;    }}

雙向鏈表 Double Linked List

主要職責:

  • 管理頭部結(jié)點和尾部結(jié)點
  • 插入新數(shù)據(jù)時,將新數(shù)據(jù)移到頭部結(jié)點
  • 刪除數(shù)據(jù)時,更新刪除結(jié)點前后兩個結(jié)點的指向域
/*** Simple double linked list. Compared with array, it has O(1) remove operation.* @constructor*/export class LinkedList {    head: Entry    tail: Entry    private _len = 0    /**    * Insert a new value at the tail    */    insert(val: T): Entry {        const entry = new Entry(val);        this.insertEntry(entry);        return entry;    }    /**    * Insert an entry at the tail    */    insertEntry(entry: Entry) {        if (!this.head) {            this.head = this.tail = entry;        }        else {            this.tail.next = entry;            entry.prev = this.tail;            entry.next = null;            this.tail = entry;        }        this._len++;    }    /**    * Remove entry.    */    remove(entry: Entry) {        const prev = entry.prev;        const next = entry.next;        if (prev) {            prev.next = next;        }        else {            // Is head            this.head = next;        }        if (next) {            next.prev = prev;        }        else {            // Is tail            this.tail = prev;        }        entry.next = entry.prev = null;        this._len--;    }    /**    * Get length    */    len(): number {        return this._len;    }    /**    * Clear list    */    clear() {        this.head = this.tail = null;        this._len = 0;    }}

LRU 核心算法

主要職責:

  • 將數(shù)據(jù)添加到鏈表并更新鏈表順序
  • 緩存命中時更新鏈表的順序
  • 內(nèi)存溢出拋棄過時的鏈表數(shù)據(jù)
/*** LRU Cache*/export default class LRU {    private _list = new LinkedList()    private _maxSize = 10    private _lastRemovedEntry: Entry    private _map: Dictionary> = {}    constructor(maxSize: number) {        this._maxSize = maxSize;    }    /**    * @return Removed value    */    put(key: string | number, value: T): T {        const list = this._list;        const map = this._map;        let removed = null;        if (map[key] == null) {            const len = list.len();            // Reuse last removed entry            let entry = this._lastRemovedEntry;            if (len >= this._maxSize && len > 0) {                // Remove the least recently used                const leastUsedEntry = list.head;                list.remove(leastUsedEntry);                delete map[leastUsedEntry.key];                removed = leastUsedEntry.value;                this._lastRemovedEntry = leastUsedEntry;                }            if (entry) {                entry.value = value;            }            else {                entry = new Entry(value);            }            entry.key = key;            list.insertEntry(entry);            map[key] = entry;        }        return removed;    }    get(key: string | number): T {        const entry = this._map[key];        const list = this._list;        if (entry != null) {            // Put the latest used entry in the tail            if (entry !== list.tail) {                list.remove(entry);                list.insertEntry(entry);            }            return entry.value;        }    }    /**    * Clear the cache    */    clear() {        this._list.clear();        this._map = {};    }    len() {        return this._list.len();    }}

其他 LRU 算法

除了以上常見的 LRU 算法,隨著需求的復雜多樣,基于 LRU 的思想也衍生出了許多優(yōu)化算法,例如:

參考鏈接