摘要:底層實(shí)現(xiàn)是對象數(shù)組,優(yōu)點(diǎn)是時(shí)間為,缺點(diǎn)是和時(shí)間為,需要留意的是擴(kuò)容的過程以及的算法本節(jié)參考源碼中放最新的源碼為,組成鏈表或紅黑樹定義從整體上看,底層的存儲(chǔ)結(jié)構(gòu)是基于數(shù)組和鏈表實(shí)現(xiàn)的。實(shí)現(xiàn)了所謂的線程安全,在很多方法上都加上了。
ArrayList
ArrayList底層實(shí)現(xiàn)是對象數(shù)組,優(yōu)點(diǎn)是set、get時(shí)間為O(1),缺點(diǎn)是add和remove時(shí)間為O(n),需要留意的是擴(kuò)容的過程以及remove的算法
public class MyArrayList{ private static final int DEFAULT_CAPACITY = 10; Object[] elementData; int size; public int size(){ return size; } public boolean isEmpty(){ return size == 0; } public boolean contains(Object o){ return indexOf >= 0; } public E remove(int index){ rangeCheck(index); E oldValue = elementData[index]; int numMoved = size - index - 1; if(numMoved > 0){ System.copyarray(elementData, index + 1, elementData, index, numMoved); } elementData[--size] = null; return oldValue; } public boolean remove(Object o){ if(o == null){ for(int i = 0; i < size; i++){ fastRemove(i); return true; } }else{ for(int i = 0; i < size; i++){ fastRemove(i); return true; } } return false; } public void fastRemove(int index){ int numMoved = size - index - 1; if(numMoved > 0){ System.copyarray(elementData, index + 1, elementData, index, numMoved); } elementData[--size] = null; } public boolean add(E e){ ensureCapacity(size + 1); elementData[size++] = e; return true; } public E get(int index){ rangeCheck(index); return elementData[index]; } public E set(int index, E element){ rangeCheck(index); E oldValue = elementData[index]; elementData[index] = element; return oldValue; } public void ensureCapacity(int minCapacity){ minCapacity = Math.max(DEFAULT_CAPACITY, minCapacity); if(minCapacity - elementData.length > 0){ int oldCapacity = elementData.length; int newCapacity = oldCapacity + (oldCapacity >> 1); if (newCapacity - minCapacity < 0) newCapacity = minCapacity; if (newCapacity - MAX_ARRAY_SIZE > 0) newCapacity = hugeCapacity(minCapacity); // minCapacity is usually close to size, so this is a win: elementData = Arrays.copyOf(elementData, newCapacity); } private int hugeCapacity(int minCapacity){ if (minCapacity < 0) // overflow throw new OutOfMemoryError(); return (minCapacity > MAX_ARRAY_SIZE) ? Integer.MAX_VALUE : MAX_ARRAY_SIZE; } private void rangeCheck(int index) { if (index >= size) throw new IndexOutOfBoundsException(outOfBoundsMsg(index)); } private String outOfBoundsMsg(index){ return "Size:" + size + ", Index:" + index; } public int indexOf(Object o){ if(o == null){ for(int i = 0; i < size; i++){ if(elementData[i] == null){ return i; } } }else{ for(int i = 0; i < size; i++){ if(elementData[i].equals(o)){ return i; } } } return -1; } }
HashMap本節(jié)參考 jdk1.8 源碼
table中放Entry(最新的JDK源碼為Node),Entry組成鏈表或紅黑樹
Entry(Node定義)static class Nodeimplements Map.Entry { final int hash; final K key; V value; Node next; Node(int hash, K key, V value, Node next) { this.hash = hash; this.key = key; this.value = value; this.next = next; } }
從整體上看,HashMap底層的存儲(chǔ)結(jié)構(gòu)是基于數(shù)組和鏈表實(shí)現(xiàn)的。對于每一個(gè)要存入HashMap的鍵值對(Key-Value Pair),通過計(jì)算Key的hash值來決定存入哪個(gè)數(shù)組單元(bucket),為了處理hash沖突,每個(gè)數(shù)組單元實(shí)際上是一條Entry單鏈表的頭結(jié)點(diǎn),其后引申出一條單鏈表。
存取過程取值過程大致如下:先檢查table中的頭結(jié)點(diǎn),table中如果是樹,從樹中找;不然從鏈表中找
public V get(Object key){ Nodee; return (e = getNode(hash(key), key)) == null ? null : e.value; } final Node getNode(int hash, Object key){ Node [] tab; Node first, e; int n; K k; //桶中頭結(jié)點(diǎn)不為空,檢查頭結(jié)點(diǎn) if((tab = table) != null && (n = tab.length) > 0 && (first = tab[(n - 1) & hash]) != null){ if(first.hash == hash && ((k = first.key)) == key || (key != null && key.equals(k)))) return first; if((e = first.next) != null){ //如果為紅黑樹,按樹遍歷 if(first instanceof TreeNode) return ((treeNode ) first).getTreeNode(hash, key); do{ if(e.hash == hash && (k = e.key) == key || (key != null && key.equals(k))) return e; }while((e = e.next) != null); } } return null; }
添加鍵值對put(key,value)的過程:
1,判斷鍵值對數(shù)組tab[]是否為空或?yàn)閚ull,否則以默認(rèn)大小resize();
2,根據(jù)鍵值key計(jì)算hash值得到插入的數(shù)組索引i,如果tab[i]==null,直接新建節(jié)點(diǎn)添加,否則轉(zhuǎn)入3
3,判斷當(dāng)前數(shù)組中處理hash沖突的方式為鏈表還是紅黑樹(check第一個(gè)節(jié)點(diǎn)類型即可),分別處理
public V put(K key, V value) { return putVal(hash(key), key, value, false, true); } /** * Implements Map.put and related methods * * @param hash hash for key * @param key the key * @param value the value to put * @param onlyIfAbsent if true, don"t change existing value * @param evict if false, the table is in creation mode. * @return previous value, or null if none */ final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) { Node擴(kuò)容機(jī)制resize()[] tab; Node p; int n, i; if ((tab = table) == null || (n = tab.length) == 0) n = (tab = resize()).length; /*如果table的在(n-1)&hash的值是空,就新建一個(gè)節(jié)點(diǎn)插入在該位置*/ if ((p = tab[i = (n - 1) & hash]) == null) tab[i] = newNode(hash, key, value, null); /*表示有沖突,開始處理沖突*/ else { Node e; K k; /*檢查第一個(gè)Node,p是不是要找的值*/ if (p.hash == hash &&((k = p.key) == key || (key != null && key.equals(k)))) e = p; else if (p instanceof TreeNode) e = ((TreeNode )p).putTreeVal(this, tab, hash, key, value); else { for (int binCount = 0; ; ++binCount) { /*指針為空就掛在后面*/ if ((e = p.next) == null) { p.next = newNode(hash, key, value, null); //如果沖突的節(jié)點(diǎn)數(shù)已經(jīng)達(dá)到8個(gè),看是否需要改變沖突節(jié)點(diǎn)的存儲(chǔ)結(jié)構(gòu), //treeifyBin首先判斷當(dāng)前hashMap的長度,如果不足64,只進(jìn)行 //resize,擴(kuò)容table,如果達(dá)到64,那么將沖突的存儲(chǔ)結(jié)構(gòu)為紅黑樹 if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st treeifyBin(tab, hash); break; } /*如果有相同的key值就結(jié)束遍歷*/ if (e.hash == hash &&((k = e.key) == key || (key != null && key.equals(k)))) break; p = e; } } /*就是鏈表上有相同的key值*/ if (e != null) { // existing mapping for key,就是key的Value存在 V oldValue = e.value; if (!onlyIfAbsent || oldValue == null) e.value = value; afterNodeAccess(e); return oldValue;//返回存在的Value值 } } ++modCount; /*如果當(dāng)前大小大于門限,門限原本是初始容量*0.75*/ if (++size > threshold) resize();//擴(kuò)容兩倍 afterNodeInsertion(evict); return null; }
構(gòu)造hash表時(shí),如果不指明初始大小,默認(rèn)大小為16(即Node數(shù)組大小16),如果Node[]數(shù)組中的元素達(dá)到(填充比*Node.length)重新調(diào)整HashMap大小 變?yōu)樵瓉?倍大小,擴(kuò)容很耗時(shí),需要重新計(jì)算bucket的位置。
為什么通過計(jì)算h & (length-1)來獲得bucket的位置,而不是通過計(jì)算h % length?
實(shí)際上,在HashMap中,h & (length-1) == h % length,但是需要一個(gè)前提:length必須滿足是2的冪。這也正是在解釋DEFAULT_INITIAL_CAPACITY和HashMap構(gòu)造方法時(shí)強(qiáng)調(diào)的HashMap的bucket容量必須是2的冪。當(dāng)length是2的冪,那么length的二進(jìn)制數(shù)可以表示為1000...000,因此length - 1的二進(jìn)制數(shù)為0111...111,當(dāng)h與length - 1位與時(shí),除了h的最高位的被修改為0,其余位均保持不變,這也正是實(shí)現(xiàn)了h % length的效果。只是相比于h % length,h & (length-1)的效率會(huì)更高。
HashMap的bucket容量必須為2的冪的另一個(gè)重要原因是一旦滿足此條件,那么length即為偶數(shù),length - 1便為奇數(shù),所以length - 1的最后一位必為1。因此,h & (length - 1)得到的值既可能是奇數(shù),也可能是偶數(shù),這確保了散列的均勻性。如果length - 1是偶數(shù),那么h & (length - 1)得到的值必為偶數(shù),那么HashMap的空間便浪費(fèi)了一半。
final NodeHashMap的總結(jié)[] resize() { Node [] oldTab = table; int oldCap = (oldTab == null) ? 0 : oldTab.length; int oldThr = threshold; int newCap, newThr = 0; /*如果舊表的長度不是空*/ if (oldCap > 0) { if (oldCap >= MAXIMUM_CAPACITY) { threshold = Integer.MAX_VALUE; return oldTab; } /*把新表的長度設(shè)置為舊表長度的兩倍,newCap=2*oldCap*/ else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) /*把新表的門限設(shè)置為舊表門限的兩倍,newThr=oldThr*2*/ newThr = oldThr << 1; // double threshold } /*如果舊表的長度的是0,就是說第一次初始化表*/ else if (oldThr > 0) // initial capacity was placed in threshold newCap = oldThr; else { // zero initial threshold signifies using defaults newCap = DEFAULT_INITIAL_CAPACITY; newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); } if (newThr == 0) { float ft = (float)newCap * loadFactor;//新表長度乘以加載因子 newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } threshold = newThr; @SuppressWarnings({"rawtypes","unchecked"}) /*下面開始構(gòu)造新表,初始化表中的數(shù)據(jù)*/ Node [] newTab = (Node [])new Node[newCap]; table = newTab;//把新表賦值給table if (oldTab != null) {//原表不是空要把原表中數(shù)據(jù)移動(dòng)到新表中 /*遍歷原來的舊表*/ for (int j = 0; j < oldCap; ++j) { Node e; if ((e = oldTab[j]) != null) { oldTab[j] = null; if (e.next == null)//說明這個(gè)node沒有鏈表直接放在新表的e.hash & (newCap - 1)位置 newTab[e.hash & (newCap - 1)] = e; else if (e instanceof TreeNode) ((TreeNode )e).split(this, newTab, j, oldCap); /*如果e后邊有鏈表,到這里表示e后面帶著個(gè)單鏈表,需要遍歷單鏈表,將每個(gè)結(jié)點(diǎn)重*/ else { // preserve order保證順序 ////新計(jì)算在新表的位置,并進(jìn)行搬運(yùn) Node loHead = null, loTail = null; Node hiHead = null, hiTail = null; Node next; do { next = e.next;//記錄下一個(gè)結(jié)點(diǎn) //新表是舊表的兩倍容量,實(shí)例上就把單鏈表拆分為兩隊(duì), //e.hash&oldCap為偶數(shù)一隊(duì),e.hash&oldCap為奇數(shù)一對 if ((e.hash & oldCap) == 0) { if (loTail == null) loHead = e; else loTail.next = e; loTail = e; } else { if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); if (loTail != null) {//lo隊(duì)不為null,放在新表原位置 loTail.next = null; newTab[j] = loHead; } if (hiTail != null) {//hi隊(duì)不為null,放在新表j+oldCap位置 hiTail.next = null; newTab[j + oldCap] = hiHead; } } } } } return newTab; }
本節(jié)參考
HashMap的默認(rèn)大小為16,即桶數(shù)組的默認(rèn)長度為16;
HashMap的默認(rèn)裝載因子是0.75;
HashMap內(nèi)部的桶數(shù)組存儲(chǔ)的是Entry對象,也就是鍵值對對象。
構(gòu)造器支持指定初始容量和裝載因子,為避免數(shù)組擴(kuò)容帶來的性能問題,建議根據(jù)需求指定初始容量。裝載因子盡量不要修改,0.75是個(gè)比較靠譜的值。
桶數(shù)組的長度始終是2的整數(shù)次方(大于等于指定的初始容量),這樣做可以減少?zèng)_突概率,提高查找效率。(可以從indexfor函數(shù)中看出,h&(length-1),若length為奇數(shù),length-1為偶數(shù)那么h&(length-1)結(jié)果的最后一位必然為0,也就是說所有鍵都被散列到數(shù)組的偶數(shù)下標(biāo)位置,這樣會(huì)浪費(fèi)近一半空間。另外,length為2的整數(shù)次方也保證了h&(length-1)與h%length等效).
HashMap接受null鍵;
HashMap不允許鍵重復(fù),但是值是可以重復(fù)的。若鍵重復(fù),那么新值會(huì)覆蓋舊值。
HashMap通過鏈表法解決沖突問題,每個(gè)Entry都有一個(gè)next指針指向下一個(gè)Entry,沖突元素(不是鍵相同,而是hash值相同)會(huì)構(gòu)成一個(gè)鏈表。并且最新插入的鍵值對始終位于鏈表首部。
當(dāng)容量超過閾值(threshold)時(shí),會(huì)發(fā)生擴(kuò)容,擴(kuò)容后的數(shù)組是原數(shù)組的兩倍。擴(kuò)容操作需要開辟新數(shù)組,并對原數(shù)組中所有鍵值對重新散列,非常耗時(shí)。我們應(yīng)該盡量避免HashMap擴(kuò)容。
HashMap非線程安全。
線程安全與HashTableHashMap是一個(gè)非線程安全的,因此適合運(yùn)用在單線程環(huán)境下。如果是在多線程環(huán)境,可以通過Collections的靜態(tài)方法synchronizedMap獲得線程安全的HashMap,如下代碼所示。
Map
HashTable和HashMap底層采用相同的存儲(chǔ)結(jié)構(gòu),在很多方法的實(shí)現(xiàn)上二者的思路基本一致。最主要的區(qū)別主要有兩點(diǎn)。
HashTable實(shí)現(xiàn)了所謂的線程安全,在HashTable很多方法上都加上了synchronized。
在HashMap的分析中,我們發(fā)現(xiàn)當(dāng)我們新增鍵值對時(shí),HashMap是允許Key和Value均為null。但是HashTable不允許Key或Value為null,關(guān)于這一點(diǎn)我們可以通過查看HashTable源碼得知。
public synchronized V put(K key, V value) { // Make sure the value is not null if (value == null) { // 若value為空則拋出NullPointerException。 throw new NullPointerException(); } // Makes sure the key is not already in the hashtable. Entry,?> tab[] = table; int hash = key.hashCode(); // 若key為空則拋出NullPointerException。 int index = (hash & 0x7FFFFFFF) % tab.length; @SuppressWarnings("unchecked") Entry關(guān)于HashSetentry = (Entry )tab[index]; for(; entry != null ; entry = entry.next) { if ((entry.hash == hash) && entry.key.equals(key)) { V old = entry.value; entry.value = value; return old; } } addEntry(hash, key, value, index); return null; }
HashSet基于HashMap實(shí)現(xiàn);而Map是鍵值對形式的,因此構(gòu)造一個(gè)PRESENT假裝為值。
private static final Object PRESENT = new Object();
另外,
HashSet無序;允許值為null;非線程安全;底層增刪等操作基于HashMap實(shí)現(xiàn);
LinkedHashSet有序;允許值為null;非線程安全;依賴于HashSet,底層增刪等操作基于LinkedHashMap實(shí)現(xiàn);
TreeSet有序;不允許為null;非線程安全;底層增刪等操作基于TreeMap實(shí)現(xiàn)。
本節(jié)參考 https://segmentfault.com/a/11...
http://blog.csdn.net/tuke_tuk...
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/70147.html
摘要:正確做法是給加索引,還有聯(lián)合索引,并不能避免全表掃描。 前言:有收獲的話請加顆小星星,沒有收獲的話可以 反對 沒有幫助 舉報(bào)三連 有心的同學(xué)應(yīng)該會(huì)看到我這個(gè)noteBook下面的其它知識,希望對你們有些許幫助。 本文地址 時(shí)間點(diǎn):2017-11 一個(gè)16年畢業(yè)生所經(jīng)歷的php面試 一、什么是面試 二、面試準(zhǔn)備 1. 問:什么時(shí)候開始準(zhǔn)備? 2. 問:怎么準(zhǔn)備? 三、面試...
摘要:我覺得了解簡歷和面試的技巧可以幫助你更好的去學(xué)習(xí)重要的知識點(diǎn)以及更好地去準(zhǔn)備面試以及面試,說實(shí)話,我個(gè)人覺得這些東西還挺重要的。在本文里,我將介紹我這段時(shí)間里更新簡歷和面試的相關(guān)經(jīng)歷。 分享一篇很不錯(cuò)的文章!本文作者曾經(jīng)寫過《Java Web輕量級開發(fā)面試教程》和 《Java核心技術(shù)及面試指南》這兩本書。我覺得了解簡歷和面試的技巧可以幫助你更好的去學(xué)習(xí)重要的知識點(diǎn)以及更好地去準(zhǔn)備面試以...
摘要:把準(zhǔn)備過程紀(jì)錄下來,共勉。線性查找二分查找二分查找英語,也稱折半查找英語對數(shù)查找英語,是一種在有序數(shù)組中查找某一特定元素的搜索算法。 寫在最前面 導(dǎo)師貪腐出逃美國,兩年未歸,可憐了我。拿了小米和美團(tuán)的offer,要被延期,offer失效,工作重新找。把準(zhǔn)備過程紀(jì)錄下來,共勉。 線性查找 public static int search(int[] data, int target) {...
摘要:但是,實(shí)際中無法保證達(dá)到讓步目的,因?yàn)樽尣降木€程還有可能被線程調(diào)度程序再次選中。在大多數(shù)情況下,將導(dǎo)致線程從運(yùn)行狀態(tài)轉(zhuǎn)到可運(yùn)行狀態(tài),但有可能沒有效果。 多線程編程 線程狀態(tài)圖 總是無法上傳,稍后上傳 常用函數(shù) 狀態(tài)轉(zhuǎn)換 運(yùn)行中->阻塞 sleep(long millis) 在指定的毫秒數(shù)內(nèi)讓當(dāng)前正在執(zhí)行的線程休眠 join() 等待t線程終止 使用方式 Thread t =...
摘要:和三個(gè)方法的時(shí)間復(fù)雜度必須為兩種解法,解法一,將最小值存入自有的數(shù)據(jù)結(jié)構(gòu)中,如下所示原本的值最小值解法二,用兩個(gè)棧 堆棧和隊(duì)列統(tǒng)稱線性表 簡單的線性結(jié)構(gòu) 數(shù)組和鏈表可以實(shí)現(xiàn)這兩種數(shù)據(jù)結(jié)構(gòu) 堆棧 基本理解 DFS 深度優(yōu)先---按深度遍歷 遞歸轉(zhuǎn)非遞歸 隊(duì)列 基本理解 BFS 廣度優(yōu)先---按層序遍歷 出入棧的合法性模擬出入棧的過程,不是入棧,就是...
閱讀 3243·2021-11-23 09:51
閱讀 2498·2021-09-27 13:34
閱讀 2482·2021-09-08 09:45
閱讀 679·2019-08-30 15:44
閱讀 3506·2019-08-29 12:17
閱讀 2771·2019-08-26 12:18
閱讀 2637·2019-08-26 10:10
閱讀 3090·2019-08-23 18:02