摘要:算法的運行時間用大表示法表示。事實上還有另一種算法即也就是階乘算法。五選擇排序算法在理解選擇排序算法的原理之前,我們需要了解大表示法,數(shù)組與鏈表等概念。這種辦法,我們暫且稱之為預(yù)留座位。
一.算法的定義
任何代碼片段都可以被稱作是算法,這也就是說算法其實就是完成一組任務(wù)的指令.算法的優(yōu)點在于要么速度很快,要么解決一些很有趣的問題,要么兼而有之.并且算法可以應(yīng)用于任何編程語言中.
二.什么人適合學算法學算法的人必須要懂得一定的數(shù)學知識,具體點就是線性代數(shù)的知識.只要你能做出這樣一道題,那么恭喜你,可以學算法.
f(x) = x * 10;f(5) = ?;三.二分查找
假設(shè)存在一個有序列表,比如1,2,3...100.如果我要你猜測我心中所想的數(shù)字是這個有序列表中的哪個數(shù)字,你會怎么猜呢?
最簡單的辦法就是從1到100挨著猜,這樣一算,那么很明顯,假如我想的是數(shù)字100,你有可能就要猜100次.如此一來,豈不是很浪費時間.
那么,同樣的道理,如果在一行有100個字符的字符串中查找某個字母,你是不是也要查找100次呢?
其實有更快速的辦法,就第一個例子而言,試想,如果我們第一次就把100拆一半,也就是50,然后猜測50,根據(jù)我的回答來做下一步的確定.也許我回答小了,那么猜測的范圍就會在50到100之間了,如果是大了,那么猜測的范圍也就到了1到50之間,依次類推,我們把每次猜測都分成一半,即100 -> 50 -> 25 -> 13->7->4->2->1,如此一來,我們最多猜7次就能猜中我心中想的數(shù)字.
像這樣的把元素分一半來查找就叫二分查找.而通過二分查找實現(xiàn)的算法就叫二分算法,簡稱二分法.
一般地,我們把包含n個元素的列表,用二分查找最多需要log2^n步.
也許你可能不記得對數(shù)的概念了,但你應(yīng)該記得冪的概念.而對數(shù)log10^100相當于將多少個10的乘積結(jié)果為100.答案自然是2個,即10*10=100.因此log10^100 = 2;
總的來說,對數(shù)就是冪運算的逆運算.
僅當列表有序的時候,我們才可以用二分法來進行查找嗎?那倒不一定,其實我們可以將這些列表的元素存儲在一個數(shù)組中,就好像,我們把一個東西放在桶里一樣,然后給這些桶標上順序,而順序則是從0開始編號的,第一個桶是0,第二個桶是1,依次類推.
比如有這樣一個有序數(shù)組[1,2,3...100];我想要查找75這個數(shù)字的索引,很明顯75這個數(shù)字對應(yīng)的索引就是74.我們可以使用二分法編寫代碼,如下(這里以JavaScript代碼為例,其它語言的代碼也可以的):
var arr = []; for(var i = 1;i <= 100;i++){ arr.push(i); } var checknum = 75; //定義第一個索引與最后一個索引 var low = 0; var high = arr.length - 1; //我們查找數(shù)字只能在兩者之間查找,使用循環(huán),只要范圍沒有縮小到只剩一個元素,都可以繼續(xù)使用二分法拆成一半來查找 while(low <= high){ //索引取一半,如果不是整數(shù)則向下取整 var center = Math.floor((low + high) / 2); //最終結(jié)果一定是索引所對應(yīng)的元素 var result = arr[center]; //判斷結(jié)果是否等于想要的結(jié)果 if(result === checknum ){ console.log(center); }else if(result < checknum){ //如果取得索引對應(yīng)元素值小于猜的值,則修改最低索引的值,以縮小猜測范圍 low = center + 1; }else if(result > checknum){ //如果取得索引對應(yīng)元素值大于猜的值,則修改最大索引的值,以縮小猜測范圍 high = center - 1; }else{ console.log(null); } }
得出最終結(jié)果就是74.
我以如下圖來展示上例代碼的算法:
如此一來,我們還可以封裝成一個函數(shù),參數(shù)為數(shù)組和數(shù)組元素對應(yīng)的值.如下:
function getArrIndex(arr,result){ var low = 0,high = arr.length - 1,center = Math.floor((low + high) / 2); while(low <= high){ if(arr[center] === result){ return center; }else if(arr[center] < result){ low = center + 1; }else if(arr[center] > result){ high = center - 1; }else{ return "沒有這個索引值"; } } } //測試 getArrIndex([1,4,6,8,10],6);//2四.大O表示法
在前面,我總結(jié)到二分算法,并且在二分算法中也提到過運行時間.一般說來,我們在寫程序時都會選擇效率最高的算法,以最大限度的減少運行時間或者占用空間.
前面二分算法中說到,如果挨著簡單的查找從1到100的列表,最多需要猜測100次,如果列表的長度更大呢?比如是1億,那我們就要猜測1億次.換句話說,最多需要猜測的次數(shù)與列表長度相同,這樣所用到的時間,我們稱之為線性時間.
而二分查找則不同,100次我們僅需猜測log2^100 ≈ 7次.而如果是1億,我們也只需猜測log2^100000000 ≈ 26次.這樣通過二分查找所需要的時間,我們稱之為對數(shù)時間.
我們可以利用一種特殊的表示法來表示這種運行時間,即大O表示法.大O表示法指出算法的速度有多快.
在了解什么是大O表示法之前,我們先來看一個例子:
假設(shè)有100個元素的列表,我們使用二分查找大約需要7次(因為log2^100≈7),如果每一次大約為1毫秒.二分查找就需要7毫秒,而簡單查找呢?簡單查找就需要100毫秒,大約是二分查找的15倍左右.
那么假如有1億個元素的列表呢,使用簡單查找就是大約1億毫秒,而二分查找則需要26毫秒(log2^100000000)左右就可以了.如此一來,簡單查找比二分查找慢的多,而且簡單查找足足是二分查找的將近400萬倍.
這說明一個什么問題呢?
這說明算法的運行時間是以不同的速度增加的,也就是說隨著元素的增多,二分查找所需要的額外時間并不多,而簡單查找卻要多很多.我們把這種情況稱之為增速.僅僅知道算法的運行時間是不行的,我們還需要知道運行時間隨著列表的增加而增加,即增速,大O表示法的用武之地就在于此.
一般的,擁有n個列表,簡單查找需要執(zhí)行n次操作,我們用大O表示法表示為O(n).當然單位不一定是毫秒或者秒,大O表示法也就指出了算法的增速.而使用二分查找,我們可以表示為O(log2^n).
再比如一個示例:假設(shè)我們要畫一個16X16的網(wǎng)格圖,簡單查找就是一個一個的畫,結(jié)果需要畫256次.而如果我們把一張紙對折,再對折,再對折,再對折,每對折一次,格子數(shù)就會增加,對折一次畫一次,如此一來,頂多需要log2^256,也就是8次就可以畫出來.
我們用大O表示法,就可以表示成:簡單查找為O(n)的運行時間,而O(log2^n)則是二分查找所需時間.
大O表示法指出了最糟情況下的時間.什么意思呢?再看一個示例:
如果你要在一本書中使用簡單查找查找一篇文章,所需要的時間就是O(n).這意味著在最糟糕的情況下,必須查找一本書中的每一頁.如果要查找的文章剛好在第一頁,一次就能找到,那么請問簡單查找的運行時間是O(1)還是O(n)呢?
答案自然是O(n)呢.因為大O表示法指出了最糟糕情況下的運行時間.如果只用1次就能翻到,那這是最佳情況.
從這些案例當中,我們得出了如下結(jié)論:
1.算法的速度指的并非時間,而是增速。
2.談?wù)撍惴ǖ乃俣葧r,我們應(yīng)該說的是隨著速度的增加,運行時間將以什么樣的速度增加。
3.算法的運行時間用大O表示法表示。
4.O(log2^n)比O(n)快,當搜索的元素越多,前者快的越多。
事實上,還有另一種算法.即O(!n).也就是階乘算法。來看一個案例:假如一個人要去4個城市旅行,并且還要確保旅程最短.利用排列與組合的知識得出,前往4個城市大約需要執(zhí)行24次操作,而如果是5個城市,則大約需要執(zhí)行120次操作.也就是說隨著城市的增加,大約需要執(zhí)行!n次操作.雖然這確實是一種算法,但這種算法很糟糕。
五.選擇排序算法在理解選擇排序算法的原理之前,我們需要了解大O表示法,數(shù)組與鏈表等概念。
經(jīng)常與計算機接觸,相信都會聽到內(nèi)存這一個詞,那么何為內(nèi)存呢?我們用一個很形象的比喻來說明這個問題。
假設(shè)有一個柜子,柜子有很多抽屜,每個抽屜能放一些東西。也就是說,當我們往抽屜里放東西的時候,柜子就保存了這些東西。一個東西放一個抽屜,兩個東西放兩個抽屜。計算機內(nèi)存的工作原理就如此,計算機的內(nèi)存更像是許多抽屜的集合。
需要將數(shù)據(jù)存儲到計算機中,你會請求計算機提供存儲空間,然后計算機就會給你一個存儲地址。在存儲多項數(shù)據(jù)的時候,有兩種數(shù)據(jù)結(jié)構(gòu),計算機可以存儲,那便是數(shù)組和鏈表。
數(shù)組就是一系列元素的列表集合。比如,你要寫一個待辦事項的應(yīng)用程序(前端術(shù)語也可以說是todolist)。那么你就需要將許多待辦事項存儲到內(nèi)存中。使用數(shù)組意味著內(nèi)存是緊密相連的,為何如此說呢?
數(shù)組的元素自帶編號,每個元素的位置,我們也叫做索引。例如:
[10,20,30,40]這一個數(shù)組,元素20的索引或者說所處的位置是1。因為數(shù)組的編號都是從0開始的,這可能會讓很多新手程序員搞不明白。幾乎所有編程語言對數(shù)組的編號都是從0開始的,絕對不止JavaScript這一門語言。
假設(shè),你要為以上[10,20,30,40]再添加一個元素,很明顯,利用JavaScript提供的數(shù)組方法,你只能在之前或者最末又或者中間插入元素。但在內(nèi)存中卻不是這樣。還是用一個比喻來說明。
相信每個人都有看電影的經(jīng)歷,試想當你到了電影院之后,找到地方之后就坐下,然后你的朋友來了,本想靠著你坐,但是靠著你的位置都被人占領(lǐng)了。你的朋友就不得不轉(zhuǎn)移位置,在計算機中,請求計算機重新分配一個內(nèi)存,然后才能轉(zhuǎn)移到另一個位置。如此一來,添加新元素的速度就會很慢。
那么,有沒有辦法解決呢?
似乎,很多人都這樣做過,由一個人占領(lǐng)位置之后,然后把旁邊的預(yù)留座位也給占領(lǐng),不僅僅是在電影中,在公交車上搶座位也是如此。這種辦法,我們暫且稱之為"預(yù)留座位"。
這在計算機中也同樣適用。我們在第一次請求計算機分配內(nèi)存的時候,就請求計算機分配一些空余的內(nèi)存,也就是"預(yù)留座位"出來。假定有20個"預(yù)留座位",這似乎是一個不錯的措施。但你應(yīng)該明白,這個措施,也存在缺點:
你額外請求的位置有可能根本就用不上,還將浪費內(nèi)存。比如你選了座位,結(jié)果你的朋友沒有來,其他人也不知道你的朋友不會來,也就不會坐上去,那么這個座位就空下來了。
如果來的人超過了20個之后,你預(yù)留的座位又不夠,這就不得不繼續(xù)重新請求轉(zhuǎn)移。
針對這種問題,我們可以使用鏈表來解決。
鏈表也是一種數(shù)據(jù)結(jié)構(gòu),鏈表中的元素可存儲在內(nèi)存的任何地方。并且鏈表中 每一個元素都存儲了下一個元素的地址,從而使一系列隨機的內(nèi)存串聯(lián)在一起。
這就好像一個掃雷游戲,當你掃中一個,這個就會提醒你的四周格子有沒有地雷,從而好作判斷,讓你是否選擇點擊下一個格子。因此,在鏈表中添加一個元素很容易:只需要將元素放入內(nèi)存,并將這個元素的內(nèi)存存儲地址放到前一個元素中。
而且,使用鏈表還不用移動元素。因為只要有足夠的內(nèi)存空間,計算機就能為鏈表分配內(nèi)存。比如如果你要為數(shù)組分配100個位置,內(nèi)存也僅有100個位置,但元素不能緊靠在一起,在這樣的條件下,我們是無法為數(shù)組分配內(nèi)存的,但鏈表卻可以。
鏈表好像自動就會說,“好吧,我們分開來坐這些位置”。
但鏈表也并非沒有缺點。我們再做一個比喻:
假如你看完了一本小說的第一章覺得第一章不好看,想跳過幾章去看,但并沒有這樣的操作,因為一般都是下一章下一章的看的,這意味著你要看第五十章,就要點下一章49次,這樣真的很煩。(點目錄不算)
鏈表也正是存在這一個問題,你在讀取鏈表的最后一個元素時,你需要先讀取上一個元素的存儲地址,然后根據(jù)上一個元素的地址來讀取最后這個元素。如果你是讀取所有的元素,那么鏈表確實效率很高,但如果你是跳躍著讀取呢?鏈表效率就會很低。
這也正是鏈表的缺點所在。但數(shù)組就不同,因為數(shù)組有編號,意味著你知道數(shù)組每個元素的內(nèi)存地址,你只需要執(zhí)行簡單的數(shù)學運算就能推算出某個元素的位置。
利用大O表示法,我們可以表示將數(shù)組和鏈表的運行時間表示出來,如下:
數(shù)組 鏈表 讀取: O(1) O(n) 插入: O(n) O(1)
其中O(1)稱作常量時間,O(n)則是線性時間。
如果你要刪除元素呢?鏈表顯然也是更好的選擇,因為你只需要修改前一個元素指向的地址即可。
那么問題來了,數(shù)組與鏈表究竟哪種數(shù)據(jù)結(jié)構(gòu)用的最多呢?
要看情況。但數(shù)組顯然用的更多,因為數(shù)組支持隨機訪問。元素的訪問有兩種方式:順序訪問與隨機訪問。順序訪問意味著 你需要挨著順序一個一個的訪問元素,而隨機訪問則不必如此。因為數(shù)組有編號,所以在隨機訪問上,數(shù)組更能體現(xiàn)它的優(yōu)勢。
有了前面的知識,現(xiàn)在,咱們來學習選擇排序算法吧!
假設(shè)你的計算機存儲了一些視頻,對于每個視頻的播放次數(shù),你都做了記錄,比如:
視頻1:50
視頻2:35
視頻3:25
視頻4:55
視頻5:60
現(xiàn)在,你要做的就是將播放次數(shù)從少到多按順序排列出來。該如何做呢?
首先,你肯定需要遍歷這個列表,找出播放次數(shù)最少的,然后添加到新的一個列表中去,并將這個添加的元素在原來列表中刪除,然后,你再次這樣做,將播放次數(shù)第二少的找出來,依次類推……
最后,你就會得到一個有序列表
視頻3:25
視頻2:35
視頻1:50
視頻4:55
視頻5:60
編寫代碼如下:
//用一個數(shù)組表示播放次數(shù)即可 var arr = [50,35,25,55,60]; // 編寫一個函數(shù),參數(shù)傳入排序的數(shù)組 function selectSort(arr){ //獲取傳入數(shù)組的長度 var len = arr.length; //定義最小索引與數(shù)組每一項元素變量 var minIndex,ele; for(var i = 0;i < len;i++){ //最小索引等于當前i值,相當于初始化值 minIndex = i; //初始化每一項 ele= arr[i]; for(var j = i + 1;j < len;j++){ //獲取相鄰數(shù),比較大小,得到最小數(shù)索引 if(arr[j] < arr[minIndex]){ minIndex = j; } } //將得到的最小數(shù)排列在最前面 arr[i] = arr[minIndex]; //與最小數(shù)做比較的值放在最小數(shù)所處的位置 arr[minIndex] = ele; } return arr; } //測試: selectSort(arr);//[25,35,50,55,60]
下面我們來測試一下代碼運行時間。對每個元素進行查找時,意味著每個元素都要查找一次,所以運行時間為O(n),需要找出最小元素,又要檢查每個元素,這意味著又要O(n)的運行時間。因此需要的總時間為O(nxn)=O(n^2)。這也就是說,需要執(zhí)行n次操作。
選擇排序只是一種很靈巧的算法,但還稱不上速度最快,速度最快的是快速排序法。
六.遞歸算法JavaScript遞歸一直讓許多開發(fā)者又愛又恨,因為它很有趣但也很難.最經(jīng)典的莫過于一個階乘函數(shù)呢,如下:
function fn(num){ if(num <= 1){ num = 1; }else{ num = num * fn(num - 1); } return num; } fn(5);//5*4*3*2*1= 120
面對如上的一個結(jié)果,許多開發(fā)者不免疑惑,為何會是這樣的結(jié)果.這個咱們暫且不解釋,咱們先來用一個生活中常見的例子來分析:
假設(shè)有一個盒子,盒子里面又包含盒子,盒子里面再包含盒子,一直包含n個盒子,那第n個盒子中有一本書.如果讓你找到這本書,你會如何查找?
以下是一個示意方法:
首先是定義一個盒子:
var box = { box:{ box:{ box:{ ...... } } } }
其次只要盒子不空,我們就取出一個盒子,如下:
if(box !== {}){ box = box.box; }
現(xiàn)在,咱們再來做判斷,如果取出的盒子里面存在書,那么說明已經(jīng)找到了,不必在繼續(xù)取盒子,即:
//假定書變量 var book = "book"; if(box !== {}){ box = box.box; if(box === book){ console.log("已經(jīng)找到了")! }else{ box = box.box.box; //...... } }
可如果不是書,那么就繼續(xù)取盒子,即如上的else代碼塊中的語句.
通常,咱們可以用一個循環(huán)來完成這樣的操作,如下:
var box = { // ...... } var book = "book"; for(var key in box){ if(box !== {}){ box = box[key]; if(box[key] === book){ console.log("已經(jīng)找到了"); }else{ box[key] = box[key][key] //...... } } }
但似乎這樣做有很大的缺點,因為一旦涉及到最里面層數(shù)太多,則需要循環(huán)n次.這不太合適,結(jié)果會取決于循環(huán).因此,我們可以定義一個函數(shù),然后為函數(shù)傳參,反復(fù)的讓函數(shù)自己調(diào)用自己,這樣,結(jié)果就取決于程序而不是循環(huán)了.如下:
//傳入box對象 var box = { //...... } var book = "book"; function checkOutBook(box){ //遍歷box對象 for(var key in box){ if(box !== {}){ if(box[key] === book){ console.log("找到了"); }else{ //反復(fù)調(diào)用函數(shù),直到找到書為止 box = checkOutBook(box[key]); } } } }
如此一來,遞歸的原理我們就能清楚了,遞歸就是層層遞進,反復(fù)的調(diào)用自己,就拿函數(shù)來說,就是反復(fù)的調(diào)用自己,直到條件不滿足時,則遞歸停止.
現(xiàn)在,咱們再來分析以上的階乘函數(shù):
函數(shù)需要傳入一個數(shù)值參數(shù),然后我們對這個參數(shù)做判斷,如果這個參數(shù)小于等于1,則讓這個參數(shù)等于1.如果不滿足,則執(zhí)行這個參數(shù),等于這個參數(shù)與這個參數(shù)減1的乘積.
fn(5) => 這意味著num = 5=>num=5 <= 1 (條件不成立) => num = 5 * fn(4) => num = 4 => num = 4 <= 1(條件不成立) => num = 5 * 4 * fn(3) => num = 3 => num = 3 <= 1(條件不成立) => num = 5 * 4 * 3 * fn(2) => num = 2 => num=2 <= 1(條件不成立) => num = 5 * 4 * 3 * 2 * fn(1) => num = 1 => num = 1 <= 1(條件成立) => num = 1 => 最終結(jié)果就是num = 5 * 4 * 3 * 2 * 1 = 120;
結(jié)合最后return語句返回num,則不難得出結(jié)果.我們嘗試用循環(huán)來完成階乘:
function fn(num){ var i = 0,result = 1; while(i < num){ if(i <= 1){ i = 1; }else{ result *= i; } } return result; } fn(5);//120
就性能上而言,遞歸并不比循環(huán)好,但遞歸勝在比循環(huán)更好理解.也就是說遞歸更容易讓程序被人理解.
遞歸函數(shù)有什么特點呢?
我們來看一個遞歸函數(shù):
function fn(){ var i = 10; console.log(i); fn(i - 1); }
運行如上的函數(shù),你會發(fā)現(xiàn)程序會一直無限循環(huán)下去,直到死機都還會運行.因此,在編寫遞歸算法的時候,我們要告訴程序何時停止遞歸.
遞歸有兩個條件:基線條件和遞歸條件.遞歸條件指的就是函數(shù)調(diào)用自己,而基線條件則指的是停止遞歸的條件,如函數(shù)不再調(diào)用自己.
比如:
function fn(){ var i = 10; console.log(i); //基線條件 if(i <= 1){ i = 1; }else{ //遞歸條件 fn(i - 1); } }
棧:棧是一種數(shù)據(jù)結(jié)構(gòu),前面講到數(shù)組和鏈表的時候,曾說過,元素的插入,刪除和讀取.其中插入也被稱作是壓入,刪除和讀取也被叫做彈出.而這種能夠插入并能夠刪除和讀取的數(shù)據(jù)結(jié)構(gòu)就叫棧.也就是說數(shù)組是一種棧,鏈表也是一種棧.
就拿如上的示例來說:
function fn(){ var i = 10; console.log(i); //基線條件 if(i <= 1){ i = 1; }else{ //遞歸條件 fn(i - 1); } }
變量i被分的一塊內(nèi)存,當每次調(diào)用函數(shù)fn()的時候,而每次i都會減一,這也意味著每次都會分的一塊內(nèi)存.計算機用一個棧來表示這些內(nèi)存,或者也可以說是內(nèi)存塊.當調(diào)用另一個函數(shù)的時候,當前函數(shù)就已經(jīng)運行完成或者處于暫停狀態(tài).
棧被用于存儲多個函數(shù)變量,也被叫做調(diào)用棧.雖然我們不必跟蹤內(nèi)存塊,由于棧已經(jīng)幫我們做了.再來看一個簡單的示例:
function greet(){ console.log("hello"); } greet(); function bye(){ console.log("bye"); } bye();
首先調(diào)用函數(shù)greet(),后臺就會創(chuàng)建一個變量對象,打印出"hello"字符串,此時棧被調(diào)用.也存儲了一個變量對象,相當于該字符串被分了一塊內(nèi)存.緊接著調(diào)用bye()函數(shù),也被分配了一個內(nèi)存.
雖然使用棧很方便,但也有缺點,那就是不要使用棧存儲太多的信息,因為這可能會占用你電腦很多內(nèi)存.
七.快速排序算法算法中有一個重要的思想,那就是分而治之(D&C,divide and conquer),這是一種著名的遞歸式問題解決方法。
理解分而治之,意味著你將進入算法的核心。快速排序算法是這個思想當中第一個重要的算法。
我們舉一個示例來說明這個思想。
假設(shè)要將一個長為1000,寬為800的矩形分成均勻的正方形,并保證這些正方形盡可能的大。
我們應(yīng)該如何做呢?
我們可以使用D&C策略來實現(xiàn),D&C算法是遞歸的。要解決這個問題,我們需要將過程分為兩個步驟。如下:
找出D&C算法的基線條件,條件要盡可能的簡單。
不斷將問題分解,直到滿足基線條件為止。
我們知道如果將長1000,寬800的長方形分成最大的正方形應(yīng)該是800x800。然后余下200X800的長方形。按照相同的分法,我們又可以將其分為200X200正方形與200X600的長方形,然后再分為200X200與200X400的正方形與長方形,最后實際上最大的并且均勻的正方形就是200X200的正方形。
第一次講到的二分查找其實也是一種分而治之的思想。我們再來看一個例子:
假設(shè)有一個[2,4,6]的數(shù)組。你需要將這些數(shù)字相加,并返回結(jié)果。使用循環(huán)可能很容易解決這個問題,如下:
var arr = [2,4,6],total = 0; for(var i = 0;i < arr.length;i++){ total += arr[i]; }
但如何使用遞歸算法來實現(xiàn)呢?
首先,我們需要找出這個問題的基線條件。我們知道如果數(shù)組中沒有元素,那就代表總和為0,如果有一個元素,那么總和就是這個元素的值。因此基線條件就出來了。
每次遞歸調(diào)用,我們都會減少一個元素,并且離空數(shù)組或者只包含一個元素的數(shù)組很近。如下:
sum([2,4,5]) => 2 + sum([4,6]) => 2 + 4 + sum([6]) => 2 + 4 + 6 = 12
因此,我們可以編寫如下的代碼:
//基線條件 if(arr.length <= 1){ //求和 }else{ //遞歸 }
現(xiàn)在,讓我們來看完整的代碼吧:
function sum(arr,res){ if(arr.length <= 1){ return res + arr[0]; }else{ res += arr.splice(0,1)[0]; return total(arr,res); } } //測試sum([2,4,6],0)=>12
你可能會想,能夠使用循環(huán)輕易的解決問題的,干嘛還要使用遞歸。如果你能理解函數(shù)式編程,那么就明白了。因為函數(shù)式編程并沒有循環(huán)的說法,而實現(xiàn)求和的方式只能是使用遞歸算法。
前面之所以會提到分而治之思想,是因為接下來的快速排序算法需要按照這種思想去理解.快速排序算法比選擇排序算法(也被叫做冒泡排序算法)快的多.我們需要知道,什么樣的數(shù)組需要進行排序,什么樣的數(shù)組不需要進行排序.很顯然當數(shù)組沒有元素或者只有一個元素時,我們無需對數(shù)組進行排序.
空數(shù)組:[] 只有一個元素的數(shù)組:[2];
像如上的數(shù)組,我們沒必要排序,因此接下來的函數(shù)中,我們可以如此寫:
function quickSort(arr){ if(arr.length < 2){ return arr; } }
當數(shù)組的元素超過兩個呢,比如[12,11].我們可能都會這樣想,檢查第一個元素是否比第二個元素大,然后確定是否交換位置.而如果是三個元素呢,甚至更多元素呢?我們是否還能這樣做呢?
我們可以采用分而治之的思想,即D&C策略.將數(shù)組分解.直到滿足基線條件.這也就是說,我們會采用遞歸原理來實現(xiàn).快速排序算法的工作原理就是從數(shù)組當中選擇一個元素,這個元素也被叫做基準值.
然后我們就可以根據(jù)這個基準值找出比基準值大或者比基準值小的元素,這樣被稱作分區(qū).進行分區(qū)之后,你將會得到:
一個比基準值小而組成的子數(shù)組.
一個包含基準值的數(shù)組.
一個比基準值大而組成的子數(shù)組.
當然這里得到的所有子數(shù)組都是無序的,因為如果得到的是有序的,那么排序?qū)容^容易.直接將分解后的數(shù)組利用concat()方法給合并,就能得出排序結(jié)果呢.
基準值的選擇是不確定的,這也就意味著你可以選擇最中間的數(shù),也可以選擇第一個數(shù),甚至是最后一個數(shù)都可以.比如一個數(shù)組[5,2,3,1,4];
數(shù)組當中的五個元素你都可以當作基準值,而每一個基準值所分區(qū)出來的子數(shù)組也會有所不同.
我們通過以上的多種類推和歸納就能得出最終的結(jié)果.而這種證明算法行之有效的方式就叫做歸納證明.歸納證明結(jié)合快速排序算法,可以讓我們的算法變得生動有趣.
現(xiàn)在,我們來實現(xiàn)快速排序的算法吧,代碼如下:
function quickSort(arr){ //定義一個空數(shù)組接收排序后的數(shù)組 var newArr = []; //當數(shù)組的長度小于2時,不需要進行排序 if(arr.length < 2){ return arr; }else{ //定義一個基準值,這里就取中間值吧 var standIndex = Math.floor(arr.length / 2);//由于可能數(shù)組長度不是偶數(shù),所以,需要取整 //使用基準值所對應(yīng)的元素值,由于要最后合并三個數(shù)組所以這里采用splice()方法取得基準值所組成的數(shù)組 var standNum = arr.splice(standIndex,1); //接下來,我們需要定義兩個空數(shù)組,用于保存以基準值作為分區(qū)的最小子數(shù)組和最大子數(shù)組 var minArr = [],maxArr = []; //循環(huán)數(shù)組將每一個元素與基準值進行比較,小則添加到最小子數(shù)組中,大則添加到最大子數(shù)組中 for(var i = 0,len = arr.length;i < len;i++){ if(arr[i] < standNum){ minArr.push(arr[i]); }else{ maxArr.push(arr[i]); } } //循環(huán)完成之后合并三個子數(shù)組,當然這里需要遞歸合并,直到數(shù)組長度小于2為止 newArr = quickSort(minArr).concat(standNum,quickSort(maxArr)); } //返回合并后的新數(shù)組 return newArr; } //測試 quickSort([1,3,2,4,5]);//[1,2,3,4,5]
快速排序算法的獨特之處在于,其速度取決于選取的基準值。在討論快速排序算法的運行時間之前,我們來大致討論一下常見算法的大O運行時間:
執(zhí)行10次操作計算得到的,當然這些數(shù)據(jù)并不準確,之所以提供,只是讓我們對這些運行時間的差別有一個認識。事實上,計算機每秒執(zhí)行的操作遠不止如此。(另外還要注意一下關(guān)于時間復(fù)雜度對數(shù)的底數(shù),是不太確定的,比如二分法,底數(shù)有可能是2,也有可能是3,視情況而定)。
對于每種運行時間,都會有相關(guān)的算法。比如前面所說的選擇排序算法,它的運行時間就是O(n^2),所以速度很慢。
當然還有一種合并排序算法,它的運行時間是O(nlogn),比選擇排序算法快的多,快速排序算法則比較棘手,因為快速排序算法是根據(jù)基準值來判定的,在最糟糕的情況下,快速排序算法的運行時間和選擇排序算法運行時間是一樣的,也是O(n^2)。
當然在平均情況下,快速排序算法又和合并排序算法的運行時間一樣,也是O(nlogn)。
到此為止,也許有人會有疑問?這里的最糟情況和平均情況究竟是什么呢?如果快速排序算法在平均情況下的運行時間是O(nlogn),而合并排序算法的運行時間總是O(nlogn),這不就是說合并排序算法比快速排序算法快嗎?那為何不選合并排序算法呢?
當然我們在做合并排序于快速排序算法的比較之前,我們需要先來談?wù)勈裁词呛喜⑴判蛩惴ā?/p> 八.合并排序算法
合并排序算法也叫歸并排序算法。其核心也是分而治之的思想,與二分法有點類似,先將數(shù)組從中間分開,分成兩個數(shù)組,依次類推,直到數(shù)組的長度為1時停止。然后我們向上回溯,形成一個有序的數(shù)組,最后合并成一個有序的數(shù)組。
現(xiàn)在,來看歸并排序算法實現(xiàn)的代碼吧。
function mergeSort(arr) { // 如果數(shù)組只有一個元素或者無元素則無須排序 if (arr.length <= 1) { return arr; } var mid = Math.floor(arr.length / 2), //取中間值,將數(shù)組截取成2個數(shù)組 left = arr.slice(0, mid), right = arr.slice(mid); var newArr = [], leftArr = mergeSort(left), //這里是最關(guān)鍵的一步,將左右數(shù)組遞歸排序,直到長度為1時,然后合并. rightArr = mergeSort(right); //判斷如果兩個數(shù)組的長度都為1,則比較第一個元素的值,然后添加到新數(shù)組中去 while (leftArr.length && rightArr.length) { if (leftArr[0] < rightArr[0]) { newArr.push(leftArr.shift()); } else { newArr.push(rightArr.shift()); } } return newArr.concat(leftArr, rightArr); } //測試 console.log(mergeSort([1, 3, 2, 4, 6, 5, 7]));
理解了合并排序算法,現(xiàn)在我們就來比較一下快速排序算法和合并排序算法吧。
九.比較快速排序算法與合并排序算法我們還是先來看一個示例,假設(shè)有如下一個函數(shù):
var list = [1,2,3,4,5]; function printItem(list){ list.forEach(function(item){ console.log(item); }) } printItem(list);
以上定義了一個函數(shù),遍歷一個數(shù)組,然后將數(shù)組的每一項在控制臺打印出來。既然它迭代了數(shù)組列表每個數(shù)組項,那么運行時間就是O(n)?,F(xiàn)在,我們假設(shè)每延遲1s再打印出數(shù)組每一項的值,如下:
var list = [1,2,3,4,5]; function printAfterItem(list){ list.forEach(function(item){ setTimeout(function(){ console.log(item); },1000) }) } printItem(list);
第一次,我們知道,打印1,2,3,4,5。而延遲1s打印了之后,則會延遲1s,1,延遲1s,2,延遲1s,3,延遲1s,4,延遲1s,5。這兩個函數(shù)都是迭代了一個數(shù)組,因此它們的運行時間都是O(n)。那么,很顯然printItem()函數(shù)更快,因為它沒有延遲,盡管大O表示法表示這兩者的速度相同,但實際上卻是printItem()更快,在大O表示法O(n)中的n實際上就是指這樣的忽略常量的運行時間。
在這里我們可以定義常量為c,c也就是算法當中的固定時間量,比如上例的1s就是固定的時間量,也被稱為是常量。當然第一個函數(shù)printItem()也有可能有一個時間常量,比如:10ms * n,而延遲1s之后的printAfterItem()則是:1s * n;
哪個函數(shù)的運行速度快自然一目了然。通常來說,是不會考慮這種常量的,因為對于兩種算法的大O運行時間不同,這種常量造成的影響無關(guān)緊要。就比如二分查找和簡單查找。假設(shè)二分查找有常量:n * 1s,而簡單查找有常量:10ms * n;好,如果根據(jù)這個常量來看,也許會認為簡單查找的常量是10ms就快得多,但事實上是這樣嗎?
比如在包含40億個元素列表中查找某個元素,對于二分查找和簡單查找所需時間如下:
簡單查找:10ms * 40億,大約463天。 二分查找:1s * log40億,大約是32秒。
正如你所看到的,二分查找還是快的多,常量幾乎可以忽略不計。
可是有的時候,常量又可能造成巨大的影響,對于快速排序算法和合并排序算法來說,就是如此。實際上快速排序算法的常量比合并排序算法的常量小,因此如果它們的運行時間都是O(nlogn)。那么很顯然快速排序算法要更快,盡管快速排序算法有平均情況和最糟情況之分,但實際上平均情況出現(xiàn)的概率要遠遠大于最糟情況。
到此為止,也許有人會有疑問,什么是平均情況?什么又是最糟情況?
十.平均情況與最糟情況快速排序算法的性能高度依賴于選擇的基準值,假設(shè)你選擇數(shù)組的第一個元素作為基準值,并且要處理的數(shù)組是有序的。由于快速排序算法并不檢查輸入的數(shù)組是否有序,它依然會嘗試進行排序。
[1,2,3,4,5,6,7,8] ↓ [](1)[2,3,4,5,6,7,8] ↓ [](2)[3,4,5,6,7,8] ↓ [](3)[4,5,6,7,8] ↓ [](4)[5,6,7,8] ↓ [](5)[6,7,8] ↓ [](6)[7,8] ↓ [](7)[8]
這樣一來,每次都會選擇第一個元素作為基準值,就會調(diào)用棧8次,最小子數(shù)組也始終是空數(shù)組,這就導致調(diào)用棧非常的長。再來看選擇中間元素作為基準值是什么情況呢?
[1,2,3,4,5,6,7,8] ↓ [1,2,3](4)[5,6,7,8] ↓ ↓ [1](2)[3] (6)[7,8] ↓ [](7)[8]
因為每次都將數(shù)組分成兩半,所以不需要那么多的遞歸調(diào)用。很快就達到了遞歸的基線條件,因此調(diào)用棧就短的多。
第一個示例就展示了最糟情況,而第二個示例則展示的是最佳情況。在最糟情況下,棧長為O(n),在最佳情況下,棧長就是O(logn)。
現(xiàn)在來看看棧的第一層,將一個元素作為基準值,并將其它元素劃分到兩個子數(shù)組中去,這就涉及到了數(shù)組的8個元素,因此該操作時間就是O(n)。實際上棧的每一層都涉及到了O(n)個元素,因此運行時間也是O(n)。即便是最佳情況選擇數(shù)組的中間值來劃分,棧的每一層也一樣涉及到O(n)個元素,因此完成每層所需時間都是O(n)。唯一不同的地方則是第一個示例調(diào)用棧的層數(shù)是O(n)[從技術(shù)術(shù)語來說,也就是調(diào)用棧的高度是O(n)],而第二個示例調(diào)用棧的高度則是O(logn),因此整個算法所需的時間就是O(n) * O(logn) = O(nlogn),而第一個示例所需的時間就是O(n)*O(n) = O(n^2)。這就是最佳情況與最糟情況所需的運行時間。
在這里,我們需要知道的就是最佳情況被看作是平均情況的一種,只要每次隨機的選擇一個元素作為基準值,那么快速排序的平均運行時間就是O(nlogn)。也正因為如此,快速排序算法在平均情況下,常量比合并排序算法小,也因此快速排序算法就是最快的排序算法之一,也是D&C典范。
十一.有趣的數(shù)據(jù)結(jié)構(gòu)——散列表鄙人創(chuàng)建了一個QQ群,供大家學習交流,希望和大家合作愉快,互相幫助,交流學習,以下為群二維碼:
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/101952.html
摘要:在這里我分享下我個人入門機器學習的經(jīng)歷,希望能對大家能有所幫助。相關(guān)學習鏈接,,入門后的體驗在入門了機器學習之后,在實際工作中,絕大多數(shù)的情況下你并不需要去創(chuàng)造一個新的算法。 機器學習在很多眼里就是香餑餑,因為機器學習相關(guān)的崗位在當前市場待遇不錯,但同時機器學習在很多人面前又是一座大山,因為發(fā)現(xiàn)它太難學了。在這里我分享下我個人入門機器學習的經(jīng)歷,希望能對大家能有所幫助。 PS:這篇文章...
閱讀 1175·2021-11-22 15:24
閱讀 4454·2021-09-23 11:51
閱讀 2316·2021-09-08 09:36
閱讀 3523·2019-08-30 15:43
閱讀 1306·2019-08-30 13:01
閱讀 1125·2019-08-30 12:48
閱讀 546·2019-08-29 12:52
閱讀 3379·2019-08-29 12:41