摘要:大數(shù)據(jù)分析,魯班為祖師該節(jié)選自全棧數(shù)據(jù)之門第四章數(shù)據(jù)分析,見微知著的引言部分如果你要問大數(shù)據(jù)分析最早起源于哪里,答案自然是有著千年悠久歷史的中國了。因此,大數(shù)據(jù)分析技術(shù)不僅起源于中國,而且其祖師正是木工藝人的祖師魯班。
1.《全棧數(shù)據(jù)之門》現(xiàn)貨上架
經(jīng)過一段時間的等待,目前已經(jīng)可以在各大電商平臺『現(xiàn)貨』購買本書。
本文后面也有京東、當(dāng)當(dāng)、天貓的購買鏈接!
本書以數(shù)據(jù)分析領(lǐng)域最熱的Python語言為主要線索,介紹數(shù)據(jù)分析庫Numpy、Pandas與機器學(xué)習(xí)庫Scikit-Learn,使用了可視化環(huán)境Orange3來理解算法的一些細節(jié)。
對于機器學(xué)習(xí),既有常用算法KNN與Kmeans的應(yīng)用,決策樹與隨機森林的實戰(zhàn),還涉及常用特征工程與深度學(xué)習(xí)中的自動編程器。
在大數(shù)據(jù)Hadoop與Hive環(huán)境的基礎(chǔ)之上,使用Spark的ML/MLLib庫來集成了前面的各部分內(nèi)容,讓分布式機器學(xué)習(xí)更容易。大量的工具與技能實戰(zhàn),從而將各部分融合成為一個全棧的數(shù)據(jù)科學(xué)內(nèi)容。
該節(jié)選自《全棧數(shù)據(jù)之門》第四章『數(shù)據(jù)分析,見微知著』的引言部分!
如果你要問大數(shù)據(jù)分析最早起源于哪里,答案自然是有著5千年悠久歷史的中國了。若君不信,且看下面的說明。
大數(shù)據(jù)
有一顆樹,非常非常大,一個人搬不動,于是魯班發(fā)明了鋸子,將樹鋸成很多小節(jié),然后找很多人來幫忙搬,這樣不僅速度快,而且效率高。此所謂“大樹鋸”是也。這樣一傳十,十傳百,傳到其它國家,大家訛傳訛,就變成了“大數(shù)據(jù)”。
分布式存儲
為了保證高可用性,魯班教了大家一個好方法。將同樣的木料,分3份保存,自己家放一份,鄰居家放一份,鄰村里面再放一份。如果自己家被燒了,還可以使用鄰居家的那份。如果整個村子被水湮(或者像現(xiàn)在電視劇里演的一樣,在古代可能會一不小心被滅村),還有鄰居村子的那份可以使用。
數(shù)據(jù)分析
將樹鋸斷后,分成一小節(jié)一小節(jié)的,統(tǒng)計每節(jié)的長度,面積等等。分析木料是否有被蟲咬過,以及如何防止其它樹也被類似的蟲咬。分析樹每年的增長幅度,以及每天需要投入多少水資源來促進樹的快速增長。
數(shù)據(jù)挖掘
魯班通過分析樹干上面的紋理,發(fā)現(xiàn)了樹的年輪規(guī)律,這樣可以快速了解樹生長了多少年。這個方法被魯班建立成了一個模型,用于預(yù)測其它樹每年的生長速度。另外,還將樹根“挖掘”出來,分析為什么這個地方能產(chǎn)生這么大的樹,和土地是否有關(guān)系,土壤的成分是什么,能否將這種土壤移植到其它地方等等??傊?,是真正的進行了數(shù)據(jù)的“挖掘”。
因此,大數(shù)據(jù)分析技術(shù)不僅起源于中國,而且其祖師正是木工藝人的祖師--魯班。
一本正經(jīng)的胡說八道了這么多,相信你對數(shù)據(jù)分析有了一個初步的了解吧。
欲了解更多的內(nèi)容,請關(guān)注下面購買地址。
京東:
https://item.jd.com/12054675....
當(dāng)當(dāng):
http://product.dangdang.com/2...
天貓:
https://detail.tmall.com/item...
博文視點:
http://www.broadview.com.cn/b...
豆瓣:
https://book.douban.com/subje...
百度百科:
http://baike.baidu.com/item/全棧數(shù)據(jù)之門/20490226
請輸入代碼
本文題圖取自《全棧數(shù)據(jù)之門》的封底,使用的是Orange3制作的數(shù)據(jù)挖掘流程『演示』圖。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/38589.html
摘要:全棧數(shù)據(jù)之門前言自強不息,厚德載物,自由之光,你是我的眼基礎(chǔ),從零開始之門文件操作權(quán)限管理軟件安裝實戰(zhàn)經(jīng)驗與,文本處理文本工具的使用家族的使用綜合案例數(shù)據(jù)工程,必備分析文件探索內(nèi)容探索交差并補其他常用的命令批量操作結(jié)語快捷鍵,之門提高效率光 showImg(https://segmentfault.com/img/bVK0aK?w=350&h=350); 全棧數(shù)據(jù)之門 前言 自強不息,...
閱讀 3265·2021-11-17 09:33
閱讀 3320·2021-11-15 11:37
閱讀 2980·2021-10-19 11:47
閱讀 3227·2019-08-29 15:32
閱讀 1034·2019-08-29 15:27
閱讀 1553·2019-08-29 13:15
閱讀 958·2019-08-29 12:47
閱讀 2053·2019-08-29 11:30