摘要:當(dāng)時自己在本地測試搭建集群后,給分配了另外一個任務(wù)就是去了解中的自帶分詞英文分詞中文分詞的相同與差異以及自己建立分詞需要注意的點。還有就是官網(wǎng)的文檔了,非常非常詳細(xì),還有,版本的是有中文的官方文檔,可以湊合著看。
前提
人工智能、大數(shù)據(jù)快速發(fā)展的今天,對于 TB 甚至 PB 級大數(shù)據(jù)的快速檢索已然成為剛需,大型企業(yè)早已淹沒在系統(tǒng)生成的浩瀚數(shù)據(jù)流當(dāng)中。大數(shù)據(jù)技術(shù)業(yè)已集中在如何存儲和處理這些海量的數(shù)據(jù)上。Elasticsearch 作為開源領(lǐng)域的后起之秀,從2010年至今得到飛躍式的發(fā)展。 Elasticsearch 以其開源、分布式、RESTFul API 三大優(yōu)勢,已經(jīng)成為當(dāng)下風(fēng)口中“會飛的豬”。
在我的電腦本地寫了幾篇 ElasticSearch 的源碼解析了,回過頭來想想應(yīng)該也寫一篇為何我會去看它的源碼?
為什么呢?下面我講講自己從接觸搜索到現(xiàn)在看源碼的過程!
關(guān)注我轉(zhuǎn)載請務(wù)必注明原創(chuàng)地址為:http://www.54tianzhisheng.cn/2018/08/24/why-see-es-code/
第一次接觸搜索搜索,我們首先想到的是搜索引擎:Google、百度,這個就算是接觸的最早的了。
我自己項目里面接觸搜索是大二暑假那時練習(xí)的一個項目,里面用了 Solr,然后當(dāng)時自己也稍微了解了下,并用在了項目里面。
第二次接觸搜索從第一次項目里面用到了搜索,后面自己對這方面就比較感興趣。再一次接觸搜索是實習(xí)的時候進(jìn)公司。第一件事情就是被老大叫的去學(xué)習(xí)搭建 Elasticsearch 集群,于是乎,電腦就裝了三個虛擬機,Elasticsearch 就一個個的裝了起來了。也記錄了博客下來:Elasticsearch 系列文章(二):全文搜索引擎 Elasticsearch 集群搭建入門教程,當(dāng)時搭建的時候 ES 的版本才剛從 2.x 升級到 5.x 呢,截止本文時間 2018.08.04,現(xiàn)在 ES 版本已經(jīng)是到 7.0 了,這版本升級是真的的快,這也說明了 ES 的活躍度很高,背后的開發(fā)工程師維護(hù)也快,側(cè)面突出要去看它源碼的重要性。
當(dāng)時自己在本地測試搭建集群后,給分配了另外一個任務(wù)就是去了解 ES 中的自帶分詞、英文分詞、中文分詞的相同與差異、以及自己建立分詞需要注意的點。于是乎:當(dāng)時在公司 wiki 貢獻(xiàn)了這篇文章:Elasticsearch 系列文章(一):Elasticsearch 默認(rèn)分詞器和中分分詞器之間的比較及使用方法。這篇文章幾乎已經(jīng)把市面上所有的分詞都寫進(jìn)去了,包括他們的相同點、不同點、如何使用、如何自定義分詞器。
然后還有就是我同組的一個同學(xué),她的任務(wù)就是 2.x 升級到 5.x 中 mapping 的大改變有哪些?后面我也看了她總結(jié)的文檔,很詳細(xì)!
在這次接觸了 ES 后,因為我自己本地已經(jīng)有環(huán)境了,所以自己測試了一些功能,給 ES 安裝插件(IK、x-pack、支持 sql 的、),后面自己也去測試 ES 的索引、文檔、REST API。
第三次接觸搜索由于是自己對其感興趣,所以后面就去找了些相關(guān)的視頻,比如:中華石衫的《Elasticsearch 頂尖高手系列-高手進(jìn)階篇》幾個系列視頻教程個人感覺還是不錯的,看完這幾個系列估計入門肯定是沒有問題的。版權(quán)原因,不提供下載鏈接。
另外就是《Elasticsearch 權(quán)威指南》翻譯的版本,翻譯還沒有全,可以去看看,講得很詳細(xì)的,市面上應(yīng)該還沒有哪本書講的有這么清楚,如果英文不錯的可以直接啃英文吧。
還有就是官網(wǎng)的文檔了,非常非常詳細(xì),還有 demo,2.x 版本的是有中文的官方文檔,可以湊合著看。
學(xué)習(xí)新東西,要學(xué)會先看官方文檔,何況 Elasticsearch 的官方文檔這么詳細(xì)呢!
第四次接觸搜索后面實習(xí)的時候,又分配了公司中間件監(jiān)控的兩個模塊:Elasticsearch 和 HBase 組件的監(jiān)控。于是乎,再次有機會接觸 Elasticsearch 了,這次主要還是利用 Elasticsearch 自帶的 REST API :_cluster/health 、_cluster/stats、_nodes、_nodes/stats 去獲取到集群的健康信息、節(jié)點信息(內(nèi)存、CPU、網(wǎng)絡(luò)、JVM等信息)。為了做這個項目自己當(dāng)時也去找了網(wǎng)上很多類似的文章參考常用的監(jiān)控指標(biāo)和他們是怎么做監(jiān)控的。我當(dāng)時的任務(wù)主要還是采集信息,然后存到公司大項目的 influxdb 中,最后用 grafana 展示出來,后面我組的運維大佬給我看了監(jiān)控大盤,界面挺酷炫的,哈哈哈,牛逼!
當(dāng)時寫的兩篇博客:
1、Elasticsearch 系列文章(三):ElasticSearch 集群監(jiān)控
2、Elasticsearch 系列文章(四):ElasticSearch 單個節(jié)點監(jiān)控
取之網(wǎng)絡(luò),還之網(wǎng)絡(luò),希望給后面做類似任務(wù)的小伙伴給點參考意見!
再就是自己搭建 ELK(ElasticSearch, Logstash, Kibana)日志分析平臺,然后玩了下!
搭建環(huán)境博客:Elasticsearch 系列文章(五):ELK 實時日志分析平臺環(huán)境搭建
第五次接觸搜索后面就沒怎么接觸 ElasticSearch 了,一直忙著其他的東西。
實習(xí)辭職后,畢業(yè)出來找工作的那段日子,自己又花了一星期稍微過了一遍 《Elasticsearch 權(quán)威指南》 這本書,話說還幫我面試挺過不少關(guān)呢,哈哈哈!因為我項目里寫了 Elasticsearch 的監(jiān)控,如果你對 Elasticsearch 其他的不熟悉,面試官稍微問些其他關(guān)于這方面的,那就不知道就有點尷尬
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/76908.html
摘要:前提之前在源碼閱讀環(huán)境搭建文章中寫過我遇到的一個問題遲遲沒有解決,也一直困擾著我。然后后面自己分享文章在掘金也發(fā)現(xiàn)有人和我有同樣的問題。下面講講另一種可以讓你繼續(xù)看源碼的方法。配置新建一個遠(yuǎn)程的配置如下圖接下來點擊就好了。 前提 之前在源碼閱讀環(huán)境搭建文章中寫過我遇到的一個問題遲遲沒有解決,也一直困擾著我。問題如下,在啟動的時候解決掉其他異常和報錯后,最后剩下這個錯誤一直解決不了: [...
摘要:總結(jié)這篇文章主要先把大概啟動流程串通,因為篇幅較多所以拆開成兩篇,先不扣細(xì)節(jié)了,后面流程啟動文章寫完后我們再單一的扣細(xì)節(jié)。 關(guān)注我 showImg(https://segmentfault.com/img/remote/1460000012730965?w=258&h=258); 轉(zhuǎn)載請務(wù)必注明原創(chuàng)地址為:http://www.54tianzhisheng.cn/2018/08/11/...
閱讀 2630·2021-11-17 09:33
閱讀 4015·2021-10-19 11:46
閱讀 945·2021-10-14 09:42
閱讀 2291·2021-09-22 15:41
閱讀 4288·2021-09-22 15:20
閱讀 4683·2021-09-07 10:22
閱讀 2346·2021-09-04 16:40
閱讀 842·2019-08-30 15:52