成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

CDH5.5.1環(huán)境部署

IT那活兒 / 653人閱讀
CDH5.5.1環(huán)境部署
點擊上方“IT那活兒”公眾號,關(guān)注后了解更多內(nèi)容,不管IT什么活兒,干就完了?。?!

  

Hadoop采用的是Cloudera公司(hadoop的分發(fā)商)的CDH5版本。操作系統(tǒng)為Centos 6.5版本。

Hadoop安裝采用YUM安裝的方式。由于大多數(shù)安裝hadoop的設(shè)備都在內(nèi)網(wǎng)環(huán)境中,所以需要配置自定義的YUM軟件源。



 版本說明


操作系統(tǒng)版本:Centos 6.5   64位
hadoop版本:Cloudera的CDH5



 部署規(guī)劃


Hadoop是一個分布式的系統(tǒng),由多臺設(shè)備共同提供服務(wù)。

每臺設(shè)備上需要安裝不同的hadoop服務(wù)。部署規(guī)劃階段根據(jù)hadoop服務(wù)特點和設(shè)備配置情況,對hadoop服務(wù)的安裝情況作出整體規(guī)劃,將hadoop相應(yīng)的服務(wù)安裝在合適的設(shè)備上。

上圖展示了hadoop的服務(wù)以及運行過程中需要的系統(tǒng)服務(wù)。

  • 安裝服務(wù)器:安裝過程采用CDH自動安裝的方式,該方式需要設(shè)置自定義YUM軟件源。安裝服務(wù)器是自定義YUM軟件源服務(wù)器,在設(shè)備上需要啟動http服務(wù),其他設(shè)備從該設(shè)備通過yum安裝的方式獲取安裝介質(zhì)。只在安裝或者升級的過程中使用安裝服務(wù)器。安裝服務(wù)器上需要有磁盤空間存放安裝介質(zhì),安裝介質(zhì)大約需要4G的磁盤空間。
  • 管理監(jiān)控服務(wù):在安裝時控制安裝的過程;hadoop運行時負(fù)責(zé)hadoop維護管理和系統(tǒng)監(jiān)控。
  • NameNode:hadoop分布式文件系統(tǒng)的主控服務(wù)。該服務(wù)需要較大的內(nèi)存配置的設(shè)備。
  • SecondaryNameNode或者Standby NameNode:SecondaryNameNode是NameNode節(jié)點元數(shù)據(jù)合并服務(wù),可以和NameNode安裝在一臺設(shè)備上也可以在多帶帶的設(shè)備上安裝;Standby NameNode是NameNode在HA方式下的主備服務(wù),需要安裝在與NameNode不同的設(shè)備上。Standby NameNode需要與NameNode同樣的設(shè)備配置。
  • ResourceManager:Hadoop計算任務(wù)的控制服務(wù)。需要在cpu配置較好的設(shè)備上運行。
  • Standby ResourceManager:在ResourceManager的HA的模式下作為ResourceManager的主備服務(wù),需要安裝在與ResourceManager不同的設(shè)備上。需要和ResourceManager同樣的設(shè)備配置。
  • DataNode:hadoop分布式文件系統(tǒng)存儲數(shù)據(jù)的服務(wù);分布式計算任務(wù)中執(zhí)行計算任務(wù)的服務(wù)。是hadoop的實際工作節(jié)點。該節(jié)點需要掛載多個大容易的磁盤用來存儲數(shù)據(jù)文件。
  • NFS Server:為了防止NameNode元數(shù)據(jù)的損壞而導(dǎo)致的數(shù)據(jù)丟失,將元數(shù)據(jù)在NFS中進(jìn)行備份存儲。NFS不是必須,如果將元數(shù)據(jù)在NFS上備份存儲會防止數(shù)據(jù)丟失。
  • DNS Server:hadoop使用主機名進(jìn)行通信,需要實現(xiàn)主機名到IP地址的映射??梢允褂肈NS Server完成該功能;也可以編輯/etc/hosts文件進(jìn)行配置。
  • NTP Server:各個安裝hadoop服務(wù)設(shè)備的系統(tǒng)時間需要保持一致。使用時鐘同步服務(wù)完成該功能。

 設(shè)備使用方式:

  • NFS Server和DNS Server可以不使用,不使用不會影響hadoop正常運行。NFS Server會防止數(shù)據(jù)丟失;DNS Server會降低配置的復(fù)雜度,尤其在設(shè)備數(shù)量較多的時候。
  • DataNode所在設(shè)備需要掛載多個磁盤,提高數(shù)據(jù)寫入和讀取數(shù)據(jù)。DataNode不要和NameNode、SecondaryNameNode、ResourceManager、Standby NameNode、Standby ResourceManager安裝在同一臺設(shè)備上。
  • NameNode、SecondaryNameNode、ResourceManager可以安裝在一臺設(shè)備上。這樣會消耗設(shè)備較多的硬件資源。
  • 使用NameNode的HA方式就不需要安裝SecondaryNameNode。Standby NameNode不能和NameNode安裝在一臺設(shè)備上。
  • ResourceManagerHA方式中Standby ResourceManager不能和ResourceManager安裝在一臺設(shè)備上。
  • 安裝服務(wù)器和管理監(jiān)控服務(wù)可以和其他服務(wù)共享一臺設(shè)備。
此時應(yīng)該對hadoop的安裝情況作出規(guī)劃。hadoop一旦被部署完成,結(jié)構(gòu)的調(diào)整將會很難進(jìn)行而且有一定的風(fēng)險。



 環(huán)境準(zhǔn)備


1. 安裝操作系統(tǒng)

在運行hadoop服務(wù)的每臺設(shè)備上安裝linux操作系統(tǒng)。操作系統(tǒng)使用Centos6.5的64位操作系統(tǒng)。所有設(shè)備的操作系統(tǒng)要求一致。
操作系統(tǒng)安裝完成后,對設(shè)備進(jìn)行網(wǎng)絡(luò)配置,使得各個設(shè)備之間的網(wǎng)絡(luò)通暢。使用IPv4的IP地址格式。
在設(shè)備上掛載磁盤。在DataNode設(shè)備上掛載大容量的磁盤,最好一個設(shè)備上掛載多塊磁盤。最好能夠在NameNode、SecondaryNameNode設(shè)備掛載NFS磁盤系統(tǒng)。管理監(jiān)控服務(wù)也許一定的磁盤空間,大約需要50G的磁盤空間。
操作的設(shè)備:

操作系統(tǒng)的介質(zhì)包需要部署人員去下載,介質(zhì)包是:

2. 設(shè)置主機名稱

Hadoop服務(wù)是通過主機名稱進(jìn)行網(wǎng)絡(luò)通訊的。安裝hadoop服務(wù)的設(shè)備都需要設(shè)置主機名稱。
編輯/etc/sysconfig/network文件的HOSTNAME設(shè)置主機名。
主機名中不能使用下劃線(_)
操作的設(shè)備:

3. 時鐘同步設(shè)置

hadoop服務(wù)的設(shè)備之間要保持時間一致。設(shè)置統(tǒng)一時鐘同步服務(wù)。
每個設(shè)備上要啟動ntpd服務(wù),啟動ntpd之前,每個設(shè)備先做一次手動的同步操作。
操作的設(shè)備:

4. 關(guān)閉防火墻

hadoop服務(wù)安裝的所有設(shè)備上都要關(guān)閉防火墻設(shè)置。
service iptables stop
chgconfig iptables off
操作的設(shè)備:

5. 關(guān)閉SeLinux

hadoop服務(wù)的所有設(shè)備上關(guān)閉SeLinux。
編輯/ect/selinux/config文件。
操作的設(shè)備:

6. 設(shè)置主機路由

在hadoop服務(wù)的設(shè)備上設(shè)置主機名與IP地址路由,確保任意兩個設(shè)置之間能夠通過主機名能夠進(jìn)行訪問。
編輯/etc/hosts文件。
或者可以選擇設(shè)置設(shè)備的DNS為指定的DNS Server。建議使用DNS Server設(shè)置設(shè)備的DNS路由。
操作的設(shè)備:

7. 設(shè)置root密碼

安裝過程中使用root用戶安裝,需要設(shè)置所有設(shè)備root用戶的密碼為相同的密碼。該密碼是在安裝的過程中使用,如果結(jié)束后可以修改該密碼。
操作的設(shè)備:

8. 設(shè)置自定義YUM軟件源服務(wù)

在安裝服務(wù)器上設(shè)置自定義YUM軟件源。以下操作在安裝服務(wù)器上進(jìn)行:

  • 安裝系統(tǒng)組件:createrepo。在操作系統(tǒng)安裝介質(zhì)中的Packages目錄下找到createrepo-0.9.9-18.el6.noarch安裝包使用rpm命令安裝。
  • 將安裝介質(zhì)中cdh5目錄復(fù)制到設(shè)備的/var/www/html目錄下面。
  • 將安裝介質(zhì)中的cmd5目錄復(fù)制到設(shè)備的/var/www/html目錄下面。
  • 將操作系統(tǒng)安裝介質(zhì)的Packages目錄復(fù)制到/var/www/html/os目錄下面。Packages目錄是操作系統(tǒng)的介質(zhì)包CentOS-6.5-x86_64-bin-DVD1.iso 中的Packages:
  • 進(jìn)入/var/www/html/cdh5目錄,執(zhí)行命令
    createrepo
  • 進(jìn)入/var/www/html/cm5目錄,執(zhí)行命令
    createrepo 
  • 進(jìn)入/var/www/html/os目錄,執(zhí)行命令
    createrepo
  • 啟動http服務(wù):service httpd start

9. 設(shè)置自定義YUM軟件源

在hadoop所有服務(wù)設(shè)備上設(shè)置安裝服務(wù)器為自定義YUM軟件源。
1)進(jìn)入/etc/yum.repos.d目錄,創(chuàng)建hadoop.repo文件,編輯該文件:
2)將/etc/yum.repos.d目錄中的其它的.repo文件(hadoop.repo之外的文件)刪除或者后綴名改為.bak
操作的設(shè)備:

10. 重啟設(shè)備

將所有進(jìn)行設(shè)置的設(shè)備重新啟動,讓設(shè)置生效。
如果安裝服務(wù)器上的http服務(wù)沒有設(shè)置開機啟動,還需要在安裝服務(wù)器上啟動http服務(wù):service httpd start



 Hadoop部署


1. 安裝Cloudera Manager

將介質(zhì)中cloudera-manager-installer.bin文件復(fù)制到安裝監(jiān)控服務(wù)器的/opt目錄中,然后執(zhí)行下面的命令:
./cloudera-manager-installer.bin --skip_repo_package=1
執(zhí)行命令后,會出現(xiàn)Cloudera Manager的安裝向?qū)В?/span>
選擇進(jìn)行安裝:
Cloudera Manager安裝結(jié)束后,出現(xiàn)提示界面。記下提示中的URL。

2. 安裝部署CDH

在瀏覽器地址欄中輸入Cloudera Manager提示界面中的URL:http://192.168.XX.35:7180
使用admin用戶登錄Cloudera Manager,admin用戶的初始密碼為:admin
選擇Cloudera Express,繼續(xù)。
指定集群中hadoop使用的所有主機。輸入主機名或者IP地址,每行一個,然后點擊搜索:
選擇安裝介質(zhì)包。
  • 選擇方法:使用數(shù)據(jù)包。
  • CDH版本:自定義存儲庫,輸入自定義YUM軟件源的cdh的url。
  • Clouera Manager Agent:自定義存儲庫,輸入自定義YUM軟件源的cm的url。
使用root用戶安裝,所有主機的root用戶接受相同密碼,輸入root用戶的密碼。
介質(zhì)的安裝階段,時間較長需要等待一段時間。

選擇安裝的服務(wù)類型。自定義服務(wù)中選擇HDFS和YARN。
選擇主機設(shè)備將被安裝的服務(wù)。根據(jù)前期的部署規(guī)劃將hadoop服務(wù)安裝在對應(yīng)的主機設(shè)備中。其中Cloudera Management Service安裝在安裝監(jiān)控服務(wù)器中。
使用嵌入式數(shù)據(jù)庫,用來存儲Cloudera Manager的元數(shù)據(jù)。
集群配置的Cloudera Management Service的配置使用默認(rèn)即可。

HDFS和YARN配置:

  • DataNode數(shù)據(jù)目錄:配置數(shù)據(jù)的存儲目錄。如果是多個磁盤,配置多個路徑。路徑之間使用逗號(,)分隔。
  • NameNode數(shù)據(jù)目錄:是NameNode的元數(shù)據(jù)的保存目錄,可以是多個目錄。每個目錄中寫入相同的數(shù)據(jù)用于備份。多個目錄路勁使用逗號分隔。多個目錄中最好有一個是NFS系統(tǒng)的目錄用于備份。
  • HDFS檢查點目錄:是SecondaryNameNode用戶合并元數(shù)據(jù)的工作目錄。也可以是多個目錄,多個目錄路徑是有逗號分隔。
  • NodeManager本地目錄列表:MapReduce計算的中間結(jié)果的存儲目錄??梢耘渲枚鄠€目錄多個目錄路徑是有逗號分隔。
注意:上述配置的路徑會在多個設(shè)備上創(chuàng)建相同的目錄,需要先在每個設(shè)備上創(chuàng)建相同目錄,而且創(chuàng)建的目錄能夠掛載到存儲。
集群首次運行啟動相關(guān)服務(wù)。
安裝完成。

本文作者:高智飛(上海新炬王翦團隊)

本文來源:“IT那活兒”公眾號

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/129357.html

相關(guān)文章

  • TOP100summit分享實錄 | JFrog高欣:Kubernetes is hard!JFro

    摘要:本文內(nèi)容節(jié)選自由主辦的第七屆,架構(gòu)師高欣分享的的實踐實錄。當(dāng)然,在部署完成后,我們要做一個監(jiān)測以便掌握它的運行狀況。規(guī)劃配置運行環(huán)境在正式部署前,還要考慮如何規(guī)劃并配置好運行環(huán)境。在使用部署時,可以利用這些命令做驗證,檢驗部署是否正常。 showImg(https://segmentfault.com/img/bVblRHj?w=2880&h=1920); 本文內(nèi)容節(jié)選自由msup主辦...

    鄒強 評論0 收藏0
  • 采用鏡像部署LNMP 環(huán)境操作步驟

    摘要:下表列出了鏡像部署和手動部署兩種方式的特點。如果您購買的實例已經(jīng)開始運行,但是您想使用鏡像市場中的鏡像重新部署環(huán)境,操作步驟如下登錄管理控制臺。單擊鏡像市場,然后單擊從鏡像市場選擇含操作系統(tǒng)。您成功使用鏡像部署了環(huán)境。LNMP分別代表Linux、Nginx、MySQL、PHP。本文介紹如何在ECS實例上使用鏡像部署LNMP環(huán)境。 您可選用以下幾種方式在ECS實例上部署LNMP環(huán)境: 鏡像...

    Backache 評論0 收藏0
  • walle-瓦力自動化部署工具

    摘要:項目地址瓦力,上線開源兩個月,目前已支持超過十家企業(yè)線上部署使用,每周更新一個版本,持續(xù)帶來新特性。支持開放接口支持第三方了解更多項目地址瓦力,官方主頁瓦力。 1 Git Flow 一般而言,軟件開發(fā)模型有常見的瀑布模型、迭代開發(fā)模型、以及最近出現(xiàn)的敏捷開發(fā)模型等不同的模型。每種模型有各自應(yīng)用場景,Git Flow是構(gòu)建在Git之上的一個組織軟件開發(fā)活動的模型,Git Flow重點解...

    Allen 評論0 收藏0
  • 現(xiàn)代軟件開發(fā)流程-by 12-Factor

    摘要:將開發(fā)環(huán)境和生產(chǎn)環(huán)境的差異降至最低,并使用持續(xù)交付實施敏捷開發(fā)??梢栽诠ぞ呒軜?gòu)和開發(fā)流程不發(fā)生明顯變化的前提下實現(xiàn)擴展。我們的初衷是分享在現(xiàn)代軟件開發(fā)過程中發(fā)現(xiàn)的一些系統(tǒng)性問題,并加深對這些問題的認(rèn)識。 簡介 如今,軟件通常會作為一種服務(wù)來交付,它們被稱為網(wǎng)絡(luò)應(yīng)用程序,或軟件即服務(wù)(SaaS)。12-Factor 為構(gòu)建如下的 SaaS 應(yīng)用提供了方法論: 使用標(biāo)準(zhǔn)化流程自動配置,從...

    draveness 評論0 收藏0

發(fā)表評論

0條評論

IT那活兒

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<