成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

Hadoop HA集群 與 開發(fā)環(huán)境部署

番茄西紅柿 / 3105人閱讀

摘要:偽分布模式在單節(jié)點(diǎn)上同時(shí)啟動(dòng)等個(gè)進(jìn)程,模擬分布式運(yùn)行的各個(gè)節(jié)點(diǎn)。完全分布式模式正常的集群,由多個(gè)各司其職的節(jié)點(diǎn)構(gòu)成。在之前在集群中存在單點(diǎn)故障。正確的下載鏈接會(huì)有,這個(gè)就是公司需要用戶在下載時(shí)提供的注冊(cè)信息。

每一次 Hadoop 生態(tài)的更新都是如此令人激動(dòng)
像是 hadoop3x 精簡(jiǎn)了內(nèi)核,spark3 在調(diào)用 R 語(yǔ)言的 UDF 方面,速度提升了 40 倍
所以該文章肯定得配備上最新的生態(tài)

hadoop 生態(tài)簡(jiǎn)介




期待目標(biāo)

環(huán)境

OS

  • CentOS 7.4

組件

  • Hadoop 3x 及生態(tài)
    • Yarn
    • Mapreduce
    • HDFS
  • Zookeeper 3.6.3

可選項(xiàng)

  • Hive
  • Flume 1.9
  • Sqoop 2
  • kafka 2x
  • Spark 3x

RDMS

  • MySQL 5.7 or 8

開發(fā)語(yǔ)言

  • JDK 8
  • Python 3.6 64bit
  • Scala 2.0 及以上

集群規(guī)劃
在這里插入圖片描述

建議:Zookeeper、JournalNode 節(jié)點(diǎn)為奇數(shù)

  1. 防止由腦裂造成的集群不可用
  2. leader 選舉,要求 可用節(jié)點(diǎn)數(shù)量 > 總節(jié)點(diǎn)數(shù)量/2 ,節(jié)省資源

注意

Hadoop 安裝有如下三種方式:

  • 單機(jī)模式:安裝簡(jiǎn)單,幾乎不用做任何配置,但僅限于調(diào)試用途。
  • 偽分布模式:在單節(jié)點(diǎn)上同時(shí)啟動(dòng) NameNode、DataNode、JobTracker、TaskTracker、Secondary Namenode 等 5 個(gè)進(jìn)程,模擬分布式運(yùn)行的各個(gè)節(jié)點(diǎn)。
  • 完全分布式模式:正常的 Hadoop 集群,由多個(gè)各司其職的節(jié)點(diǎn)構(gòu)成。
  • HA :在 Hadoop 2.0 之前,在 HDFS 集群中 NameNode 存在單點(diǎn)故障 (SPOF:A Single Point of Failure)。對(duì)于只有一個(gè) NameNode 的集群,如果 NameNode 機(jī)器出現(xiàn)故障(比如宕機(jī)或是軟件、硬件升級(jí)),那么整個(gè)集群將無(wú)法使用,直到 NameNode 重新啟動(dòng)

此文采用 HA方案 進(jìn)行部署

可選方案:

  • 多臺(tái)物理機(jī)
  • 虛擬機(jī)多開



Centos 安裝

環(huán)境

此文采用 多臺(tái)物理機(jī) 方案

  • 內(nèi)存 2G
  • 硬盤 20G

共 4 臺(tái)物理設(shè)備

鏡像下載:

此文采用版本:Centos7.4 x64

中科大源

官方源

建議:百度網(wǎng)盤 centos7.4 密碼: 8jwf

安裝:

鏡像刻錄不進(jìn)行介紹
請(qǐng)參考:

  1. linux
  2. windows
  3. mac

選擇語(yǔ)言:

在這里插入圖片描述

采用最小安裝方案

在這里插入圖片描述 > >在這里插入圖片描述

設(shè)置 root 密碼

點(diǎn)擊 ROOT PASSWORD 設(shè)置 root 密碼,不用添加用戶
在這里插入圖片描述 > >在這里插入圖片描述

等待完成

在這里插入圖片描述
完成之后點(diǎn)擊Reboot > >在這里插入圖片描述



虛擬機(jī)幫助

該節(jié)點(diǎn)為虛擬機(jī)的朋友提供幫助

網(wǎng)絡(luò)配置

虛擬機(jī)配置修改

1)共享網(wǎng)絡(luò)
在這里插入圖片描述

2)選擇橋接模式
在這里插入圖片描述

centos 網(wǎng)絡(luò)配置文件修改

1)查找配置文件

find / -name ifcfg-*

在這里插入圖片描述
2)修改你 etc 目錄下,并以你網(wǎng)卡名結(jié)尾的文件

# 這里舉例我的vi /etc/sysconfig/network-scripts/ifcfg-ens33

動(dòng)態(tài) IP 修改操作:

  • 啟用 dhcp
  • 注釋 ipaddr 和 gateway
  • onboot 設(shè)置為 yes

建議做如下修改
修改為靜態(tài) IP

# 修改BOOTPROTO="static" #dhcp改為staticONBOOT="yes" #開機(jī)啟用本配置# 添加IPADDR=192.168.x.x #靜態(tài)IPGATEWAY=192.168.x.x  #默認(rèn)網(wǎng)關(guān)NETMASK=255.255.255.0 #子網(wǎng)掩碼DNS1=你本機(jī)的dns配置 #DNS 配置

3)重啟服務(wù)

service network restart

4)ping 一下我的博客試試

ping uiuing.com

在這里插入圖片描述

客戶端連接

安裝 net-tools

yum -y install net-tools

查看 ip

ifconfig

打開客戶端終端進(jìn)行 ssh 連接

ssh root@yourip



安裝開發(fā)環(huán)境

Mysql

此文采用版本:mysql5.7

安裝依賴

登陸 centos
在這里插入圖片描述

安裝主要依賴

yum -y install gcc gcc-c++ ncurses ncurses-devel cmake

安裝 boost 庫(kù)(可選)

Mysql5.7 版本更新后有很多變化,安裝必須要 BOOST 庫(kù)(版本需為 1.59.0)

boost 庫(kù)下載地址:boost

1)下載

wget https://jaist.dl.sourceforge.net/project/boost/boost/1.59.0/boost_1_59_0.tar.gz

2)檢查 MD5 值,若不匹配則需要重新下載

md5sum boost_1_59_0.tar.gz

3)解壓

tar -vxzf boost_1_59_0.tar.gz

4)存儲(chǔ)

mv boost_1_59_0 /usr/local/boost_1_59_0

下載

安裝 wget

yum -y install wget

官方下載地址:mysql

1)下載

wget https://dev.mysql.com/get/Downloads/MySQL-5.7/mysql-5.7.21.tar.gz

2)檢查 MD5 值,若不匹配則需要重新下載

md5sum mysql-5.7.21.tar.gz

編譯安裝

1)解壓

tar -vxzf mysql-5.7.21.tar.gz

2)編譯

cmake ./
make

3)安裝

make install

配置 mysql

啟動(dòng)

systemctl start mysqld

或者

systemctl start | stop

查看 mysql 狀態(tài)

systemctl status mysqld

或者

systemctl status

開機(jī)自啟(可選)

systemctl enable mysqld

重載配置(可選)

systemctl daemon-reload

配置 root 密碼
1)生成默認(rèn)密碼

grep temporary password /var/log/mysqld.log

在這里插入圖片描述
localhost 后面的就是你的 root 密碼

2)修改密碼
登陸 mysql

mysql -uroot -p你的密碼

在這里插入圖片描述
修改密碼

ALTER USER root@localhost IDENTIFIED BY 你的密碼;

注意:mysql 5.7 默認(rèn)安裝了密碼安全檢查插件(validate_password),默認(rèn)密碼檢查策略要求密碼必須包含:大小寫字母、數(shù)字和特殊符號(hào),并且長(zhǎng)度不能少于8位

以后可以用 update 更新密碼

use mysql;update user set password=PASSWORD(你的密碼) where user=root;flush privileges;

添加遠(yuǎn)程用戶(可選)

GRANT ALL PRIVILEGES ON *.* TO 用戶名@% IDENTIFIED BY 密碼 WITH GRANT OPTION;
use mysql;UPDATE user SET Host=% WHERE User=用戶名;flush privileges;

配置文件:/etc/my.cnf

日志文件:/var/log/mysqld.log

服務(wù)啟動(dòng)腳本:/usr/lib/systemd/system/mysqld.service

socket 文件:/var/run/mysqld/mysqld.pid

JDK

此文采用版本:JDK8

下載

安裝文本編輯器 vim

yum -y install vim

JDK 官方下載地址:oracle jdk

使用命令下載

wget https://download.oracle.com/otn/java/jdk/8u291-b10/d7fc238d0cbf4b0dac67be84580cfb4b/jdk-8u291-linux-x64.tar.gz?AuthParam=1619936099_3a37c8b389365d286242f4b1aa4967b0

因?yàn)?oracle 公司不允許直接通過 wget 下載官網(wǎng)上的 jdk 包
正確做法:

  • 通過搜索引擎搜索 jdk 官網(wǎng)下載, 進(jìn)入 oracle 官網(wǎng)

  • 勾選 accept licence agreement ,并選擇你系統(tǒng)對(duì)應(yīng)的版本

  • 點(diǎn)擊對(duì)應(yīng)的版本下載,彈出如下下載框,然后復(fù)制下載鏈接
    這個(gè)復(fù)制的鏈接結(jié)算我們 wget 命令的地址。

  • 正確的下載鏈接會(huì)有”AuthParam“,這個(gè)就是 oracle 公司需要用戶在下載時(shí)提供的注冊(cè)信息。而且這個(gè)信息是用時(shí)間限制的,過了一段時(shí)間后就會(huì)失效,如果你想再次下載 jdk 包,只能再次重復(fù)上面的操作。

檢查大小

ls -lht

在這里插入圖片描述

設(shè)置環(huán)境變量

查看文件名(用于解壓)

ls

創(chuàng)建文件夾

mkdir /usr/local/java

解壓

tar -zxvf 你的jdk包名 -C /usr/local/java/

查看文件名(用于配置環(huán)境變量)

ls  /usr/local/java

在這里插入圖片描述
打開配置文件

vi /etc/profile

在末尾添加

# jdk8	# 添加jdk地址變量	JAVA_HOME=/usr/local/java	# 添加jre地址變量	JRE_HOME=${JAVA_HOME}/jre	# 添加java官方庫(kù)地址變量	CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib	# 添加PATH地址變量	PATH=${JAVA_HOME}/bin:$PATH	# 使變量生效	export JAVA_HOME JRE_HOME CLASSPATH PATH

刷新配置文件

source /etc/profile

添加軟鏈接(可選)

ln -s /usr/local/java/jdk1.8.0_291/bin/java  /usr/bin/java

檢查

java -version

在這里插入圖片描述

Python

此文采用版本:Python3.6

我們已經(jīng)掌握了二進(jìn)制包安裝的方法,所以我們直接通過 yum 來安裝 Python

yum -y install python36

依賴:python36-libs

安裝 pip3(默認(rèn)已安裝)

yum install python36-pip -y

檢查

python3 --version

在這里插入圖片描述

Scala

此文采用版本:Scala2.11.7

請(qǐng)確保已安裝JDK8或者JDK11

下載

Scala 官方下載地址:Scala

使用命令下載

wget https://downloads.lightbend.com/scala/2.11.7/scala-2.11.7.tgz

檢查大小

ls -lht

設(shè)置環(huán)境變量

查看文件名(用于解壓)

ls

創(chuàng)建文件夾

mkdir /usr/local/scala

解壓

tar -zxvf 你的jdk包名 -C /usr/local/scala/

查看文件名(用于配置環(huán)境變量)

ls  /usr/local/scala

在這里插入圖片描述

打開配置文件

vi /etc/profile

在末尾添加

# scala 2.11.7	# 添加scala執(zhí)行文件地址變量	SCALA_HOME=/usr/local/scala/scala-2.11.7	# 添加PATH地址變量	PATH=$PATH:$SCALA_HOME/bin	# 使變量生效	export SCALA_HOME PATH

刷新配置文件

source /etc/profile

檢查

scala -version

在這里插入圖片描述


配置 Hadoop Cluster

集群復(fù)刻

使用虛擬機(jī)的朋友請(qǐng)直接克隆
切記要返回第四步驟更改各節(jié)點(diǎn)ip,不然會(huì)發(fā)生ip沖突

1)備份

前往根目錄

cd /

備份

tar cvpzf backup.tgz / --exclude=/proc --exclude=/lost+found --exclude=/mnt --exclude=/sys --exclude=backup.tgz

備份完成后,在文件系統(tǒng)的根目錄將生成一個(gè)名為“backup.tgz”的文件,它的尺寸有可能非常大。你可以把它燒錄到 DVD 上或者放到你認(rèn)為安全的地方去

在備份命令結(jié)束時(shí)你可能會(huì)看到這樣一個(gè)提示:’tar: Error exit delayed from previous
errors’,多數(shù)情況下你可以忽略

2)準(zhǔn)備

別忘了到其他設(shè)備下重新創(chuàng)建那些在備份時(shí)被排除在外的目錄(如果不存在):

mkdir procmkdir lost+foundmkdir mntmkdir sys

3)復(fù)刻

可選前提:

  • 將備份文件拷貝至外存儲(chǔ)
  • 到其他設(shè)備下掛在外存儲(chǔ)

到其他物理機(jī)上恢復(fù)文件

tar xvpfz backup.tgz -C /

恢復(fù) SELinux 文件屬性

restorecon -Rv /

集群互聯(lián)

HOST 配置

1)修改 hostname

到各設(shè)備下執(zhí)行

# 設(shè)備 1 (立即生效)hostnamectl set-hostname master
# 設(shè)備 2 (立即生效)hostnamectl set-hostname slave1
# 設(shè)備 3 (立即生效)hostnamectl set-hostname slave2
# 設(shè)備 4 (立即生效)hostnamectl set-hostname slave3

2)配置 host 文件

查看各設(shè)備 ip(到各設(shè)備下執(zhí)行)

ifconfig

到 master 下打開 host 文件

vim /etc/hosts

末尾追加

master設(shè)備的ip  masterslave1設(shè)備的ip  masterslave2設(shè)備的ip  masterslave3設(shè)備的ip  master

3)通過 scp 傳輸 host 文件

scp 語(yǔ)法:
scp 文件名 遠(yuǎn)程主機(jī)用戶名@遠(yuǎn)程主機(jī)名或ip:存放路徑

到 master 下執(zhí)行

scp /etc/hosts root@SlaveIP:/etc/

注意:請(qǐng)按照 slave 個(gè)數(shù),對(duì)其 ip 枚舉傳輸

ping 一下

ping -c 4 slave1

能 ping 通就沒問題

配置無(wú)密碼 SSH

以下操作均在master下執(zhí)行

1)到各設(shè)備下生成密鑰

ssh-keygen -t rsa

一路回車
在這里插入圖片描述
到 master 生成公鑰

cd ~/.ssh/ && cat id_rsa.pub > authorized_keys

之后將各設(shè)備的密鑰全復(fù)制到authorized_keys文件里

2)通過 scp 傳輸公鑰

到 master 下執(zhí)行

scp authorized_keys root@SlaveNumbe:~/.ssh/

注意:請(qǐng)按照之前設(shè)置的 hostname ,對(duì)其 ip 枚舉傳輸
例如: scp authorized_keys root@slave1:~/.ssh/

注意,如果各節(jié)點(diǎn)下沒有 ~/.ssh/ 目錄則會(huì)配置失敗

檢查

ssh slave1

在這里插入圖片描述
中斷該 ssh 連接(可選)

exit

客戶端配置(建議)

該配置主要方便客戶端遠(yuǎn)程操作

無(wú)論是用虛擬機(jī)進(jìn)行學(xué)習(xí)的朋友,還是工作的朋友都強(qiáng)烈推薦

以下操作均在客戶端(MAC OS)上執(zhí)行

修改 hots 文件

sudo vim /etc/hosts

將 master 設(shè)備下/etc/hosts 之前追加的內(nèi)容,copy 追加到客戶端 hosts 末尾

ping 一下,能 ping 通就沒問題

windows 修改 host 教程

免密鑰 ssh 登陸

客戶端生產(chǎn)密鑰:

sudo ssh-keygen -t rsa

打開密鑰

vim ~/.ssh/id_rsa
  • 將密鑰的內(nèi)容追加到 master 設(shè)備的 ~/.ssh/authorized_keys 文件內(nèi)

到 master 內(nèi)向各節(jié)點(diǎn)申請(qǐng)同步

scp authorized_keys root@SlaveNumbe:~/.ssh/

windows ssh 目錄:C:/Users/your_userName.ssh

檢查

ssh master

在這里插入圖片描述



部署 ZooKeeper

此文采用版本 ZooKeepr3.6.3

官方下載地址:Zookeeper
記得下載帶bin字樣的

準(zhǔn)備

從客戶端上下載 壓縮包

到 master 節(jié)點(diǎn)上創(chuàng)建 zookeeper 文件夾

mkdir /usr/local/zookeeper

從客戶端上傳到 master

scp 你下載的Zookeeper路徑 root@master:/usr/local/zookeeper

以下操作切換至master節(jié)點(diǎn)上

解壓

 cd /usr/local/zookeeper tar xf apache-zookeeper-3.6.3-bin.tar.gz

添加環(huán)境變量

打開配置文件

vim /etc/profile

在末尾添加

# ZooKeeper3.6.3	# 添加zookeeper地址變量	ZOOKEEPER_HOME=/usr/local/zookeeper/apache-zookeeper-bin.3.6.3	# 添加PATH地址變量	PATH=$ZOOKEEPER_HOME/bin:$PATH	# 使變量生效	export ZOOKEEPER_HOME PATH

刷新配置文件

source /etc/profile

修改配置

創(chuàng)建數(shù)據(jù)目錄

mkdir /zookeepermkdir /zookeeper/datamkdir /zookeeper/logs# 同步# 自行枚舉

添加配置文件

cp $ZOOKEEPER_HOME/conf/zoo_sample.cfg $ZOOKEEPER_HOME/conf/zoo.cfg
vim $ZOOKEEPER_HOME/conf/zoo.cfg

修改和添加

tickTime=2000initLimit=10syncLimit=5dataDir=/zookeeper/datadataLogDir=/zookeeper/logsclientPort=2181server.1=master:2888:3888server.2=slea1:2888:3888server.3=slea2:2888:3888server.4=slea3:2888:3888:observer

集群部署:

到 master 下執(zhí)行
請(qǐng)根據(jù)節(jié)點(diǎn)個(gè)數(shù)枚舉執(zhí)行
同步文件

scp /etc/profile root@slave1:/etc/
scp -r /zookeeper root@slave1:/
scp -r /usr/local/zookeeper root@slave1:/usr/local/

配置節(jié)點(diǎn)標(biāo)識(shí)
參考資資料:leader 選舉

ssh master "echo "9" > /zookeeper/data/myid"ssh slave1 "echo "1" > /zookeeper/data/myid"ssh slave2 "echo "2" > /zookeeper/data/myid"ssh slave3 "echo "3" > /zookeeper/data/myid"

防火墻配置

#開放端口firewall-cmd --add-port=2181/tcp --permanentfirewall-cmd --add-port=2888/tcp --permanentfirewall-cmd --add-port=3888/tcp --permanent#重新加載防火墻配置firewall-cmd --reload

節(jié)點(diǎn)批量執(zhí)行

# master節(jié)點(diǎn)ssh master "firewall-cmd --add-port=2181/tcp --permanent && firewall-cmd --add-port=2888/tcp --permanent && firewall-cmd --add-port=3888/tcp --permanent && firewall-cmd --reload "# slave1節(jié)點(diǎn) 其他請(qǐng)自行枚舉執(zhí)行ssh slave1 "firewall-cmd --add-port=2181/tcp --permanent && firewall-cmd --add-port=2888/tcp --permanent && firewall-cmd --add-port=3888/tcp --permanent && firewall-cmd --reload "

啟動(dòng) ZooKeeper

sh  $ZOOKEEPER_HOME/bin/zkServer.sh start

編寫批量啟動(dòng) shell

vim /bin/zk && chmod 777 /bin/zk
#! /bin/shcase $1 in"start"){        echo -e "/e[32m---------------------------------------------------------------------------/033[0m"        echo -e "/e[32m...master-start.../033[0m"        ssh master "sh $ZOOKEEPER_HOME/bin/zkServer.sh start"        echo -e "/e[32m...slave1-start.../033[0m"        ssh slave1 "sh $ZOOKEEPER_HOME/bin/zkServer.sh start"        echo -e "/e[32m...slave2-start.../033[0m"        ssh slave2 "sh $ZOOKEEPER_HOME/bin/zkServer.sh start"        echo -e "/e[32m...slave3-start.../033[0m"        ssh slave3 "sh $ZOOKEEPER_HOME/bin/zkServer.sh start"        echo -e "/e[32m...all-start-end.../033[0m"        echo -e "/e[32m---------------------------------------------------------------------------/033[0m"};;"stop"){        echo -e "/e[32m---------------------------------------------------------------------------/033[0m"        echo -e "/e[32m...master-stop.../033[0m"        ssh master "sh $ZOOKEEPER_HOME/bin/zkServer.sh stop"        echo -e "/e[32m...slave1-start.../033[0m"        ssh slave1 "sh $ZOOKEEPER_HOME/bin/zkServer.sh stop"        echo -e "/e[32m...slave2-start.../033[0m"        ssh slave2 "sh $ZOOKEEPER_HOME/bin/zkServer.sh stop"        echo -e "/e[32m...slave3-start.../033[0m"        ssh slave3 "sh $ZOOKEEPER_HOME/bin/zkServer.sh stop"        echo -e "/e[32m...all-stop-end.../033[0m"        echo -e "/e[32m---------------------------------------------------------------------------/033[0m"};;"status"){        echo -e "/e[32m---------------------------------------------------------------------------"        echo -e "/e[32m...master-status.../033[0m"        ssh master "sh $ZOOKEEPER_HOME/bin/zkServer.sh status"        echo -e "/e[32m...slave1-start.../033[0m"        ssh slave1 "sh $ZOOKEEPER_HOME/bin/zkServer.sh status"        echo -e "/e[32m...slave2-start.../033[0m"        ssh slave2 "sh $ZOOKEEPER_HOME/bin/zkServer.sh status"        echo -e "/e[32m...slave3-start.../033[0m"        ssh slave3 "sh $ZOOKEEPER_HOME/bin/zkServer.sh status"        echo -e "/e[32m...all-status-end.../033[0m"        echo -e "/e[32m---------------------------------------------------------------------------/033[0m"};;esac

命令

# 啟動(dòng)zk start# 查看狀態(tài)zk status# 關(guān)閉zk stop

啟動(dòng)之后 MODE 和我的顯示一樣就算成功了
在這里插入圖片描述



部署 Hadoop

此文采用版本 Hadoop3.2.2

官方下載地址:Hadoop

準(zhǔn)備

從客戶端上下載 壓縮包

到 master 節(jié)點(diǎn)上創(chuàng)建 Hadoop 文件夾

mkdir /usr/local/hadoop

從客戶端上傳到 master

scp 你下載的hadoop路徑 root@master:/usr/local/hadoop

以下操作切換至master節(jié)點(diǎn)上

解壓

 cd /usr/local/hadoop tar xf hadoop包名

添加環(huán)境變量

打開配置文件

vim /etc/profile

在末尾添加

# Hadoop 3.2.2        # 添加hadoop地址變量        HADOOP_HOME=/usr/local/hadoop/hadoop-3.3.0        # 添加PATH地址變量        PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin        # 使變量生效        export HADOOP_HOME PATH# IF HADOOP >= 3x / for root        # HDFS        HDFS_DATANODE_USER=root        HADOOP_SECURE_DN_USER=hdfs        HDFS_NAMENODE_USER=root        HDFS_SECONDARYNAMENODE_USER=root        HDFS_ZKFC_USER=root        # YARN        YARN_RESOURCEMANAGER_USER=root        HADOOP_SECURE_DN_USER=yarn        YARN_NODEMANAGER_USER=root        # run        export HDFS_DATANODE_USER HADOOP_SECURE_DN_USER HDFS_NAMENODE_USER HDFS_SECONDARYNAMENODE_USER HDFS_ZKFC_USER YARN_RESOURCEMANAGER_USER HADOOP_SECURE_DN_USER YARN_NODEMANAGER_USER

請(qǐng)自行使用scp將文件同步至各節(jié)點(diǎn)

刷新配置文件

source /etc/profile

配置

創(chuàng)建數(shù)據(jù)目錄

mkdir /hadoopmkdir /hadoop/journaldatamkdir /hadoop/hadoopdata# 同步# 自行枚舉

添加 Jdk 環(huán)境
打開文件

vim /usr/local/hadoop/hadoop-3.3.0/etc/hadoop/hadoop-env.sh

添加或修改

export JAVA_HOME=/usr/local/java

接下來我們要修改的文件:

  • core-site.xml
  • hadoop-env.sh
  • mapred-env.sh
  • yarn-env.sh
  • workers

前往配置文件目錄

cd /usr/local/hadoop/hadoop-3.3.0/etc/hadoop/

core-site.xml

                                fs.defaultFS                hdfs://jed                                        hadoop.tmp.dir                /hadoop/hadoopdata                                        ha.zookeeper.quorum                master:2181,slave1:2181,slave2:2181,slave3:2181        

hdfs-site.xml

				dfs.replication		2			        	dfs.nameservices        	jed    	    	    	        	dfs.ha.namenodes.jed        	nn1,nn2    	    	    	        	dfs.namenode.rpc-address.jed.nn1        	master:9000    		    	        	dfs.namenode.http-address.jed.nn1        	master:50070    		    	        	dfs.namenode.rpc-address.jed.nn2        	slave1:9000    	    	    	        	dfs.namenode.http-address.jed.nn2        	slave1:50070    	    	    	        	dfs.namenode.shared.edits.dir        	qjournal://master:8485;slave1:8485;slave2:8485/jed    	    	    	        	dfs.journalnode.edits.dir        	/hadoop/journaldata    	    	    	        	dfs.ha.automatic-failover.enabled        	true    	    	    	    	        	dfs.client.failover.proxy.provider.jed        	org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider    	    	    	        	dfs.ha.fencing.methods        	            		sshfence           		shell(/bin/true)        	    	    	    	        	dfs.ha.fencing.ssh.private-key-files        	/var/root/.ssh/id_rsa    	    	    	        	dfs.ha.fencing.ssh.connect-timeout        	20000    	

mapred-site.xml

	    	        	mapreduce.framework.name        	yarn    	    	    	        	mapreduce.jobhistory.address        	master:10020    	    	    	        	mapreduce.jobhistory.webapp.address        	master:19888    	    	    	  			yarn.app.mapreduce.am.env  			HADOOP_MAPRED_HOME=${HADOOP_HOME}				  			mapreduce.map.env  			HADOOP_MAPRED_HOME=${HADOOP_HOME}				  			mapreduce.reduce.env  			HADOOP_MAPRED_HOME=${HADOOP_HOME}		

yarn-site.xml

	    	        	yarn.resourcemanager.ha.enabled        	true    	    	    	        	yarn.resourcemanager.cluster-id        	Cyarn    	    	    	        	yarn.resourcemanager.ha.rm-ids        	rm1,rm2    	    	    	        	yarn.resourcemanager.hostname.rm1        	slave2    	                	yarn.resourcemanager.webapp.address.rm1        	slave2    	    	        	yarn.resourcemanager.hostname.rm2        	slave3    		    	        yarn.resourcemanager.webapp.address.rm2	        slave3	        	    	        	yarn.resourcemanager.zk-address        	master:2181,slave1:2181,slave2:2181,slave3:2181    	    	    	        	yarn.nodemanager.aux-services        	mapreduce_shuffle    	    	    	        	yarn.log-aggregation-enable        	true    	    	    	        	yarn.log-aggregation.retain-seconds        	        	86400    	    	    	        	yarn.resourcemanager.recovery.enabled    		true    	    	    	        	yarn.resourcemanager.store.class        	org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore    	

workers
注意!在Hadoop3x以前的版本是 slaves 文件

masterslave1slave2slave3

使用 scp 分發(fā)給其他節(jié)點(diǎn)

scp -r /usr/local/hadoop slave1:/usr/local/

請(qǐng)自行枚舉執(zhí)行

檢查

使用之前的 zk 腳本啟動(dòng) zeekeeper 集群

zk start

分別在每個(gè) journalnode 節(jié)點(diǎn)上啟動(dòng) journalnode 進(jìn)程

# master slave1 slave2hadoop-daemon.sh start journalnode

在第一個(gè) namenode 節(jié)點(diǎn)上格式化文件系統(tǒng)

 hadoop namenode -format

同步兩個(gè) namenode 的元數(shù)據(jù)

查看你配置的 hadoop.tmp.dir 這個(gè)配置信息,得到 hadoop 工作的目錄,我的是/hadoop/hadoopdata/
把 master 上的 hadoopdata 目錄發(fā)送給 slave1 的相同路徑下,這一步是為了同步兩個(gè) namenode 的元數(shù)據(jù)

scp -r /hadoop/hadoopdata slave1:/hadoop/

也可以在 slave1 執(zhí)行以下命令:

hadoop namenode -bootstrapStandby

格式化 ZKFC(任選一個(gè) namenode 節(jié)點(diǎn)格式化)

hdfs zkfc -formatZK

啟動(dòng) hadoop 集群

start-all.sh

相關(guān)命令請(qǐng)前往 $HADOOP_HOME/sbin/ 查看

啟動(dòng) mapreduce 任務(wù)歷史服務(wù)器

mr-jobhistory-daemon.sh start historyserver

編寫 jps 集群腳本

vim /bin/jpall && chmod 777 /bin/jpall
#! /bin/sh        echo -e "/e[32m---------------------------------------------------------------------------/033[0m"        echo -e "/e[32m...master-jps.../033[0m"        ssh master "jps"        echo -e "/e[32m...slave1-jps.../033[0m"        ssh slave1 "jps"        echo -e "/e[32m...slave2-jps.../033[0m"        ssh slave2 "jps"        echo -e "/e[32m...slave3-jps.../033[0m"        ssh slave3 "jps"        echo -e "/e[32m...all-jps-end.../033[0m"        echo -e "/e[32m---------------------------------------------------------------------------/033[0m"

運(yùn)行

jpall

在這里插入圖片描述

查看各節(jié)點(diǎn)的主備狀態(tài)

hdfs haadmin -getServiceState nn1

查看 HDFS 狀態(tài)

hdfs dfsadmin -report

WEB 訪問可以直接瀏覽器: IP:50070



測(cè)試

HDFS

上傳一個(gè)文件

hdfs dfs -put test.out

check

hdfs dfs -ls /user/root

在這里插入圖片描述

hadoop fs -rm -r -skipTrash /user/root/test.out

刪除
在這里插入圖片描述

Mapreduce

我們使用 hadoop 自帶的圓周率測(cè)試

hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.0.jar pi 5 5

運(yùn)行結(jié)果
在這里插入圖片描述

高可用

查看進(jìn)程

jps

在這里插入圖片描述
殺死進(jìn)程

kill -9 5114

現(xiàn)在 master 已不是 namenode 了
在這里插入圖片描述
現(xiàn)在 slave1 變成了主節(jié)點(diǎn)
在這里插入圖片描述
恢復(fù) master 節(jié)點(diǎn)

hadoop-daemon.sh start namenode

在這里插入圖片描述
master 變成了 standby,什么 HA 具備



Hadoop HA 集群的重裝

  • 刪除所有節(jié)點(diǎn)中 hadoop 的工作目錄(core-site.xml 中配置的 hadoop.tmp.dir 那個(gè)目錄)

  • 如果你在 core-site.xml 中還配置了 dfs.datanode.data.dir 和 dfs.datanode.name.dir 這兩個(gè)配置,那么把這兩個(gè)配置對(duì)應(yīng)的目錄也刪除

  • 刪除所有節(jié)點(diǎn)中 hadoop 的 log 日志文件,默認(rèn)在 HADOOP_HOME/logs 目錄下

  • 刪除 zookeeper 集群中所關(guān)于 hadoop 的 znode 節(jié)點(diǎn)

在這里插入圖片描述
圖中的紅色框中 rmstore 這個(gè)節(jié)點(diǎn)不能刪除,刪除另外兩個(gè)就可以

  • 重新格式化 ZKFC 的時(shí)候會(huì)詢問是否覆蓋 rmstore 這個(gè)節(jié)點(diǎn),輸入 yes 即可
  • 刪除所有節(jié)點(diǎn)中的 journaldata,路徑是在 hdfs-site.xml 中的 dfs.journalnode.edits.dir 中配置的
  • 按照上面安裝集群的步驟重新安裝即可

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/123650.html

相關(guān)文章

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<