摘要:偽分布模式在單節(jié)點(diǎn)上同時(shí)啟動(dòng)等個(gè)進(jìn)程,模擬分布式運(yùn)行的各個(gè)節(jié)點(diǎn)。完全分布式模式正常的集群,由多個(gè)各司其職的節(jié)點(diǎn)構(gòu)成。在之前在集群中存在單點(diǎn)故障。正確的下載鏈接會(huì)有,這個(gè)就是公司需要用戶在下載時(shí)提供的注冊(cè)信息。
每一次 Hadoop 生態(tài)的更新都是如此令人激動(dòng)
像是 hadoop3x 精簡(jiǎn)了內(nèi)核,spark3 在調(diào)用 R 語(yǔ)言的 UDF 方面,速度提升了 40 倍
所以該文章肯定得配備上最新的生態(tài)
OS :
組件:
可選項(xiàng)
- Hive
- Flume 1.9
- Sqoop 2
- kafka 2x
- Spark 3x
RDMS:
開發(fā)語(yǔ)言:
集群規(guī)劃
建議:Zookeeper、JournalNode 節(jié)點(diǎn)為奇數(shù)
- 防止由腦裂造成的集群不可用
- leader 選舉,要求 可用節(jié)點(diǎn)數(shù)量 > 總節(jié)點(diǎn)數(shù)量/2 ,節(jié)省資源
Hadoop 安裝有如下三種方式:
此文采用 HA方案 進(jìn)行部署
可選方案:
此文采用 多臺(tái)物理機(jī) 方案
共 4 臺(tái)物理設(shè)備
此文采用版本:Centos7.4 x64
建議:百度網(wǎng)盤 centos7.4 密碼: 8jwf
鏡像刻錄不進(jìn)行介紹
請(qǐng)參考:
選擇語(yǔ)言:
采用最小安裝方案
> >
設(shè)置 root 密碼
點(diǎn)擊 ROOT PASSWORD 設(shè)置 root 密碼,不用添加用戶
> >等待完成
完成之后點(diǎn)擊Reboot > >
該節(jié)點(diǎn)為虛擬機(jī)的朋友提供幫助
1)共享網(wǎng)絡(luò)
2)選擇橋接模式
1)查找配置文件
find / -name ifcfg-*
2)修改你 etc 目錄下,并以你網(wǎng)卡名結(jié)尾的文件
# 這里舉例我的vi /etc/sysconfig/network-scripts/ifcfg-ens33
動(dòng)態(tài) IP 修改操作:
- 啟用 dhcp
- 注釋 ipaddr 和 gateway
- onboot 設(shè)置為 yes
建議做如下修改
修改為靜態(tài) IP
# 修改BOOTPROTO="static" #dhcp改為staticONBOOT="yes" #開機(jī)啟用本配置# 添加IPADDR=192.168.x.x #靜態(tài)IPGATEWAY=192.168.x.x #默認(rèn)網(wǎng)關(guān)NETMASK=255.255.255.0 #子網(wǎng)掩碼DNS1=你本機(jī)的dns配置 #DNS 配置
3)重啟服務(wù)
service network restart
4)ping 一下我的博客試試
ping uiuing.com
安裝 net-tools
yum -y install net-tools
查看 ip
ifconfig
打開客戶端終端進(jìn)行 ssh 連接
ssh root@yourip
此文采用版本:mysql5.7
登陸 centos
yum -y install gcc gcc-c++ ncurses ncurses-devel cmake
Mysql5.7 版本更新后有很多變化,安裝必須要 BOOST 庫(kù)(版本需為 1.59.0)
boost 庫(kù)下載地址:boost
1)下載
wget https://jaist.dl.sourceforge.net/project/boost/boost/1.59.0/boost_1_59_0.tar.gz
2)檢查 MD5 值,若不匹配則需要重新下載
md5sum boost_1_59_0.tar.gz
3)解壓
tar -vxzf boost_1_59_0.tar.gz
4)存儲(chǔ)
mv boost_1_59_0 /usr/local/boost_1_59_0
安裝 wget
yum -y install wget
官方下載地址:mysql
1)下載
wget https://dev.mysql.com/get/Downloads/MySQL-5.7/mysql-5.7.21.tar.gz
2)檢查 MD5 值,若不匹配則需要重新下載
md5sum mysql-5.7.21.tar.gz
1)解壓
tar -vxzf mysql-5.7.21.tar.gz
2)編譯
cmake ./
make
3)安裝
make install
啟動(dòng)
systemctl start mysqld
或者
systemctl start | stop
查看 mysql 狀態(tài)
systemctl status mysqld
或者
systemctl status
開機(jī)自啟(可選)
systemctl enable mysqld
重載配置(可選)
systemctl daemon-reload
配置 root 密碼
1)生成默認(rèn)密碼
grep temporary password /var/log/mysqld.log
localhost 后面的就是你的 root 密碼
2)修改密碼
登陸 mysql
mysql -uroot -p你的密碼
修改密碼
ALTER USER root@localhost IDENTIFIED BY 你的密碼;
注意:mysql 5.7 默認(rèn)安裝了密碼安全檢查插件(validate_password),默認(rèn)密碼檢查策略要求密碼必須包含:大小寫字母、數(shù)字和特殊符號(hào),并且長(zhǎng)度不能少于8位
以后可以用 update 更新密碼
use mysql;update user set password=PASSWORD(你的密碼) where user=root;flush privileges;
添加遠(yuǎn)程用戶(可選)
GRANT ALL PRIVILEGES ON *.* TO 用戶名@% IDENTIFIED BY 密碼 WITH GRANT OPTION;
use mysql;UPDATE user SET Host=% WHERE User=用戶名;flush privileges;
配置文件:/etc/my.cnf
日志文件:/var/log/mysqld.log
服務(wù)啟動(dòng)腳本:/usr/lib/systemd/system/mysqld.service
socket 文件:/var/run/mysqld/mysqld.pid
此文采用版本:JDK8
安裝文本編輯器 vim
yum -y install vim
JDK 官方下載地址:oracle jdk
使用命令下載:
wget https://download.oracle.com/otn/java/jdk/8u291-b10/d7fc238d0cbf4b0dac67be84580cfb4b/jdk-8u291-linux-x64.tar.gz?AuthParam=1619936099_3a37c8b389365d286242f4b1aa4967b0
因?yàn)?oracle 公司不允許直接通過 wget 下載官網(wǎng)上的 jdk 包
正確做法:
通過搜索引擎搜索 jdk 官網(wǎng)下載, 進(jìn)入 oracle 官網(wǎng)
勾選 accept licence agreement ,并選擇你系統(tǒng)對(duì)應(yīng)的版本
點(diǎn)擊對(duì)應(yīng)的版本下載,彈出如下下載框,然后復(fù)制下載鏈接
這個(gè)復(fù)制的鏈接結(jié)算我們 wget 命令的地址。
正確的下載鏈接會(huì)有”AuthParam“,這個(gè)就是 oracle 公司需要用戶在下載時(shí)提供的注冊(cè)信息。而且這個(gè)信息是用時(shí)間限制的,過了一段時(shí)間后就會(huì)失效,如果你想再次下載 jdk 包,只能再次重復(fù)上面的操作。
檢查大小
ls -lht
查看文件名(用于解壓)
ls
創(chuàng)建文件夾
mkdir /usr/local/java
解壓
tar -zxvf 你的jdk包名 -C /usr/local/java/
查看文件名(用于配置環(huán)境變量)
ls /usr/local/java
打開配置文件
vi /etc/profile
在末尾添加
# jdk8 # 添加jdk地址變量 JAVA_HOME=/usr/local/java # 添加jre地址變量 JRE_HOME=${JAVA_HOME}/jre # 添加java官方庫(kù)地址變量 CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib # 添加PATH地址變量 PATH=${JAVA_HOME}/bin:$PATH # 使變量生效 export JAVA_HOME JRE_HOME CLASSPATH PATH
刷新配置文件
source /etc/profile
添加軟鏈接(可選)
ln -s /usr/local/java/jdk1.8.0_291/bin/java /usr/bin/java
檢查
java -version
此文采用版本:Python3.6
我們已經(jīng)掌握了二進(jìn)制包安裝的方法,所以我們直接通過 yum 來安裝 Python
yum -y install python36
依賴:python36-libs
安裝 pip3(默認(rèn)已安裝)
yum install python36-pip -y
檢查
python3 --version
此文采用版本:Scala2.11.7
請(qǐng)確保已安裝JDK8或者JDK11
Scala 官方下載地址:Scala
使用命令下載:
wget https://downloads.lightbend.com/scala/2.11.7/scala-2.11.7.tgz
檢查大小
ls -lht
查看文件名(用于解壓)
ls
創(chuàng)建文件夾
mkdir /usr/local/scala
解壓
tar -zxvf 你的jdk包名 -C /usr/local/scala/
查看文件名(用于配置環(huán)境變量)
ls /usr/local/scala
打開配置文件
vi /etc/profile
在末尾添加
# scala 2.11.7 # 添加scala執(zhí)行文件地址變量 SCALA_HOME=/usr/local/scala/scala-2.11.7 # 添加PATH地址變量 PATH=$PATH:$SCALA_HOME/bin # 使變量生效 export SCALA_HOME PATH
刷新配置文件
source /etc/profile
檢查
scala -version
使用虛擬機(jī)的朋友請(qǐng)直接克隆
切記要返回第四步驟更改各節(jié)點(diǎn)ip,不然會(huì)發(fā)生ip沖突
1)備份
前往根目錄
cd /
備份
tar cvpzf backup.tgz / --exclude=/proc --exclude=/lost+found --exclude=/mnt --exclude=/sys --exclude=backup.tgz
備份完成后,在文件系統(tǒng)的根目錄將生成一個(gè)名為“backup.tgz”的文件,它的尺寸有可能非常大。你可以把它燒錄到 DVD 上或者放到你認(rèn)為安全的地方去
在備份命令結(jié)束時(shí)你可能會(huì)看到這樣一個(gè)提示:’tar: Error exit delayed from previous
errors’,多數(shù)情況下你可以忽略
2)準(zhǔn)備
別忘了到其他設(shè)備下重新創(chuàng)建那些在備份時(shí)被排除在外的目錄(如果不存在):
mkdir procmkdir lost+foundmkdir mntmkdir sys
3)復(fù)刻
可選前提:
到其他物理機(jī)上恢復(fù)文件
tar xvpfz backup.tgz -C /
恢復(fù) SELinux 文件屬性
restorecon -Rv /
1)修改 hostname
到各設(shè)備下執(zhí)行
# 設(shè)備 1 (立即生效)hostnamectl set-hostname master
# 設(shè)備 2 (立即生效)hostnamectl set-hostname slave1
# 設(shè)備 3 (立即生效)hostnamectl set-hostname slave2
# 設(shè)備 4 (立即生效)hostnamectl set-hostname slave3
2)配置 host 文件
查看各設(shè)備 ip(到各設(shè)備下執(zhí)行)
ifconfig
到 master 下打開 host 文件
vim /etc/hosts
末尾追加
master設(shè)備的ip masterslave1設(shè)備的ip masterslave2設(shè)備的ip masterslave3設(shè)備的ip master
3)通過 scp 傳輸 host 文件
scp 語(yǔ)法:scp 文件名 遠(yuǎn)程主機(jī)用戶名@遠(yuǎn)程主機(jī)名或ip:存放路徑
到 master 下執(zhí)行
scp /etc/hosts root@SlaveIP:/etc/
注意:請(qǐng)按照 slave 個(gè)數(shù),對(duì)其 ip 枚舉傳輸
ping 一下
ping -c 4 slave1
能 ping 通就沒問題
以下操作均在master下執(zhí)行
1)到各設(shè)備下生成密鑰
ssh-keygen -t rsa
一路回車
到 master 生成公鑰
cd ~/.ssh/ && cat id_rsa.pub > authorized_keys
之后將各設(shè)備的密鑰全復(fù)制到authorized_keys文件里
2)通過 scp 傳輸公鑰
到 master 下執(zhí)行
scp authorized_keys root@SlaveNumbe:~/.ssh/
注意:請(qǐng)按照之前設(shè)置的 hostname ,對(duì)其 ip 枚舉傳輸
例如: scp authorized_keys root@slave1:~/.ssh/
注意,如果各節(jié)點(diǎn)下沒有 ~/.ssh/ 目錄則會(huì)配置失敗
檢查
ssh slave1
中斷該 ssh 連接(可選)
exit
該配置主要方便客戶端遠(yuǎn)程操作
無(wú)論是用虛擬機(jī)進(jìn)行學(xué)習(xí)的朋友,還是工作的朋友都強(qiáng)烈推薦
以下操作均在客戶端(MAC OS)上執(zhí)行
修改 hots 文件
sudo vim /etc/hosts
將 master 設(shè)備下/etc/hosts 之前追加的內(nèi)容,copy 追加到客戶端 hosts 末尾
ping 一下,能 ping 通就沒問題
免密鑰 ssh 登陸
客戶端生產(chǎn)密鑰:
sudo ssh-keygen -t rsa
打開密鑰
vim ~/.ssh/id_rsa
到 master 內(nèi)向各節(jié)點(diǎn)申請(qǐng)同步
scp authorized_keys root@SlaveNumbe:~/.ssh/
windows ssh 目錄:C:/Users/your_userName.ssh
檢查
ssh master
此文采用版本 ZooKeepr3.6.3
官方下載地址:Zookeeper記得下載帶bin字樣的
從客戶端上下載 壓縮包
到 master 節(jié)點(diǎn)上創(chuàng)建 zookeeper 文件夾
mkdir /usr/local/zookeeper
從客戶端上傳到 master
scp 你下載的Zookeeper路徑 root@master:/usr/local/zookeeper
以下操作切換至master節(jié)點(diǎn)上
解壓
cd /usr/local/zookeeper tar xf apache-zookeeper-3.6.3-bin.tar.gz
打開配置文件
vim /etc/profile
在末尾添加
# ZooKeeper3.6.3 # 添加zookeeper地址變量 ZOOKEEPER_HOME=/usr/local/zookeeper/apache-zookeeper-bin.3.6.3 # 添加PATH地址變量 PATH=$ZOOKEEPER_HOME/bin:$PATH # 使變量生效 export ZOOKEEPER_HOME PATH
刷新配置文件
source /etc/profile
創(chuàng)建數(shù)據(jù)目錄
mkdir /zookeepermkdir /zookeeper/datamkdir /zookeeper/logs# 同步# 自行枚舉
添加配置文件
cp $ZOOKEEPER_HOME/conf/zoo_sample.cfg $ZOOKEEPER_HOME/conf/zoo.cfg
vim $ZOOKEEPER_HOME/conf/zoo.cfg
修改和添加
tickTime=2000initLimit=10syncLimit=5dataDir=/zookeeper/datadataLogDir=/zookeeper/logsclientPort=2181server.1=master:2888:3888server.2=slea1:2888:3888server.3=slea2:2888:3888server.4=slea3:2888:3888:observer
到 master 下執(zhí)行請(qǐng)根據(jù)節(jié)點(diǎn)個(gè)數(shù)枚舉執(zhí)行
同步文件
scp /etc/profile root@slave1:/etc/
scp -r /zookeeper root@slave1:/
scp -r /usr/local/zookeeper root@slave1:/usr/local/
配置節(jié)點(diǎn)標(biāo)識(shí)
參考資資料:leader 選舉
ssh master "echo "9" > /zookeeper/data/myid"ssh slave1 "echo "1" > /zookeeper/data/myid"ssh slave2 "echo "2" > /zookeeper/data/myid"ssh slave3 "echo "3" > /zookeeper/data/myid"
防火墻配置
#開放端口firewall-cmd --add-port=2181/tcp --permanentfirewall-cmd --add-port=2888/tcp --permanentfirewall-cmd --add-port=3888/tcp --permanent#重新加載防火墻配置firewall-cmd --reload
節(jié)點(diǎn)批量執(zhí)行
# master節(jié)點(diǎn)ssh master "firewall-cmd --add-port=2181/tcp --permanent && firewall-cmd --add-port=2888/tcp --permanent && firewall-cmd --add-port=3888/tcp --permanent && firewall-cmd --reload "# slave1節(jié)點(diǎn) 其他請(qǐng)自行枚舉執(zhí)行ssh slave1 "firewall-cmd --add-port=2181/tcp --permanent && firewall-cmd --add-port=2888/tcp --permanent && firewall-cmd --add-port=3888/tcp --permanent && firewall-cmd --reload "
啟動(dòng) ZooKeeper
sh $ZOOKEEPER_HOME/bin/zkServer.sh start
編寫批量啟動(dòng) shell
vim /bin/zk && chmod 777 /bin/zk
#! /bin/shcase $1 in"start"){ echo -e "/e[32m---------------------------------------------------------------------------/033[0m" echo -e "/e[32m...master-start.../033[0m" ssh master "sh $ZOOKEEPER_HOME/bin/zkServer.sh start" echo -e "/e[32m...slave1-start.../033[0m" ssh slave1 "sh $ZOOKEEPER_HOME/bin/zkServer.sh start" echo -e "/e[32m...slave2-start.../033[0m" ssh slave2 "sh $ZOOKEEPER_HOME/bin/zkServer.sh start" echo -e "/e[32m...slave3-start.../033[0m" ssh slave3 "sh $ZOOKEEPER_HOME/bin/zkServer.sh start" echo -e "/e[32m...all-start-end.../033[0m" echo -e "/e[32m---------------------------------------------------------------------------/033[0m"};;"stop"){ echo -e "/e[32m---------------------------------------------------------------------------/033[0m" echo -e "/e[32m...master-stop.../033[0m" ssh master "sh $ZOOKEEPER_HOME/bin/zkServer.sh stop" echo -e "/e[32m...slave1-start.../033[0m" ssh slave1 "sh $ZOOKEEPER_HOME/bin/zkServer.sh stop" echo -e "/e[32m...slave2-start.../033[0m" ssh slave2 "sh $ZOOKEEPER_HOME/bin/zkServer.sh stop" echo -e "/e[32m...slave3-start.../033[0m" ssh slave3 "sh $ZOOKEEPER_HOME/bin/zkServer.sh stop" echo -e "/e[32m...all-stop-end.../033[0m" echo -e "/e[32m---------------------------------------------------------------------------/033[0m"};;"status"){ echo -e "/e[32m---------------------------------------------------------------------------" echo -e "/e[32m...master-status.../033[0m" ssh master "sh $ZOOKEEPER_HOME/bin/zkServer.sh status" echo -e "/e[32m...slave1-start.../033[0m" ssh slave1 "sh $ZOOKEEPER_HOME/bin/zkServer.sh status" echo -e "/e[32m...slave2-start.../033[0m" ssh slave2 "sh $ZOOKEEPER_HOME/bin/zkServer.sh status" echo -e "/e[32m...slave3-start.../033[0m" ssh slave3 "sh $ZOOKEEPER_HOME/bin/zkServer.sh status" echo -e "/e[32m...all-status-end.../033[0m" echo -e "/e[32m---------------------------------------------------------------------------/033[0m"};;esac
命令
# 啟動(dòng)zk start# 查看狀態(tài)zk status# 關(guān)閉zk stop
啟動(dòng)之后 MODE 和我的顯示一樣就算成功了
此文采用版本 Hadoop3.2.2
官方下載地址:Hadoop
從客戶端上下載 壓縮包
到 master 節(jié)點(diǎn)上創(chuàng)建 Hadoop 文件夾
mkdir /usr/local/hadoop
從客戶端上傳到 master
scp 你下載的hadoop路徑 root@master:/usr/local/hadoop
以下操作切換至master節(jié)點(diǎn)上
解壓
cd /usr/local/hadoop tar xf hadoop包名
打開配置文件
vim /etc/profile
在末尾添加
# Hadoop 3.2.2 # 添加hadoop地址變量 HADOOP_HOME=/usr/local/hadoop/hadoop-3.3.0 # 添加PATH地址變量 PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin # 使變量生效 export HADOOP_HOME PATH# IF HADOOP >= 3x / for root # HDFS HDFS_DATANODE_USER=root HADOOP_SECURE_DN_USER=hdfs HDFS_NAMENODE_USER=root HDFS_SECONDARYNAMENODE_USER=root HDFS_ZKFC_USER=root # YARN YARN_RESOURCEMANAGER_USER=root HADOOP_SECURE_DN_USER=yarn YARN_NODEMANAGER_USER=root # run export HDFS_DATANODE_USER HADOOP_SECURE_DN_USER HDFS_NAMENODE_USER HDFS_SECONDARYNAMENODE_USER HDFS_ZKFC_USER YARN_RESOURCEMANAGER_USER HADOOP_SECURE_DN_USER YARN_NODEMANAGER_USER
請(qǐng)自行使用scp將文件同步至各節(jié)點(diǎn)
刷新配置文件
source /etc/profile
創(chuàng)建數(shù)據(jù)目錄
mkdir /hadoopmkdir /hadoop/journaldatamkdir /hadoop/hadoopdata# 同步# 自行枚舉
添加 Jdk 環(huán)境
打開文件
vim /usr/local/hadoop/hadoop-3.3.0/etc/hadoop/hadoop-env.sh
添加或修改
export JAVA_HOME=/usr/local/java
接下來我們要修改的文件:
前往配置文件目錄
cd /usr/local/hadoop/hadoop-3.3.0/etc/hadoop/
core-site.xml
fs.defaultFS hdfs://jed hadoop.tmp.dir /hadoop/hadoopdata ha.zookeeper.quorum master:2181,slave1:2181,slave2:2181,slave3:2181
hdfs-site.xml
dfs.replication 2 dfs.nameservices jed dfs.ha.namenodes.jed nn1,nn2 dfs.namenode.rpc-address.jed.nn1 master:9000 dfs.namenode.http-address.jed.nn1 master:50070 dfs.namenode.rpc-address.jed.nn2 slave1:9000 dfs.namenode.http-address.jed.nn2 slave1:50070 dfs.namenode.shared.edits.dir qjournal://master:8485;slave1:8485;slave2:8485/jed dfs.journalnode.edits.dir /hadoop/journaldata dfs.ha.automatic-failover.enabled true dfs.client.failover.proxy.provider.jed org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider dfs.ha.fencing.methods sshfence shell(/bin/true) dfs.ha.fencing.ssh.private-key-files /var/root/.ssh/id_rsa dfs.ha.fencing.ssh.connect-timeout 20000
mapred-site.xml
mapreduce.framework.name yarn mapreduce.jobhistory.address master:10020 mapreduce.jobhistory.webapp.address master:19888 yarn.app.mapreduce.am.env HADOOP_MAPRED_HOME=${HADOOP_HOME} mapreduce.map.env HADOOP_MAPRED_HOME=${HADOOP_HOME} mapreduce.reduce.env HADOOP_MAPRED_HOME=${HADOOP_HOME}
yarn-site.xml
yarn.resourcemanager.ha.enabled true yarn.resourcemanager.cluster-id Cyarn yarn.resourcemanager.ha.rm-ids rm1,rm2 yarn.resourcemanager.hostname.rm1 slave2 yarn.resourcemanager.webapp.address.rm1 slave2 yarn.resourcemanager.hostname.rm2 slave3 yarn.resourcemanager.webapp.address.rm2 slave3 yarn.resourcemanager.zk-address master:2181,slave1:2181,slave2:2181,slave3:2181 yarn.nodemanager.aux-services mapreduce_shuffle yarn.log-aggregation-enable true yarn.log-aggregation.retain-seconds 86400 yarn.resourcemanager.recovery.enabled true yarn.resourcemanager.store.class org.apache.hadoop.yarn.server.resourcemanager.recovery.ZKRMStateStore
workers注意!在Hadoop3x以前的版本是 slaves 文件
masterslave1slave2slave3
使用 scp 分發(fā)給其他節(jié)點(diǎn)
scp -r /usr/local/hadoop slave1:/usr/local/
請(qǐng)自行枚舉執(zhí)行
使用之前的 zk 腳本啟動(dòng) zeekeeper 集群
zk start
分別在每個(gè) journalnode 節(jié)點(diǎn)上啟動(dòng) journalnode 進(jìn)程
# master slave1 slave2hadoop-daemon.sh start journalnode
在第一個(gè) namenode 節(jié)點(diǎn)上格式化文件系統(tǒng)
hadoop namenode -format
同步兩個(gè) namenode 的元數(shù)據(jù)
查看你配置的 hadoop.tmp.dir 這個(gè)配置信息,得到 hadoop 工作的目錄,我的是/hadoop/hadoopdata/
把 master 上的 hadoopdata 目錄發(fā)送給 slave1 的相同路徑下,這一步是為了同步兩個(gè) namenode 的元數(shù)據(jù)
scp -r /hadoop/hadoopdata slave1:/hadoop/
也可以在 slave1 執(zhí)行以下命令:
hadoop namenode -bootstrapStandby
格式化 ZKFC(任選一個(gè) namenode 節(jié)點(diǎn)格式化)
hdfs zkfc -formatZK
啟動(dòng) hadoop 集群
start-all.sh
相關(guān)命令請(qǐng)前往 $HADOOP_HOME/sbin/ 查看
啟動(dòng) mapreduce 任務(wù)歷史服務(wù)器
mr-jobhistory-daemon.sh start historyserver
編寫 jps 集群腳本
vim /bin/jpall && chmod 777 /bin/jpall
#! /bin/sh echo -e "/e[32m---------------------------------------------------------------------------/033[0m" echo -e "/e[32m...master-jps.../033[0m" ssh master "jps" echo -e "/e[32m...slave1-jps.../033[0m" ssh slave1 "jps" echo -e "/e[32m...slave2-jps.../033[0m" ssh slave2 "jps" echo -e "/e[32m...slave3-jps.../033[0m" ssh slave3 "jps" echo -e "/e[32m...all-jps-end.../033[0m" echo -e "/e[32m---------------------------------------------------------------------------/033[0m"
運(yùn)行
jpall
查看各節(jié)點(diǎn)的主備狀態(tài)
hdfs haadmin -getServiceState nn1
查看 HDFS 狀態(tài)
hdfs dfsadmin -report
WEB 訪問可以直接瀏覽器: IP:50070
上傳一個(gè)文件
hdfs dfs -put test.out
check
hdfs dfs -ls /user/root
hadoop fs -rm -r -skipTrash /user/root/test.out
刪除
我們使用 hadoop 自帶的圓周率測(cè)試
hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.0.jar pi 5 5
運(yùn)行結(jié)果
查看進(jìn)程
jps
殺死進(jìn)程
kill -9 5114
現(xiàn)在 master 已不是 namenode 了
現(xiàn)在 slave1 變成了主節(jié)點(diǎn)
恢復(fù) master 節(jié)點(diǎn)
hadoop-daemon.sh start namenode
master 變成了 standby,什么 HA 具備
刪除所有節(jié)點(diǎn)中 hadoop 的工作目錄(core-site.xml 中配置的 hadoop.tmp.dir 那個(gè)目錄)
如果你在 core-site.xml 中還配置了 dfs.datanode.data.dir 和 dfs.datanode.name.dir 這兩個(gè)配置,那么把這兩個(gè)配置對(duì)應(yīng)的目錄也刪除
刪除所有節(jié)點(diǎn)中 hadoop 的 log 日志文件,默認(rèn)在 HADOOP_HOME/logs 目錄下
刪除 zookeeper 集群中所關(guān)于 hadoop 的 znode 節(jié)點(diǎn)
圖中的紅色框中 rmstore 這個(gè)節(jié)點(diǎn)不能刪除,刪除另外兩個(gè)就可以
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/123650.html
閱讀 735·2023-04-25 19:43
閱讀 3981·2021-11-30 14:52
閱讀 3807·2021-11-30 14:52
閱讀 3871·2021-11-29 11:00
閱讀 3802·2021-11-29 11:00
閱讀 3904·2021-11-29 11:00
閱讀 3580·2021-11-29 11:00
閱讀 6182·2021-11-29 11:00