摘要:谷歌思科華為等等均是的貢獻成員。其中谷歌云平臺和等大型云提供商成功在生產(chǎn)環(huán)境中使用了。它為良好穩(wěn)定的生產(chǎn)部署提供了一個良好的起點。預先準備在繼續(xù)之前,我們需要準備一個谷歌云平臺的賬號免費的應該足夠了。我們將為部署配置。
本文將帶你充分了解Etcd的工作原理,演示如何用Kubernetes建立并運行etcd集群,如何與Etcd交互,如何在Etcd中設置和檢索值,如何配置高可用等等。
介 紹
Etcd是一個開源的分布式鍵值存儲,它由CoreOS團隊開發(fā),現(xiàn)在由Cloud Native Computing Foundation負責管理。這個詞的發(fā)音是“et-cee-dee”,表示在多臺機器上分發(fā)Unix系統(tǒng)的“/etc”目錄,其中包含了大量的全局配置文件。它是許多分布式系統(tǒng)的主干,為跨服務器集群存儲數(shù)據(jù)提供可靠的方式。它適用于各種操作系統(tǒng),包括Linux、BSD和OS X。
Etcd具有下面這些屬性:
完全復制:集群中的每個節(jié)點都可以使用完整的存檔
高可用性:Etcd可用于避免硬件的單點故障或網(wǎng)絡問題
一致性:每次讀取都會返回跨多主機的最新寫入
簡單:包括一個定義良好、面向用戶的API(gRPC)
安全:實現(xiàn)了帶有可選的客戶端證書身份驗證的自動化TLS
快速:每秒10000次寫入的基準速度
可靠:使用Raft算法實現(xiàn)了存儲的合理分布
Etcd的工作原理
在理解Etcd的工作機制之前,我們先定義三個關鍵概念:leaders、elections以及terms。在一個基于Raft的系統(tǒng)中,集群使用election為給定的term選擇leader。
Leader處理所有需要集群一致協(xié)商的客戶端請求。不需要一致協(xié)商的請求(如讀取)可以由任何集群成員處理。Leader負責接受新的更改,將信息復制到follower節(jié)點,并在follower驗證接受后提交更改。每個集群在任何給定的時間內(nèi)只能有一個leader。
如果leader掛了或者不再響應了,那么其他節(jié)點將在預定的時間超時之后開啟一個新的term來創(chuàng)建新election。每個節(jié)點維護一個隨機的election計時器,該計時器表示節(jié)點在調(diào)用新的election以及選擇自己作為候選之前需要等待的時間。
如果節(jié)點在超時發(fā)生之前沒有收到leader的消息,則該節(jié)點將通過啟動新的term、將自己標記為候選,并要求其他節(jié)點投票來開始新的election。每個節(jié)點投票給請求其投票的第一個候選。如果候選從集群中的大多數(shù)節(jié)點處獲得了選票,那么它就成為了新的leader。但是,如果存在多個候選且獲得了相同數(shù)量的選票,那么現(xiàn)有的election term將在沒有l(wèi)eader的情況下結束,而新的term將以新的隨機選舉計時器開始。
如上所述,任何更改都必須連接到leader節(jié)點。Etcd沒有立即接受和提交更改,而是使用Raft算法確保大多數(shù)節(jié)點都同意更改。Leader將提議的新值發(fā)送到集群中的每個節(jié)點。然后,節(jié)點發(fā)送一條消息確認收到了新值。如果大多數(shù)節(jié)點確認接收,那么leader提交新值,并向每個節(jié)點發(fā)送將該值提交到日志的消息。這意味著每次更改都需要得到集群節(jié)點的仲裁才能提交。
Kubernetes中的Etcd
自從2014年成為Kubernetes的一部分以來,Etcd社區(qū)呈現(xiàn)指數(shù)級的增長。CoreOS、谷歌、Redhat、IBM、思科、華為等等均是Etcd的貢獻成員。其中AWS、谷歌云平臺和Azure等大型云提供商成功在生產(chǎn)環(huán)境中使用了Etcd。
Etcd在Kubernetes中的工作是為分布式系統(tǒng)安全存儲關鍵數(shù)據(jù)。它最著名的是Kubernetes的主數(shù)據(jù)存儲,用于存儲配置數(shù)據(jù)、狀態(tài)和元數(shù)據(jù)。由于Kubernetes通常運行在幾臺機器的集群上,因此它是一個分布式系統(tǒng),需要Etcd這樣的分布式數(shù)據(jù)存儲。
Etcd使得跨集群存儲數(shù)據(jù)和監(jiān)控更改變得更加容易,它允許來自Kubernetes集群的任何節(jié)點讀取和寫入數(shù)據(jù)。Kubernetes使用Etcd的watch功能來監(jiān)控系統(tǒng)實際(actual)狀態(tài)或期望(desired)狀態(tài)的變化。如果這兩個狀態(tài)不同,Kubernetes會做出一些改變來調(diào)和這兩個狀態(tài)。kubectl命令的每次讀取都從Etcd存儲的數(shù)據(jù)中檢索,所做的任何更改(kubectl apply)都會在Etcd中創(chuàng)建或更新條目,每次崩潰都會觸發(fā)etcd中值的修改。
部署以及硬件建議
出于測試或開發(fā)目的,Etcd可以在筆記本電腦或輕量云上運行。然而,在生產(chǎn)環(huán)境中運行Etcd集群時,我們應該考慮Etcd官方文檔提供的指導。它為良好穩(wěn)定的生產(chǎn)部署提供了一個良好的起點。需要留意的是:
Etcd會將數(shù)據(jù)寫入磁盤,因此強烈推薦使用SSD
始終使用奇數(shù)個集群數(shù)量,因為需要通過仲裁來更新集群的狀態(tài)
出于性能考慮,集群通常不超過7個節(jié)點
讓我們回顧一下在Kubernetes中部署Etcd集群所需的步驟。之后,我們將演示一些基本的CLI命令以及API調(diào)用。我們將結合Kubernetes的概念(如StatefulSets和PersistentVolume)進行部署。
預先準備
在繼續(xù)demo之前,我們需要準備:
一個谷歌云平臺的賬號:免費的tier應該足夠了。你也可以選擇大多數(shù)其他云提供商,只需進行少量修改即可。
一個運行Rancher的服務器
啟動Rancher實例
在你控制的服務器上啟動Rancher實例。這里有一個非常簡單直觀的入門指南:https://rancher.com/quick-start/
使用Rancher部署GKE集群
參照本指南使用Rancher在GCP賬戶中設置和配置Kubernetes集群:
https://rancher.com/docs/ranc...
在運行Rancher實例的同一服務器上安裝Google Cloud SDK以及kubelet命令。按照上面提供的鏈接安裝SDK,并通過Rancher UI安裝kubelet。
使用gcloud init和gcloud auth login,確保gcloud命令能夠訪問你的GCP賬戶。
集群部署后,輸入下面的命令檢查基本的kubectl功能:
在部署Etcd集群(通過kubectl或在Rancher的UI中導入YAML文件)之前,我們需要配置一些項。在GCE中,默認的持久化磁盤是pd-standard。我們將為Etcd部署配置pd-ssd。這不是強制性的,不過根據(jù)Etcd的建議,SSD是非常好的選擇。查看此鏈接可以了解其他云提供商的存儲類:
https://kubernetes.io/docs/co...
讓我們檢查一下GCE提供的可用存儲類。正如預期的那樣,我們看到了一個默認的結果,叫做standard:
應用下面這個YAML文件,更新zone的值來匹配你的首選項,這樣我們就可以使用SSD存儲了:
我們再一次檢查,可以看到,除了默認standard類之外,ssd也可以使用了:
現(xiàn)在我們可以繼續(xù)部署Etcd集群了。我們將創(chuàng)建一個帶有3個副本的StatefulSet,每個副本都有一個ssd storageClass的專用卷。我們還需要部署兩個服務,一個用于內(nèi)部集群通信,一個用于通過API從外部訪問集群。
在搭建集群時,我們需要將一些參數(shù)傳遞給Etcd二進制文件再到數(shù)據(jù)存儲中。Listen-client-urls和listen-peer-urls選項指定Etcd服務器用于接受傳入連接的本地地址。指定0.0.0.0作為IP地址意味著Etcd將監(jiān)聽所有可用接口上的連接。Advertise-client-urls和initial-advertise-peer-urls參數(shù)指定了在Etcd客戶端或者其他Etcd成員聯(lián)系etcd服務器時應該使用的地址。
下面的YAML文件定義了我們的兩個服務以及Etcd StatefulSe圖:
`# etcd-sts.yaml---
apiVersion: v1
kind: Service
metadata:
name: etcd-client
spec:
type: LoadBalancer
ports:
name: etcd-client
port: 2379
protocol: TCP
targetPort: 2379
selector:
app: etcd
apiVersion: v1
kind: Service
metadata:
name: etcd
spec:
clusterIP: None
ports:
port: 2379
name: client
port: 2380
name: peer
selector:
app: etcd
apiVersion: apps/v1beta1
kind: StatefulSet
metadata:
name: etcd
labels:
app: etcd
spec:
serviceName: etcd
replicas: 3
template:
metadata: name: etcd labels: app: etcd spec: containers: - name: etcd image: quay.io/coreos/etcd:latest ports: - containerPort: 2379 name: client - containerPort: 2380 name: peer volumeMounts: - name: data mountPath: /var/run/etcd command: - /bin/sh - -c - | PEERS="etcd-0=http://etcd-0.etcd:2380,etcd-1=http://etcd-1.etcd:2380,etcd-2=http://etcd-2.etcd:2380" exec etcd --name ${HOSTNAME} --listen-peer-urls http://0.0.0.0:2380 --listen-client-urls http://0.0.0.0:2379 --advertise-client-urls http://${HOSTNAME}.etcd:2379 --initial-advertise-peer-urls http://${HOSTNAME}:2380 --initial-cluster-token etcd-cluster-1 --initial-cluster ${PEERS} --initial-cluster-state new --data-dir /var/run/etcd/default.etcd
volumeClaimTemplates:
metadata:
name: data
spec:
storageClassName: ssd accessModes: [ "ReadWriteOnce" ] resources: requests: storage: 1Gi`
輸入下列命令應用YAML:
在應用YAML文件后,我們可以在Rancher提供的不同選項卡中定義資源:
與Etcd交互
與Etcd交互的方式主要有兩種:使用etcdctl命令或者直接通過RESTful API。我們將簡要介紹這兩種方法,不過你還可以通過訪問這里和這里的完整文檔找到更加深入的信息和示例。
Etcdctl是一個和Etcd服務器交互的命令行接口。它可以用于執(zhí)行各種操作,如設置、更新或者刪除鍵、驗證集群健康情況、添加或刪除Etcd節(jié)點以及生成數(shù)據(jù)庫快照。默認情況下,etcdctl使用v2 API與Etcd服務器通信來獲得向后兼容性。如果希望etcdctl使用v3 API和Etcd通信,則必須通過ETCDCTL_API環(huán)境變量將版本設置為3。
對于API,發(fā)送到Etcd服務器的每一個請求都是一個gRPC遠程過程調(diào)用。這個gRPC網(wǎng)關提供一個RESTful代理,能夠將HTTP/JSON請求轉換為gRPC消息。
讓我們來找到API調(diào)用所需的外部IP:
我們應該還能找到3個pods的名稱,這樣我們就可以使用etcdctl命令:
我們檢查Etcd版本。為此我們可以使用API或CLI(v2和v3).根據(jù)你選擇的方法, 輸出的結果將略有不同。
使用此命令可直接與API聯(lián)系:
檢查API版本為v2的etcdctl客戶端,輸入:
檢查API版本為v3的etcdctl客戶端,則輸入:
接下來,列出集群成員,就像我們上面做的那樣:
{"members":[{"id":"2e80f96756a54ca9","name":"etcd-0","peerURLs":["http://etcd-0.etcd:2380"],"clientURLs":["http://etcd-0.etcd:2379"]},{"id":"7fd61f3f79d97779","name":"etcd-1","peerURLs":["http://etcd-1.etcd:2380"],"clientURLs":["http://etcd-1.etcd:2379"]},{"id":"b429c86e3cd4e077","name":"etcd-2","peerURLs":["http://etcd-2.etcd:2380"],"clientURLs":["http://etcd-2.etcd:2379"]}]}
V2版本的etcdctl:
V3版本的etcdctl:
在Etcd中設置和檢索值
下面我們將介紹的最后一個示例是在Etcd集群中全部3個pods上創(chuàng)建一個鍵并檢查其值。然后我們會殺掉leader,在我們的場景中是etcd-0,然后來看看新的leader是如何選出來的。最后,在集群恢復之后,我們將在所有成員上驗證之前創(chuàng)建的鍵的值。我們會看到,沒有數(shù)據(jù)丟失的情況發(fā)生,集群只是換了一個leader而已。
我們可以通過輸入下面的命令來驗證集群最初是健康的:
接下來,驗證當前l(fā)eader。最后一個字段表明etcd-0是我們集群中的leader:
使用該API,我們將創(chuàng)建一個名為message的鍵并給它分配一個值,請記住在下面的命令中把IP地址替換為你在集群中通過下面命令獲取到的地址:
無論查詢哪個成員,鍵都具有相同的值。這幫助我們驗證值是否已經(jīng)復制到其他節(jié)點并提交到日志。
演示高可用性和恢復
接下來,我們可以殺掉Etcd集群leader。這樣我們可以看到新的leader是如何選出的,以及集群如何從degraded狀態(tài)中恢復過來。刪除與上面發(fā)現(xiàn)的Etcd leader相關的pod:
下面我們檢查一下集群的健康情況:
failed to check the health of member 2e80f96756a54ca9 on http://etcd-0.etcd:2379: Get http://etcd-0.etcd:2379/health: dial tcp: lookup etcd-0.etcd on 10.15.240.10:53: no such host
member 2e80f96756a54ca9 is unreachable: [http://etcd-0.etcd:2379] are all unreachable
member 7fd61f3f79d97779 is healthy: got healthy result from http://etcd-1.etcd:2379
member b429c86e3cd4e077 is healthy: got healthy result from http://etcd-2.etcd:2379cluster is degraded
command terminated with exit code 5
上面的信息表明,由于失去了leader節(jié)點,集群出于degrade狀態(tài)。
一旦Kubernetes通過啟動新實例來響應刪除的pod,Etcd集群應該就恢復過來了:
輸入下面指令,我們可以看到新的leader已經(jīng)選出來了:
在我們的例子中,etcd-1節(jié)點被選為leader
如果我們再一次檢查message鍵的值,會發(fā)現(xiàn)沒有出現(xiàn)數(shù)據(jù)的損失:
結 論
Etcd是一種非常強大、高可用以及可靠的分布式鍵值存儲,專門為特定用例設計。常見的例子包括存儲數(shù)據(jù)哭連接細節(jié)、緩存設置、特性標記等等。它被設計成順序一致的,因此在整個集群中每個事件都是以相同的順序存儲。
我們了解了如何在Rancher的幫助下用Kubernetes建立并運行etcd集群。之后,我們能夠使用一些基本的Etcd命令進行操作。為了更好的了解這個項目,鍵是如何組織的,如何為鍵設置TTLs,或者如何備份所有數(shù)據(jù),參考官方的Etcd repo會是個不錯的選擇:
https://github.com/etcd-io/et...
文章版權歸作者所有,未經(jīng)允許請勿轉載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉載請注明本文地址:http://systransis.cn/yun/32885.html
摘要:守護進程,充當和不同云提供商工具存儲卷負載均衡器等之間的抽象層。除此之外,在上還有一個健康檢查端點,以及一些其他狀態(tài)端點。它就像是節(jié)點上運行著的的網(wǎng)絡代理和負載均衡器一樣,通過在使用實現(xiàn)東西負載均衡。 今晚20:30,Kubernetes Master Class在線培訓第四期《企業(yè)如何構建CI/CD流水線》即將開播,點擊鏈接:http://live.vhall.com/7294658...
摘要:解決了服務器應用快速部署的問題。解決方案是自己裝一個第二點,確保鏡像服務器跑起來。你需要將真機的端口和虛擬機端口進行綁定,這樣可以通過訪問鏡像服務器在真機上的端口,訪問到數(shù)據(jù)庫端口,進入鏡像之中。 關于Docker的基本原理 原理上, 深入淺出Docker 一文講的語言會更科學,我只撿不一定準確但直觀而符合表面理解的一些講一下。 Docker提供了基于操作系統(tǒng)級和應用級虛擬化的應用部署...
摘要:解決了服務器應用快速部署的問題。解決方案是自己裝一個第二點,確保鏡像服務器跑起來。你需要將真機的端口和虛擬機端口進行綁定,這樣可以通過訪問鏡像服務器在真機上的端口,訪問到數(shù)據(jù)庫端口,進入鏡像之中。 關于Docker的基本原理 原理上, 深入淺出Docker 一文講的語言會更科學,我只撿不一定準確但直觀而符合表面理解的一些講一下。 Docker提供了基于操作系統(tǒng)級和應用級虛擬化的應用部署...
閱讀 4286·2021-09-26 10:11
閱讀 2678·2021-07-28 00:37
閱讀 3231·2019-08-29 15:29
閱讀 1193·2019-08-29 15:23
閱讀 3139·2019-08-26 18:37
閱讀 2474·2019-08-26 10:37
閱讀 606·2019-08-23 17:04
閱讀 2354·2019-08-23 13:44