CDH是 Cloudera Distribution for Hadoop 的縮寫,是一種用于大數(shù)據(jù)處理的開源軟件平臺(tái)。它是基于 Apache Hadoop 項(xiàng)目的,包含了 Hadoop 的所有組件,并提供了一系列的工具和服務(wù)來幫助用戶更方便地使用 Hadoop。CDH 支持在分布式環(huán)境下運(yùn)行,可以幫助企業(yè)處理大量的數(shù)據(jù),比如日志數(shù)據(jù)、網(wǎng)站流量數(shù)據(jù)等。它還提供了可視化工具,幫助用戶對(duì)數(shù)據(jù)進(jìn)行分析和挖掘。
CDH 版本的 Hadoop大數(shù)據(jù)平臺(tái)的優(yōu)勢(shì)在于:
(1)基于 Apache 協(xié)議 ,100%開源,版本管理清晰。
(2)在兼容性、安全性 、穩(wěn)定性上比 Apache Hadoop 有大幅度的增強(qiáng)。
(3)運(yùn)維簡(jiǎn)單方便 ,對(duì)于 Hadoop 集群提供管理、診斷、監(jiān)控、配置更改等功能,使得運(yùn)維工作非常高效,而且集群節(jié)點(diǎn)越多 ,優(yōu)勢(shì)越明顯。
(4)CDH 提供成體系的文檔、很多大公司的應(yīng)用案例以及商業(yè)支持等。
Cloudera Manager(CM)是由 Cloudera 公司提供的大數(shù)據(jù)組件自動(dòng)部署和監(jiān)控管理工具。 CDH是 Cloudera 公司在 Apache Hadoop 社區(qū)版的基礎(chǔ)上做了商業(yè)化封裝的大數(shù)據(jù)平臺(tái)。 Cloudera Manager以 GUI 的方式管理 Cloudera Hadoop 集群,井提供向?qū)降陌惭b步驟。
CDH 是一種開源軟件平臺(tái),主要用于大數(shù)據(jù)處理。它基于 Apache Hadoop 項(xiàng)目,包含了 Hadoop 的所有組件,比如 Hadoop 分布式文件系統(tǒng)(HDFS)、MapReduce 分布式計(jì)算框架、YARN 資源管理系統(tǒng)等。CDH 還包含了許多其他的工具和服務(wù),比如 Apache Impala 分布式 SQL 查詢引擎、Apache Flume 日志收集系統(tǒng)、Apache Sqoop 數(shù)據(jù)導(dǎo)入/導(dǎo)出工具等。
CDH 可以在分布式環(huán)境下運(yùn)行,支持在多臺(tái)機(jī)器上并行處理大量的數(shù)據(jù)。這對(duì)于處理海量的日志數(shù)據(jù)、網(wǎng)站流量數(shù)據(jù)等非常有用。CDH 還提供了可視化工具,幫助用戶對(duì)數(shù)據(jù)進(jìn)行分析和挖掘,比如 Cloudera Manager 和 Cloudera Navigator。
CDH 是由公司 Cloudera 提供的,它提供了商業(yè)版和社區(qū)版兩種版本。商業(yè)版提供了更多的支持和服務(wù),但是需要付費(fèi)使用。社區(qū)版是完全免費(fèi)的,但是只提供最基本的功能。
CDH 在大數(shù)據(jù)處理領(lǐng)域非常流行,因?yàn)樗峁┝艘惶淄暾慕鉀Q方案,能幫助企業(yè)快速處理大數(shù)據(jù)解決方案。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/128447.html
CDH 包括除 Apache Hadoop 之外的許多其他開源工具和技術(shù),例如 Apache Spark,它是一種用于大規(guī)模數(shù)據(jù)處理的快速靈活的數(shù)據(jù)處理引擎?! DH Spark2 是 Apache Spark 的一個(gè)版本,包含在 Cloudera Distribution for Apache Hadoop (CDH) 中。它是一個(gè)強(qiáng)大而靈活的數(shù)據(jù)處理引擎,非常適合廣泛的數(shù)據(jù)處理任務(wù)...
在CDH集群中,Kerberos常用于為HDFS(Hadoop分布式文件系統(tǒng))、YARN(Yet Another Resource Negotiator)等Hadoop服務(wù)提供安全認(rèn)證。Kerberos 是一種網(wǎng)絡(luò)身份驗(yàn)證協(xié)議,它使用密鑰加密來安全地驗(yàn)證用戶和服務(wù)。使用 Kerberos,用戶必須先使用一組憑據(jù)(通常是用戶名和密碼)向 Hadoop 集群驗(yàn)證自己的身份,然后才能訪問集群上的...
摘要:指令通過將本地工程打包成包,放入到本地倉(cāng)庫中在整合或者發(fā)布環(huán)境下執(zhí)行,將最終版本的包拷貝到遠(yuǎn)程的倉(cāng)庫,使得其他的開發(fā)者或者工程可以共享。比如父在標(biāo)簽中導(dǎo)入依賴,但是子沒有導(dǎo)入該依賴,就會(huì)引用不到相關(guān)類 指令 mvn test mvn installmaven通過install將本地工程打包成jar包,放入到本地倉(cāng)庫中 mvn deploy在整合或者發(fā)布環(huán)境下執(zhí)行,將最終版本的包拷...
閱讀 1232·2023-02-24 11:21
閱讀 1434·2023-02-24 10:55
閱讀 2459·2023-02-24 10:47
閱讀 3158·2023-02-24 10:44
閱讀 905·2023-02-24 10:38
閱讀 632·2022-12-25 19:44
閱讀 770·2022-12-25 19:39
閱讀 887·2022-12-25 19:36