摘要:一什么是大數(shù)據(jù)在互聯(lián)網(wǎng)技術(shù)發(fā)展到至今階段,大量日常,工作等事務(wù)產(chǎn)生的數(shù)據(jù)都已經(jīng)信息化,人類產(chǎn)生的數(shù)據(jù)量相比以前有了爆炸式的增長,以前傳統(tǒng)的數(shù)據(jù)處理技術(shù)已經(jīng)無法勝任,需求催生技術(shù),一套用來處理海量數(shù)據(jù)的技術(shù)應(yīng)運而生,這就是發(fā)數(shù)據(jù)技術(shù)。
一、什么是大數(shù)據(jù)
在互聯(lián)網(wǎng)技術(shù)發(fā)展到至今階段,大量日常,工作等事務(wù)產(chǎn)生的數(shù)據(jù)都已經(jīng)信息化,人類產(chǎn)生的數(shù)據(jù)量相比以前有了爆炸式的增長,以前傳統(tǒng)的數(shù)據(jù)處理技術(shù)已經(jīng)無法勝任,需求催生技術(shù),一套用來處理海量數(shù)據(jù)的技術(shù)應(yīng)運而生,這就是發(fā)數(shù)據(jù)技術(shù)。
梳理海量數(shù)據(jù)的核心技術(shù):
海量數(shù)據(jù)的儲存(分布式)
海量數(shù)據(jù)的運算(分布式)
這些核心技術(shù)的實現(xiàn)是不需要用戶從零開始造輪子的儲存和運算的都已經(jīng)有大量的承受的框架來用。
儲存框架:
HDFS–分布式文件儲存系統(tǒng)
HBase–分布式數(shù)據(jù)庫系統(tǒng)
Kafka – 分布式消息緩存系統(tǒng)(實時流式數(shù)據(jù)處理場景中應(yīng)用廣泛)
運算框架:(要解決的核心問題就是幫用戶將處理邏輯在許多機器上并行執(zhí)行)
Hive – 數(shù)據(jù)倉庫工具:可以接收SQL,翻譯成mapreduce或者spark程序運行
Flume – 數(shù)據(jù)采集
Sqoop – 數(shù)據(jù)遷移
Elisticsearch – 分布式的搜索引擎
…
換個角度說,大數(shù)據(jù)是:
有海量的數(shù)據(jù)
有海量的數(shù)據(jù)進行挖掘的需求,有對海量數(shù)據(jù)進行挖掘的工具(Hadoop、spark等)
大數(shù)據(jù)在現(xiàn)實生活中的具體應(yīng)用
數(shù)據(jù)處理測最典型應(yīng)用:公司的產(chǎn)品運營情況分析
電商推薦系統(tǒng):基于海量的瀏覽行為,購物行為數(shù)據(jù),進行大量的模型的運算,得出各種推薦結(jié)論,一共電商網(wǎng)站頁面來為用戶進行商品推薦,(猜你喜歡)
精準(zhǔn)廣告推送系統(tǒng):基于海量的互聯(lián)網(wǎng)用戶的各類數(shù)據(jù),統(tǒng)計分析,進行用戶畫像(得到用戶的各種屬性標(biāo)簽),然后可以為廣告主進行有針對性的進準(zhǔn)的廣告投放。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/125919.html
摘要:功能簡介功能簡介功能簡介本篇目錄一功能點概述一功能點概述二支持的大數(shù)據(jù)生態(tài)服務(wù)二支持的大數(shù)據(jù)生態(tài)服務(wù)一功能點概述一功能點概述一功能點概述支持友好的瀏覽器管理控制臺支持集群節(jié)點管理,如節(jié)點監(jiān)控資源使用率節(jié)點狀態(tài)等支持集群大數(shù)據(jù)服務(wù)的服 功能簡介本篇目錄一、功能點概述二、支持的大數(shù)據(jù)生態(tài)服務(wù)一、功能點概述支持友好的Web瀏覽器管理控制臺;支持集群節(jié)點管理,如節(jié)點監(jiān)控、資源使用率、節(jié)點狀態(tài)等;支持...
摘要:項目地址前言大數(shù)據(jù)技術(shù)棧思維導(dǎo)圖大數(shù)據(jù)常用軟件安裝指南一分布式文件存儲系統(tǒng)分布式計算框架集群資源管理器單機偽集群環(huán)境搭建集群環(huán)境搭建常用命令的使用基于搭建高可用集群二簡介及核心概念環(huán)境下的安裝部署和命令行的基本使用常用操作分區(qū)表和分桶表視圖 項目GitHub地址:https://github.com/heibaiying... 前 言 大數(shù)據(jù)技術(shù)棧思維導(dǎo)圖 大數(shù)據(jù)常用軟件安裝指...
摘要:產(chǎn)品概述產(chǎn)品概述產(chǎn)品概述本篇目錄產(chǎn)品特點產(chǎn)品特點功能簡介功能簡介操作指南操作指南開發(fā)指南開發(fā)指南任務(wù)調(diào)度任務(wù)調(diào)度產(chǎn)品價格產(chǎn)品價格簡稱,是推出的云上智能化輕量級的大數(shù)據(jù)基礎(chǔ)服務(wù)平臺,能夠幫您快速構(gòu)建起大數(shù)據(jù)的分析處理能力。 產(chǎn)品概述本篇目錄產(chǎn)品特點功能簡介操作指南開發(fā)指南任務(wù)調(diào)度產(chǎn)品價格UCloud Smart Data Platform(簡稱 USDP),是 UCloud 推出的云上智能化、...
閱讀 3580·2023-04-25 20:09
閱讀 3770·2022-06-28 19:00
閱讀 3115·2022-06-28 19:00
閱讀 3129·2022-06-28 19:00
閱讀 3230·2022-06-28 19:00
閱讀 2917·2022-06-28 19:00
閱讀 3104·2022-06-28 19:00
閱讀 2703·2022-06-28 19:00