回答:大數(shù)據(jù)的技術(shù)大數(shù)據(jù)技術(shù)包括:1)數(shù)據(jù)采集: ETL工具負(fù)責(zé)將分布的、異構(gòu)數(shù)據(jù)源中的數(shù)據(jù)如關(guān)系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取到臨時(shí)中間層后進(jìn)行清洗、轉(zhuǎn)換、集成,最后加載到數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市中,成為聯(lián)機(jī)分析處理、數(shù)據(jù)挖掘的基礎(chǔ)。2)數(shù)據(jù)存取: 關(guān)系數(shù)據(jù)庫(kù)、NOSQL、SQL等。3)基礎(chǔ)架構(gòu): 云存儲(chǔ)、分布式文件存儲(chǔ)等。4)數(shù)據(jù)處理: 自然語(yǔ)言處理(NLP,Natural Language Processin...
回答:這個(gè)我有經(jīng)驗(yàn),我來(lái)答一下?????♂?目前在我們數(shù)據(jù)行業(yè)內(nèi)的日常用語(yǔ)中,數(shù)據(jù)分析和數(shù)據(jù)可視化這兩個(gè)術(shù)語(yǔ)似乎已成為同義詞。雖然說(shuō)兩者它都包含數(shù)據(jù)分析的內(nèi)容,但實(shí)際上還是有一定的細(xì)微差別。就比如說(shuō)數(shù)據(jù)分析:它更多的強(qiáng)調(diào)的是一個(gè)邏輯思維能力,強(qiáng)調(diào)的是一個(gè)探索性的過(guò)程,通常從特定的問(wèn)題開(kāi)始。它需要好奇心、尋找答案的欲望和很好的韌性,因?yàn)檫@些答案并不總是容易得到的。而數(shù)據(jù)可視化分析:它就在數(shù)據(jù)分析的基礎(chǔ)上涉...
回答:在大數(shù)據(jù)領(lǐng)域大概有四個(gè)大的工作方向,除了大數(shù)據(jù)平臺(tái)應(yīng)用及開(kāi)發(fā)、大數(shù)據(jù)分析與應(yīng)用和大數(shù)據(jù)平臺(tái)集成與運(yùn)維之外,還有大數(shù)據(jù)平臺(tái)架構(gòu)與研發(fā),除了以上四個(gè)大的工作方向之外,還有一個(gè)工作方向是大數(shù)據(jù)技術(shù)推廣和培訓(xùn),這部分工作目前也有不少人在從事。大數(shù)據(jù)平臺(tái)架構(gòu)與研發(fā)主要的工作內(nèi)容是研發(fā)底層的大數(shù)據(jù)平臺(tái),這部分工作的難度較高,從事這部分工作的研發(fā)級(jí)崗位也并不多?,F(xiàn)在不少技術(shù)研發(fā)團(tuán)隊(duì)都以Hadoop、Spark平...
回答:謝邀~本君自薦一下。我們的產(chǎn)品諸葛io(www.zhugeio.com)可能更偏向于非技術(shù)人員的業(yè)務(wù)分析,比如產(chǎn)品經(jīng)理、市場(chǎng)、運(yùn)營(yíng)人員。從某種意義上也具有可視化分析的特性,但區(qū)別于其他工具的是我們面向互聯(lián)網(wǎng)產(chǎn)品推廣運(yùn)營(yíng)過(guò)程中的分析需求定義了一些分析模型,比如事件、漏斗、自定義留存、粘性、用戶分群等,很多工具可以任意拖拽去做分析,但很多時(shí)候客戶也會(huì)因?yàn)樘`活反而有一定門檻,所以,當(dāng)一些模型被標(biāo)準(zhǔn)化以...
回答:真利益相關(guān),不請(qǐng)自來(lái),人在中國(guó),剛下...算了,在辦公室。帆軟,其實(shí)大家不知道他是國(guó)內(nèi)做數(shù)據(jù)分析產(chǎn)品最好的公司。在企業(yè)數(shù)據(jù)分析領(lǐng)域低調(diào)做了十幾年,入選Gartner市場(chǎng)指南。一開(kāi)始做報(bào)表工具finereport,后來(lái)研發(fā)BI商業(yè)智能finebi,產(chǎn)品打磨了好多年。之后又增值行業(yè)化的數(shù)據(jù)管理解決方案,包括阿米巴經(jīng)營(yíng)管理,數(shù)字化運(yùn)營(yíng)體系搭建項(xiàng)目,很成熟很老牌的廠商。FineReport報(bào)表軟件是一款純...
回答:這個(gè)太范化了吧。大數(shù)據(jù)架構(gòu)選擇的方案就有很多,海量數(shù)據(jù)的即席查詢本省就是業(yè)內(nèi)目前的痛點(diǎn),暫時(shí)沒(méi)有太好的解決方案,kylin等框架也只是一個(gè)折中方案,如果你不是要求海量數(shù)據(jù)分析的秒級(jí)響應(yīng)的話sparkSql、presto等都是不錯(cuò)的方案,分鐘級(jí)別可以返回。
...什么?如果你沒(méi)有辦法把這里面的價(jià)值挖掘出來(lái)的話,你怎么區(qū)分一個(gè)是金礦,一個(gè)是垃圾堆?我存了大量的垃圾能夠有用嗎?當(dāng)然,沒(méi)有用處的。大數(shù)據(jù)面臨的問(wèn)題之一就是如何對(duì)數(shù)據(jù)進(jìn)行快速地采集。數(shù)據(jù)的采集是非常困難...
數(shù)據(jù)怎么樣才能對(duì)人有用?人們整天都在討論大數(shù)據(jù),其實(shí)數(shù)據(jù)本身并不是有用的,必須要經(jīng)過(guò)一定的處理。例如你每天跑步帶個(gè)手環(huán)收集的也是數(shù)據(jù),網(wǎng)上這么多網(wǎng)站也是數(shù)據(jù),簡(jiǎn)稱為Data,數(shù)據(jù)本身并沒(méi)有什么作用,但是數(shù)...
...個(gè)性需求達(dá)到平衡?3.零售企業(yè)每年的銷量要求特別高,怎么能夠通過(guò)云計(jì)算給公司帶來(lái)銷量和利潤(rùn)?4.數(shù)據(jù)的收集、整理,如何能更好的指導(dǎo)經(jīng)營(yíng)贏得市場(chǎng)?5.跨行業(yè)的數(shù)據(jù)交換問(wèn)題。6.零售行業(yè)進(jìn)行上下游打通和平臺(tái)整合,能...
...python的發(fā)展方向,這篇文章也是藏了好久了,群里各種問(wèn)怎么學(xué),大數(shù)據(jù)分析怎么學(xué),爬蟲怎么入門,說(shuō)實(shí)在的,你關(guān)注我號(hào)久一點(diǎn),都知道有那么幾篇文章是專門給入門看的,還有幾篇是資料總結(jié)的。會(huì)找的都能找到。 但是...
Overview:0 引言1 環(huán)境2 模塊準(zhǔn)備3 實(shí)現(xiàn)思路4 小試牛刀5 中試牛刀6 總結(jié) 0 引言 詞云圖,也叫文字云,是對(duì)文本中出現(xiàn)頻率較高的關(guān)鍵詞予以視覺(jué)化的展現(xiàn),詞云圖過(guò)濾掉大量的低頻低質(zhì)的文本信息,使得瀏覽者只要一眼掃...
...兩個(gè)都是典型的一個(gè)好友推薦。 進(jìn)行好友推薦的時(shí)候,怎么給用戶進(jìn)行推薦,首先這兩個(gè)人是非好友的關(guān)系,接著我們?nèi)タ匆幌滤麄儌z潛在共同好友的處理,通過(guò)這種方式去給用戶推送,比方說(shuō)潛在好友數(shù)量多,我就認(rèn)為這兩...
ChatGPT和Sora等AI大模型應(yīng)用,將AI大模型和算力需求的熱度不斷帶上新的臺(tái)階。哪里可以獲得...
大模型的訓(xùn)練用4090是不合適的,但推理(inference/serving)用4090不能說(shuō)合適,...
圖示為GPU性能排行榜,我們可以看到所有GPU的原始相關(guān)性能圖表。同時(shí)根據(jù)訓(xùn)練、推理能力由高到低做了...