回答:這個(gè)問題思考了很久,作為過(guò)來(lái)人談一談,建議在看我這篇回答之前先去了解一下數(shù)據(jù)挖掘的概念和定義。在學(xué)習(xí)數(shù)據(jù)挖掘之前你應(yīng)該明白幾點(diǎn):數(shù)據(jù)挖掘目前在中國(guó)的尚未流行開,猶如屠龍之技。數(shù)據(jù)初期的準(zhǔn)備通常占整個(gè)數(shù)據(jù)挖掘項(xiàng)目工作量的70%左右。 數(shù)據(jù)挖掘本身融合了統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)和機(jī)器學(xué)習(xí)等學(xué)科,并不是新的技術(shù)。數(shù)據(jù)挖掘技術(shù)更適合業(yè)務(wù)人員學(xué)習(xí)(相比技術(shù)人員學(xué)習(xí)業(yè)務(wù)來(lái)的更高效)數(shù)據(jù)挖掘適用于傳統(tǒng)的BI(報(bào)表、OLA...
回答:其實(shí)根本就沒有什么數(shù)據(jù)分析師,或者說(shuō),人人都是數(shù)據(jù)分析師。懂我這個(gè)意思嗎?我的文章里,也寫過(guò)很多數(shù)據(jù)行業(yè)的知識(shí),你可以去看看,其實(shí)有時(shí)候想想,你就不一定非得從事這樣的行業(yè)了。就拿數(shù)據(jù)挖掘來(lái)說(shuō)吧,據(jù)我所知,廠商今年都混的不怎么樣,為什么?客戶需求很少,而且都是定制化的,整個(gè)項(xiàng)目的周期很長(zhǎng)。還有就是一個(gè)企業(yè)里,互聯(lián)網(wǎng)公司可能還好一點(diǎn),數(shù)據(jù)分析師根本不需要那么多,你看看ucloud的數(shù)據(jù)分析報(bào)錄比,20...
回答:目前階段大數(shù)據(jù)技術(shù)及體系已經(jīng)逐漸趨于成熟,不再是以概念貫穿的模式,大數(shù)據(jù)越來(lái)越多的被使用,伴隨互聯(lián)網(wǎng)化的發(fā)展更多的企業(yè)信息化已經(jīng)由IT時(shí)代轉(zhuǎn)變?yōu)镈T時(shí)代,以數(shù)據(jù)為核心,用數(shù)據(jù)進(jìn)行決策,基于數(shù)據(jù)驅(qū)動(dòng)企業(yè)的創(chuàng)新與發(fā)展,相信在將來(lái)大數(shù)據(jù)也會(huì)有更廣泛的應(yīng)用空間,對(duì)于大數(shù)據(jù)的理解主要分為以下幾個(gè)層面。1.數(shù)據(jù)來(lái)源:對(duì)于大數(shù)據(jù)時(shí)代而言更多強(qiáng)調(diào)基于業(yè)務(wù)數(shù)據(jù)的沉淀,在一定規(guī)模的數(shù)據(jù)上進(jìn)行進(jìn)一步的分析、處理、轉(zhuǎn)換,...
回答:大數(shù)據(jù)是處理海量數(shù)據(jù)的一種技術(shù),你說(shuō)的寫SQL只能處理結(jié)構(gòu)化數(shù)據(jù),更多的是非結(jié)構(gòu)化數(shù)據(jù)(文本數(shù)據(jù)),和半結(jié)構(gòu)化數(shù)據(jù)。并且通過(guò)SQL處理的數(shù)據(jù)量一般很少,幾個(gè)T就根本不行,大數(shù)據(jù)涉及存儲(chǔ)(存儲(chǔ)級(jí)別為PB級(jí)別),資源調(diào)度(一般是分布式系統(tǒng),不是一臺(tái)機(jī)器),計(jì)算框架(hadoop;storm;spark)這三部分,缺一不可,你說(shuō)的寫SQL只是相當(dāng)于計(jì)算框架(勉強(qiáng)算得上,性能差遠(yuǎn)了)。
回答:這是一個(gè)非常好的問題,作為一名IT從業(yè)者,同時(shí)也在帶大數(shù)據(jù)方向的研究生,所以我來(lái)回答一下這個(gè)問題。首先,從技術(shù)體系結(jié)構(gòu)上來(lái)看,當(dāng)前的大數(shù)據(jù)技術(shù)已經(jīng)趨于成熟了,在數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析、數(shù)據(jù)呈現(xiàn)和數(shù)據(jù)應(yīng)用等方面,已經(jīng)形成了一整套技術(shù)框架,相關(guān)的技術(shù)生態(tài)也在不斷完善當(dāng)中。當(dāng)前大型科技公司也開始逐漸形成自己的大數(shù)據(jù)平臺(tái),不同平臺(tái)也都有自身的技術(shù)特點(diǎn),總的來(lái)說(shuō),當(dāng)前在技術(shù)上已經(jīng)為大數(shù)據(jù)的行業(yè)應(yīng)用創(chuàng)新奠定了基礎(chǔ)...
原文地址: http://blog.52sox.com/essenti... 在大數(shù)據(jù)時(shí)代下,衍生了一些新的工作職位,比如數(shù)據(jù)科學(xué)家、數(shù)據(jù)分析師??粗钦T人的薪資,恨不得能早日踏入這個(gè)行業(yè)。 那么,今天我們來(lái)對(duì)數(shù)據(jù)挖掘進(jìn)行一些基礎(chǔ)性的了解和認(rèn)識(shí)。 在...
云計(jì)算和大數(shù)據(jù)這兩個(gè)詞已經(jīng)更多地被放在一起討論,而從應(yīng)用角度看,大數(shù)據(jù)更能挑動(dòng)用戶的神經(jīng)。目前,并不是所有的企業(yè)都面臨著大數(shù)據(jù)的困擾,但是擁有著幾千萬(wàn)甚至幾億客戶的運(yùn)營(yíng)商,大數(shù)據(jù)所帶來(lái)的問題日益顯現(xiàn)...
...?!巩?dāng)話題轉(zhuǎn)向「算法工程師的招聘」時(shí),TalkingData 首席數(shù)據(jù)科學(xué)家張夏天不免面露難色起來(lái)。而在此之前,談?wù)撈鹚惴ê蛿?shù)據(jù)挖掘等具體業(yè)務(wù)時(shí),他還滔滔不絕、興致勃勃。不只是張夏天,自去年 10 月以來(lái),不止一位技術(shù) Lead...
...身的真正撩妹達(dá)人! 那么現(xiàn)實(shí)中,你是否有見過(guò)真正的數(shù)據(jù)科學(xué)家呢? 數(shù)據(jù)科學(xué)家,一個(gè)大數(shù)據(jù)時(shí)代的新興稱號(hào),被《哈佛商業(yè)評(píng)論》中被譽(yù)為21世紀(jì)最性感的職業(yè),2015年,美國(guó)白宮首次設(shè)立數(shù)據(jù)科學(xué)家的崗位。 他們可能...
看起來(lái)很美很熱鬧的云計(jì)算大數(shù)據(jù),在具體落地時(shí)卻不得不面對(duì)一系列這樣的現(xiàn)實(shí)問題。正如中國(guó)電子學(xué)會(huì)副秘書長(zhǎng)林潤(rùn)華所言:產(chǎn)業(yè)界確實(shí)認(rèn)為這是大的發(fā)展方向,也是非常好的轉(zhuǎn)型機(jī)會(huì),但是用戶還抱著非常審慎的態(tài)度...
大數(shù)據(jù)應(yīng)用已廣泛深入我們生活的方方面面,涵蓋醫(yī)療、交通、金融、教育、體育、零售等各行各業(yè)。 天氣預(yù)測(cè)應(yīng)用案例: 典型的案例即天氣預(yù)測(cè)。各類氣象指征瞬時(shí)發(fā)生,以典型的高頻復(fù)雜的形式出現(xiàn),給各類分析人...
...淫溪谷,盛怒于土囊之口,……DT時(shí)代,未來(lái)已來(lái)——數(shù)據(jù)大爆炸首先要明白大家為何從前幾年開始談大數(shù)據(jù)了?這是一個(gè)基本問題,包含著對(duì)當(dāng)下數(shù)據(jù)現(xiàn)實(shí)的基本認(rèn)識(shí)。一個(gè)不可忽視的事實(shí)是,隨著網(wǎng)絡(luò)和信息技術(shù)的不...
...個(gè)值稱之為損失(loss),我們的目標(biāo)就是使對(duì)所有訓(xùn)練數(shù)據(jù)的損失和盡可能的小。 如果將先前的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的矩陣公式帶入到y(tǒng)p中(因?yàn)橛衵=yp),那么我們可以把損失寫為關(guān)于參數(shù)(parameter)的函數(shù),這個(gè)函數(shù)稱之為損...
ChatGPT和Sora等AI大模型應(yīng)用,將AI大模型和算力需求的熱度不斷帶上新的臺(tái)階。哪里可以獲得...
大模型的訓(xùn)練用4090是不合適的,但推理(inference/serving)用4090不能說(shuō)合適,...
圖示為GPU性能排行榜,我們可以看到所有GPU的原始相關(guān)性能圖表。同時(shí)根據(jù)訓(xùn)練、推理能力由高到低做了...