成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

大數(shù)據(jù)和云計算是天作之合

Simon_Zhou / 832人閱讀

摘要:首席數(shù)據(jù)科學家亞馬遜云計算首席數(shù)據(jù)科學家認為,大數(shù)據(jù)和云計算是天作之合,云計算平臺的海量低成本的數(shù)據(jù)存儲與處理資源為大數(shù)據(jù)分享提供了可能。大數(shù)據(jù)尤其是和云計算年紀相仿,相輔相成,可謂天作之合。

AWS chief data scientist matt-wood

 ???????????????????????????????????????  AWS首席數(shù)據(jù)科學家Matt Wood

  亞馬遜云計算AWS首席數(shù)據(jù)科學家Matt Wood認為,大數(shù)據(jù)和云計算是天作之合,云計算平臺的海量低成本的數(shù)據(jù)存儲與處理資源為大數(shù)據(jù)分享提供了可能。

  Matt Wood一天的工作不僅僅是幫亞馬遜員工完成數(shù)據(jù)淘金工作,他還需要設(shè)法取悅亞馬遜的客戶。Wood幫助AWS的用戶利用亞馬遜云計算資源搭建大數(shù)據(jù)架 構(gòu),然后根據(jù)客戶需求設(shè)計產(chǎn)品,例如數(shù)據(jù)管道服務(wù)(Data Pipeline Service)和Redshift數(shù)據(jù)倉庫服務(wù)。

  關(guān)于基于云計算的大數(shù)據(jù)服務(wù)的發(fā)展趨勢,記者采訪了Matt Wood,會談的亮點摘錄如下:

  從資源優(yōu)先到業(yè)務(wù)優(yōu)先

  不久前,計算機科學家已經(jīng)掌握了今日之所謂數(shù)據(jù)科學的理論和概念,但當時的資源有限,能夠進行的數(shù)據(jù)分析類型也很有限。

  如今,數(shù)據(jù)存儲和處理資源已經(jīng)極大豐富和廉價,這使得大數(shù)據(jù)的概念成為可能。而云計算則進一步降低了數(shù)據(jù)存儲和處理資源的成本,容量也更大。這意味著數(shù)據(jù)分析的觀念正在經(jīng)歷一次重大的范型轉(zhuǎn)移,從過去資源優(yōu)先轉(zhuǎn)向以企業(yè)需求為先。

  如果他們能夠突破傳統(tǒng)的數(shù)據(jù)采樣和處理模式,一個人就能專注于要做的事情,因為資源太多了。例如,點評網(wǎng)站Yelp允許開發(fā)者無限制使用Elastic MapReduce,這樣開發(fā)者就不必為了測試某個瘋狂想法而走繁瑣的資源申請流程。Yelp能夠在一年前發(fā)現(xiàn)網(wǎng)站流量的移動化趨勢并及時開展移動業(yè)務(wù)都得益于此。

  數(shù)據(jù)的問題不都是規(guī)模

  總的來說,客戶的數(shù)據(jù)問題并不都是如何更低的成本存儲更多的數(shù)據(jù),你不一定需要1PB的數(shù)據(jù)才能分析出誰是你社交游戲的用戶。

  實際上,能夠無限制的存儲和處理數(shù)據(jù)本身會產(chǎn)生新的問題。公司希望能夠保存所有產(chǎn)生的數(shù)據(jù),這會導(dǎo)致復(fù)雜性增加。從亞馬遜的S3和DynamoDB服務(wù)到企業(yè)數(shù)據(jù)中心的物理服務(wù)器,當數(shù)據(jù)在所有的庫中都堆積如山時,數(shù)據(jù)轉(zhuǎn)移和復(fù)用的難度也會變得很大。

  AWS新推出的數(shù)據(jù)管道服務(wù)(Data Pipeline Service)就是為了解決這個問題。管道非常復(fù)雜,從運行一個簡單的數(shù)據(jù)業(yè)務(wù)邏輯到在Elastic MapReduce上運行所有的批任務(wù),數(shù)據(jù)管道服務(wù)的目的就是將數(shù)據(jù)的移動和處理自動化,用戶無需自己建立這些工作流程并手動運行。

aws_data_pipeline_console

  ???????????????????????????????????? AWS數(shù)據(jù)管道服務(wù)控制臺

  把大數(shù)據(jù)快遞給云計算

  人們有時候會質(zhì)疑云計算與大數(shù)據(jù)任務(wù)之間的相關(guān)度,因為如果將企業(yè)內(nèi)部系統(tǒng)產(chǎn)生的數(shù)據(jù)都上傳到云端,由于受到網(wǎng)速限制,數(shù)據(jù)規(guī)模越大,上傳的時間就越長。為了解決這個問題,亞馬遜想盡各種辦法,包括與Aspera合作,甚至與那些研究在互聯(lián)網(wǎng)上快速轉(zhuǎn)移大文件(Wood說見過700MB/秒的技術(shù))的開源項目合作。此外,亞馬遜還取消了傳入數(shù)據(jù)的收費,并開啟了并行上傳功能。此外亞馬遜還與數(shù)據(jù)中心運營者合作啟動了直連項目(Direct Connect Program),為亞馬遜AWS設(shè)施提供專線連接。

  最后,如果客戶的數(shù)據(jù)量實在太大,網(wǎng)速又不夠快,還可以直接將存有數(shù)據(jù)的硬盤快遞給亞馬遜。

  協(xié)作是未來趨勢

  當數(shù)據(jù)遷移到云端后,就開啟了一種全興的協(xié)作方式,研究人員,乃至整個行業(yè)都能訪問和分享這些過去因體量太大而無法移動的數(shù)據(jù)。一些產(chǎn)生海量數(shù)據(jù)的行業(yè)已經(jīng)開始在云端分享數(shù)據(jù),例如AWS上已經(jīng)托管的1000個基因組項目。

dnanexus

  ??????????????????????????????????????????DNAnexus的云架構(gòu)

  遺傳學項目從云計算中受益匪淺,雖然AWS上的1000個基因組項目的數(shù)據(jù)庫只有200TB,但是單個項目很少有足夠的預(yù)算存儲這么多數(shù)據(jù)并與同事分享。即使在資金充裕的醫(yī)藥領(lǐng)域,亞馬遜CTO Werner Vogels曾說過,醫(yī)藥企業(yè)正在使用云計算分享數(shù)據(jù),企業(yè)們也無需花費時間和金錢"重新發(fā)明車輪"。

  不再需要超級計算機?

  Wood對亞馬遜高性能計算客 戶在AWS平臺上的工作印象深刻——這些工作過去必須依賴超級計算機才能完成。這要感謝AWS的合作伙伴Cycle Computing,維斯康辛大學如今在AWS上能夠一周內(nèi)完成過去需要116年的計算任務(wù)。AWS正在不斷增加實例的配置和性能,從較大的250GB內(nèi) 存到GPU集群計算實例,AWS都將提供。出于成本的考慮,AWS目前僅在一部分市場提供集群計算實例和Elastic MapReduce。

  如今很多運行數(shù)據(jù)密集型工作負載的企業(yè)都開始將目光投向云計算。大數(shù)據(jù)(尤其是Hadoop)和云計算年紀相仿,相輔相成,可謂天作之合。

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/4039.html

相關(guān)文章

  • 計算數(shù)據(jù):成功組合指南

    摘要:云和大數(shù)據(jù)也不例外。最終觀點基于以上考慮建立一套固有的基礎(chǔ)架構(gòu),你將會看到大數(shù)據(jù)和云之間是一種天作之合的組合。 在2013年三月音樂電影藝術(shù)節(jié)上,Motley Fool的Tim Byers說過:在很多方面,云和大數(shù)據(jù)越來越密不可分且功能相似-云資源用來支撐大數(shù)據(jù)的存儲及項目,而且大數(shù)據(jù)相對于云來說是一個龐大的業(yè)務(wù)案例。大數(shù)據(jù)和云技術(shù)的最終聯(lián)姻,必定是天作之合。 ??? 聽起來雖然浪漫,但我們...

    XBaron 評論0 收藏0
  • DevOps、敏捷開發(fā)、云計算,三劍客的小時代

    摘要:前言在開發(fā)和創(chuàng)新領(lǐng)域中,敏捷開發(fā)以及云計算終于突破了布道階段逐步成為主流,本篇文章講述將三種模式結(jié)合在一起所帶來的巨大收益。敏捷開發(fā)是應(yīng)用反映體系,如應(yīng)用必須反映業(yè)務(wù)需求,在快速的基礎(chǔ)上進行測試。 前言 在開發(fā)和創(chuàng)新領(lǐng)域中,DevOps、敏捷開發(fā)以及云計算終于突破了布道階段逐步成為主流,本篇文章講述將三種模式結(jié)合在一起所帶來的巨大收益。 隨著數(shù)字化的快速發(fā)展,整個世界都在全方位轉(zhuǎn)型,過...

    LiangJ 評論0 收藏0
  • 使用 Solid 私有化存儲 IPFS 文件哈希值

    摘要:我們想要解決的問題是,如何私有化存儲文件的哈希值。解決哈希值的泄漏有兩種方案自建私有節(jié)點。同理,定義了的哈希值為該哈希來自于的某個文件。這樣用戶在使用賬號登錄之后我們就可以讀取用戶的文件哈希值列表,然后從網(wǎng)絡(luò)中拉取文件了。 背景 星際文件系統(tǒng) IPFS(InterPlanetary File System)是一個面向全球的、點對點的分布式文件系統(tǒng),目標是為了補充(甚至是取代)目前統(tǒng)治互...

    sunnyxd 評論0 收藏0
  • JavaScript與WebAssembly進行比較

    摘要:目前,是圍繞和用例設(shè)計的。多線程在單個線程上運行。目前不支持多線程。 本文由云+社區(qū)發(fā)表作者:QQ音樂前端團隊 在識別和描述核心元素的過程中,我們分享了構(gòu)建SessionStack時使用的一些經(jīng)驗法則,這是一個輕量級但健壯且高性能的JavaScript應(yīng)用程序,以幫助用戶實時查看和重現(xiàn)其Web應(yīng)用程序的缺陷。 這次我們來分析WebAssembly的工作原理,以及在如下幾個方面和Ja...

    IntMain 評論0 收藏0
  • JavaScript與WebAssembly進行比較

    摘要:目前,是圍繞和用例設(shè)計的。多線程在單個線程上運行。目前不支持多線程。 本文由云+社區(qū)發(fā)表作者:QQ音樂前端團隊 在識別和描述核心元素的過程中,我們分享了構(gòu)建SessionStack時使用的一些經(jīng)驗法則,這是一個輕量級但健壯且高性能的JavaScript應(yīng)用程序,以幫助用戶實時查看和重現(xiàn)其Web應(yīng)用程序的缺陷。 這次我們來分析WebAssembly的工作原理,以及在如下幾個方面和Ja...

    617035918 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<