摘要:近日,騰訊主導(dǎo)的最新版本發(fā)布,為國內(nèi)科技公司邁出了國際開源領(lǐng)域貢獻的重要一步。年發(fā)布,年成為頂級項目。目前在騰訊致力于領(lǐng)導(dǎo)騰訊云大數(shù)據(jù)及人工智能產(chǎn)品研發(fā)工作。
近日,騰訊主導(dǎo)的Apache Hadoop2.8.4最新版本發(fā)布,為國內(nèi)科技公司邁出了國際開源領(lǐng)域貢獻的重要一步。
2006年Apache Hadoop發(fā)布,2008年Hadoop成為Apache頂級項目。在那時,中國移動、百度、淘寶等都已經(jīng)開始使用Hadoop技術(shù)。Hadoop現(xiàn)在早已成為Apache軟件基金會的金牌項目之一。不僅如此,它還孕育了包括HBase、Hive、ZooKeeper等一系列知名Apache頂級項目,它們一開始都是以Apache Hadoop子項目的形式在社區(qū)運作、為開發(fā)者熟知的。
這次騰訊主導(dǎo)發(fā)布的Apache Hadoop2.8.4版本,涉及20多個大大小小的特性和優(yōu)化,清單如下:
負責(zé)這一版本整體進度的Release Manager,是來自騰訊云產(chǎn)品部大數(shù)據(jù)及人工智能產(chǎn)品中心的專家研究員堵俊平,他同時也是Apache Hadoop社區(qū)PMC的成員。
Apache軟件基金會推崇PMC制度,每個開源項目都是一個PMC,即項目管理委員會,可以自行決定技術(shù)發(fā)展方向和社區(qū)運作模式,但需要公開信息,并定期向Apache的董事會匯報,以便董事會監(jiān)督。
成為PMC的成員可是非常不容易的事,必須要一步步“打怪升級”。要實現(xiàn)從一個普通的Developer到PMC Member的跨越,除了碼代碼以外,開源社區(qū)的組織能力也要強,是不是帥呆了?
堵俊平,騰訊T4大數(shù)據(jù)技術(shù)專家,曾任EMC,VMware資深研發(fā)工程師,Hortonworks美國YARN團隊負責(zé)人。深耕云計算,大數(shù)據(jù)方向10余年,在多個社區(qū)均享有極高知名度,包括Apache Hadoop社區(qū)Committer & PMC,并領(lǐng)導(dǎo)hadoop 2.6、2.8等應(yīng)用非常廣泛的社區(qū)release。曾領(lǐng)導(dǎo)開發(fā)多個Hadoop在云平臺上優(yōu)化與拓展的項目與產(chǎn)品。目前在騰訊致力于領(lǐng)導(dǎo)騰訊云大數(shù)據(jù)及人工智能產(chǎn)品研發(fā)工作。
小編采訪了一下這位男神,接下來就讓他給大家講一下,這次新版本發(fā)布過程中的小細節(jié)吧。
Q:很多人可能聽說過“開源”,但了解不多,您可以簡單介紹一下嗎?
A:開源可以理解為“向公眾開放源代碼”。近幾年來熱度不減的大數(shù)據(jù),就是由開源的軟件來驅(qū)動整個產(chǎn)業(yè)生態(tài)的。這里就不得不提到一個里程碑式的開源產(chǎn)品——hadoop:從谷歌的三篇論文,到雅虎的hadoop,開啟了如今的大數(shù)據(jù)時代。
過去的系統(tǒng)軟件主要是由閉源軟件來驅(qū)動的。雖然像操作系統(tǒng)涌現(xiàn)出Linux這樣優(yōu)秀的軟件,但后面的數(shù)據(jù)庫和應(yīng)用服務(wù)器,仍然幾乎都是從閉源產(chǎn)品去驅(qū)動的。
hadoop誕生后的這十年來,一直都是大數(shù)據(jù)生態(tài)的核心,它改變了以往的軟件形式,成為了最主流的開源項目之一?,F(xiàn)在基本上各家數(shù)據(jù)平臺團隊,都是在hadoop生態(tài)系統(tǒng)上小修小改,去支持大數(shù)據(jù)相關(guān)的業(yè)務(wù)系統(tǒng),可以認(rèn)為它是開源的一個標(biāo)準(zhǔn)吧。
Q:與傳統(tǒng)的閉源生態(tài)相比,開源有什么好處呢?
A:首先是避免“重復(fù)發(fā)明輪子”的問題,不同的個人和團體可以在公開的代碼平臺上集體創(chuàng)作,而不是封閉起來做重復(fù)的事情。其次是用戶不必被綁架在特定的軟件平臺上,隨時可以遷移應(yīng)用和數(shù)據(jù)。最后是核心知識產(chǎn)權(quán),比如以前的IOE,不只是沒有“中國芯”的問題,上面的應(yīng)用軟件和系統(tǒng)軟件可能隨時面臨被人封鎖的危險,而開源就不會有這個問題,它完全公開透明。另外,開源也鼓勵公司規(guī)劃長線的技術(shù)投資,而不只是短線的利益操作。
Q:騰訊這次主導(dǎo)阿帕奇社區(qū)hadoop新版本的發(fā)布,在國內(nèi)算是首次嗎?
A:對,以前都是由微軟、Hortonworks和Cloudera等國外大數(shù)據(jù)廠家輪流坐莊,而這個版本是第一次完全由國內(nèi)的公司來支持的。從技術(shù)號召力或者對整個開源社區(qū)的影響力來說,可以鼓勵國內(nèi)的開發(fā)者和公司更積極地參與開源項目貢獻,勇于承擔(dān)更大的責(zé)任,更多地回饋開源社區(qū)。
Q:給整個社會也帶來了哪些積極的影響呢?
A:首先,大數(shù)據(jù)軟件屬于基礎(chǔ)技術(shù),這次平臺是由騰訊做技術(shù)主導(dǎo)的,在國內(nèi)算是一個突破。其次,對于開發(fā)者社區(qū)來說,也是比較可靠的一個社區(qū)、最熱門的項目。最后,對于普通人來說,也是可以從中受益的。因為基礎(chǔ)平臺能力的提高,也伴隨著數(shù)據(jù)處理能力的提高,可以讓大家的生活更方便。大數(shù)據(jù)時代到來之前,可能沒有那么多面向數(shù)據(jù)的業(yè)務(wù),比如地圖業(yè)務(wù)、O2O業(yè)務(wù)、智能推薦系統(tǒng)等等。包括現(xiàn)在極具話題性的AI人工智能,如果沒有大數(shù)據(jù)平臺的進步,也是發(fā)展不起來的。
Q:之前是有技術(shù)難關(guān)的限制嗎?
A:過去十年,中國的互聯(lián)網(wǎng)公司發(fā)展很快,大家都以追求業(yè)務(wù)為主,在技術(shù)或開源方面做得不夠,這是我們相較西方的短板。國內(nèi)很多公司其實也嘗試過開源,但它只有開源的代碼,沒有開源的社區(qū),也就是自己覺得某個產(chǎn)品做得不錯,就把源代碼開放出來而已。
源代碼的開放和開源社區(qū)是兩回事,區(qū)別就是你這個開源的代碼,其它第三方(尤其是你的生態(tài)合作伙伴)有沒有能力來參與。
現(xiàn)在整個大數(shù)據(jù)的熱潮,其實就是被幾款開源的核心軟件所推動的。中國的這些大公司在具備了經(jīng)濟實力之后,也開始以開源為手段想要構(gòu)造一個更好的生態(tài)。這可能需要一個過程,但大家已經(jīng)慢慢意識到這些基礎(chǔ)軟件跟開源結(jié)合的重要性了。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/35945.html
摘要:優(yōu)點開發(fā)成本低,可以配置加速網(wǎng)絡(luò)三分布式文件系統(tǒng)方案常見的分布式文件系統(tǒng)有,等。它們都不是系統(tǒng)級的分布式文件系統(tǒng),而是應(yīng)用級的分布式文件存儲服務(wù)。 一、小應(yīng)用存儲方案 在開發(fā)中上傳文件存儲是個問題,而一般小應(yīng)用開發(fā)會選擇服務(wù)器本地目錄做為存儲地址,通過保存文件的相對路徑來獲取文件,在應(yīng)用不要求高可用的情況下這是一種普遍的方案。 問題: 在每次更新Java版本時,都需要將文件目錄做一次備...
摘要:優(yōu)點開發(fā)成本低,可以配置加速網(wǎng)絡(luò)三分布式文件系統(tǒng)方案常見的分布式文件系統(tǒng)有,等。它們都不是系統(tǒng)級的分布式文件系統(tǒng),而是應(yīng)用級的分布式文件存儲服務(wù)。 一、小應(yīng)用存儲方案 在開發(fā)中上傳文件存儲是個問題,而一般小應(yīng)用開發(fā)會選擇服務(wù)器本地目錄做為存儲地址,通過保存文件的相對路徑來獲取文件,在應(yīng)用不要求高可用的情況下這是一種普遍的方案。 問題: 在每次更新Java版本時,都需要將文件目錄做一次備...
摘要:從用戶成為股東在基金會的天從年開始為的初始版本打補丁,堵俊平已經(jīng)在社區(qū)深耕了近年,年月成為中國第一個的年月,年月榮升。他們有權(quán)選舉董事會,成為董事會選舉的候選人?;饡蓡T對基金會直接負責(zé),在多個項目中做出貢獻,擁有董事會的投票權(quán)。 3月27日,騰訊云大數(shù)據(jù)及人工智能產(chǎn)品研發(fā)的專家研究員堵俊平受邀成為 Apache 軟件基金會Member(Apache Softeware Founda...
閱讀 1082·2021-11-16 11:45
閱讀 2731·2021-09-27 13:59
閱讀 1325·2021-08-31 09:38
閱讀 3156·2019-08-30 15:52
閱讀 1322·2019-08-29 13:46
閱讀 2095·2019-08-29 11:23
閱讀 1653·2019-08-26 13:47
閱讀 2500·2019-08-26 11:54