成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

到處是map、flatMap,啥意思?

番茄西紅柿 / 1415人閱讀

摘要:中使用那一套,線程的速度,你知道的而對于分布式數(shù)據(jù)流來說,本來就是并行的,這種參數(shù)意義就不大了。函數(shù)種類一般作用在數(shù)據(jù)流上的函數(shù),會分為兩類。中的程序是實現(xiàn)在數(shù)據(jù)流上的??梢钥醋魇堑母氯罩?,數(shù)據(jù)流中的每一個記錄對應(yīng)數(shù)據(jù)庫中的每一次更新。

最近入職一個有趣的年輕同事,提交了大量大量的代碼。翻開git記錄一看,原來是用了非常多的java8的語法特性,重構(gòu)了代碼。用的最多的,就是mapflatMap之類的。 但是其他小伙伴不愿意了,雖然有的人感覺代碼變的容易懂了,但有更多的人感覺代碼變的很晦澀。 那感覺就像是:脫了褲子放屁,多此一舉。

這些函數(shù)的作用域,根據(jù)級別,我覺得可以分為三類。簡直是無所不在。

不要過分使用

我也不知道這些函數(shù)是從什么時候流行起來的,但它們與函數(shù)編程的關(guān)系肯定是非常密切的。好像是2004年的Scala開始的。

沒什么神奇的,它們?nèi)渴钦Z法糖,作用是讓你的程序更簡潔。你要是想,完全可以用多一點的代碼去實現(xiàn)。不要為了炫技刻意去使用,物極必反,用不好的話,產(chǎn)生的效果會是非常負(fù)面的。比如java,它并不是一門函數(shù)編程語言,那么lambda就只是一種輔助;而你用java那一套去寫Lisp代碼的話,也只會不倫不類。

但語言還是要融合的,因為潮流就是這樣。不去看他們背后的設(shè)計,我們僅從api的語義表象,橫向看一下它們所表達(dá)的東西。

我們首先看一下其中的共性(注意:邏輯共性,并不適合所有場景),然后拿幾個典型的實現(xiàn),看一下在這個星球上,程序員們的表演。

這些抽象的概念

這些函數(shù)的作用對象,據(jù)說是一種稱之為流的東西。那到底是一種什么東西呢?請原諒我用一些不專業(yè)的話去解釋。

不論是在語言層面還是分布式數(shù)據(jù)結(jié)構(gòu)上,它其實是一個簡單的數(shù)組。它有時候真的是一個簡單的數(shù)組,有時候是存在于多臺機(jī)器的分布式數(shù)組。在下文中,我們統(tǒng)稱為數(shù)組流

我們簡單分為兩類。

語言層面的:比如Java的Stream
分布式層面的:比如Spark的RDD

它們都有以下幾個比較重要的點。

函數(shù)可以作為參數(shù)

C語言當(dāng)然是沒問題的,可以把函數(shù)作為指針傳入。但在不久之前,在Java中,這還得繞著彎子去實現(xiàn)(使用java概念中的Class去模擬函數(shù),你會見到很多Func1、Func0這樣奇怪的java類)。

函數(shù)作參數(shù),是使得代碼變得簡潔的一個必要條件。我們通常的編程方法,大多是順序執(zhí)行一些操作。

array = new Array()
array = func1(array)
if(func2(array)){
    array = func3(array)
}
array = func4(array)

而如果函數(shù)能夠當(dāng)參數(shù),我就能夠盡量的將操作平鋪。最終,還是要翻譯成上面的語句進(jìn)行執(zhí)行的。

array = new Array()
array.stream()
.map(func1)
.filter(func2)
.flatMap(func3)
.sorted(func4)
...

編程模式完全變了,函數(shù)也有了語義。

sequential & parallel

如果我們的數(shù)組流太大,對于單機(jī)來說,就有順序處理和并行處理兩種方式。

通常,可以通過parallel函數(shù)進(jìn)入并行處理模式。對于大多數(shù)本地操作,開了并行不見得一定會快。 java中使用ForkJoin那一套,線程的速度,你知道的...

而對于分布式數(shù)據(jù)流來說,本來就是并行的,這種參數(shù)意義就不大了。

函數(shù)種類

一般作用在數(shù)據(jù)流上的函數(shù),會分為兩類。

轉(zhuǎn)換。Transformation
動作。Action

轉(zhuǎn)換,典型的特點就是lazy。 只有action執(zhí)行的時候,才會真正參與運(yùn)算。所以,你可以認(rèn)為這些轉(zhuǎn)換動作是一套被緩沖的操作。典型的函數(shù)如:map、flatMap等。它們就像烤串一樣被串在一起,等著被擼。

動作。真正觸發(fā)代碼的運(yùn)行,上面的一系列轉(zhuǎn)換,也會像開了閘的洪水一樣,一瀉而下。典型的如reduce函數(shù),就是這種。

以上的描述也不盡然,比如python的map,執(zhí)行后就可以輸出結(jié)果。這讓人很沒面子啊。

map & reduce

談到map和reduce,大家就不約而同的想到了hadoop。然而,它不僅僅是大數(shù)據(jù)中的概念。

對于它倆的概念,我們僅做下面兩行介紹。

map

將傳入的函數(shù)依次作用到序列的每個元素,并把結(jié)果作為新的數(shù)組流返回。

reduce

reduce類似于一個遞歸的概念。最終會歸約成一個值??纯催@個公式:)

reduce([p1,p2,p3,p4],fn) = reduce([fn(p2,p4),fn(p1,p3)])

具體還是看谷歌的經(jīng)典論文吧。

《MapReduce: Simplified Data Processing on Large Clusters》 ai.google/research/pu…

你能訪問么?:)

map & flatMap

這兩個函數(shù)經(jīng)常被使用。它們有如下區(qū)別:

map

數(shù)組流中的每一個值,使用所提供的函數(shù)執(zhí)行一遍,一一對應(yīng)。得到元素個數(shù)相同的數(shù)組流。

flatMap

flat是扁平的意思。它把數(shù)組流中的每一個值,使用所提供的函數(shù)執(zhí)行一遍,一一對應(yīng)。得到元素相同的數(shù)組流。只不過,里面的元素也是一個子數(shù)組流。把這些子數(shù)組合并成一個數(shù)組以后,元素個數(shù)大概率會和原數(shù)組流的個數(shù)不同。

程序員們的表演 java8種的Stream

java8開始,加入了一個新的抽象,一個稱之為流的東西:Stream。配合lambda語法,可以使代碼變的特別的清爽、干凈(有木有發(fā)現(xiàn)都快成了Scala了)。

一個非常好的向?qū)В?stackify.com/streams-gui…

Spark的RDD操作

spark的核心數(shù)據(jù)模型就是RDD,是一個有向無環(huán)圖。它代表一個不可變、可分區(qū)、其內(nèi)元素可并行計算的集合。 它是分布式的,但我們可以看下一個WordCount的例子。

JavaRDD textFile = sc.textFile("hdfs://...");
JavaPairRDD counts = textFile
    .flatMap(s -> Arrays.asList(s.split(" ")).iterator())
    .mapToPair(word -> new Tuple2<>(word, 1))
    .reduceByKey((a, b) -> a + b);
counts.saveAsTextFile("hdfs://...");

多么熟悉的Api啊,你一定在Hadoop里見過。

Flink 的 DataStream

Flink程序是執(zhí)行分布式集合轉(zhuǎn)換(例如,filtering, mapping, updating state, joining, grouping, defining windows, aggregating)的常規(guī)程序。Flink中的DataStream程序是實現(xiàn)在數(shù)據(jù)流上的transformation。

我們同樣看一下它的一段代碼。

DataStream> counts =
// split up the lines in pairs (2-tuples) containing: (word,1)
text.flatMap(new Tokenizer())
// group by the tuple field "0" and sum up tuple field "1"
.keyBy(0).sum(1);
kafka stream的操作

kafka已經(jīng)變成了一個分布式的流式計算平臺。他抽象出一個KStreamKTable,與Spark的RDD類似,也有類似的操作。

KStream可以看作是KTable的更新日志(changlog),數(shù)據(jù)流中的每一個記錄對應(yīng)數(shù)據(jù)庫中的每一次更新。

我們來看下它的一段代碼。

KTable wordCounts = textLines
.flatMapValues(value -> Arrays.asList(value.toLowerCase().split("W+")))
.groupBy((key, value) -> value)
.count();
wordCounts.toStream().to("streams-wordcount-output", Produced.with(stringSerde, longSerde));
RxJava

RxJava是一個基于觀察者模式的異步任務(wù)框架,經(jīng)常看到會被用到Android開發(fā)中(服務(wù)端采用的也越來越多)。

RxJava再語言層面進(jìn)行了一些創(chuàng)新,有一部分忠實的信徒。

語言層面的lambda

當(dāng)然,對Haskell這種天生的函數(shù)編程語言來說,是自帶光環(huán)的。但其他的一些語言,包括腳本語言,編譯性語言,也吸收了這些經(jīng)驗。

它們統(tǒng)稱為lambda。

Python

作為最流行的腳本語言,python同樣也有它的lambda語法。最基本的map、reduce、filter等函數(shù)同樣是存在的。

JavaScript

js也不能拉下,比如Array.prototype.*()等。它該有的,也都有了。

End

另外還有很多很多,就不一一羅列了。話說,這些函數(shù)可以申請專利么?我很喜歡,雖然我很少用。

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/7156.html

相關(guān)文章

  • 到處map、flatMap,意思?

    摘要:中使用那一套,線程的速度,你知道的而對于分布式數(shù)據(jù)流來說,本來就是并行的,這種參數(shù)意義就不大了。函數(shù)種類一般作用在數(shù)據(jù)流上的函數(shù),會分為兩類。中的程序是實現(xiàn)在數(shù)據(jù)流上的??梢钥醋魇堑母氯罩?,數(shù)據(jù)流中的每一個記錄對應(yīng)數(shù)據(jù)庫中的每一次更新。最近入職一個有趣的年輕同事,提交了大量大量的代碼。翻開git記錄一看,原來是用了非常多的java8的語法特性,重構(gòu)了代碼。用的最多的,就是map、flatM...

    番茄西紅柿 評論0 收藏0
  • 到處map、flatMap,意思?

    摘要:中使用那一套,線程的速度,你知道的而對于分布式數(shù)據(jù)流來說,本來就是并行的,這種參數(shù)意義就不大了。函數(shù)種類一般作用在數(shù)據(jù)流上的函數(shù),會分為兩類。中的程序是實現(xiàn)在數(shù)據(jù)流上的??梢钥醋魇堑母氯罩?,數(shù)據(jù)流中的每一個記錄對應(yīng)數(shù)據(jù)庫中的每一次更新。最近入職一個有趣的年輕同事,提交了大量大量的代碼。翻開git記錄一看,原來是用了非常多的java8的語法特性,重構(gòu)了代碼。用的最多的,就是map、flatM...

    xuxueli 評論0 收藏0
  • 我為什么不再推薦RxJava

    摘要:來總結(jié)一下我遇到的坑,或者說我為什么不在推薦使用。但是功利的看,在解決異步處理這個問題上,的確是投入高,收獲少。這種在輕量級應(yīng)用,或者一些小型異步處理比如數(shù)據(jù)埋點等等行為中,都顯得過于龐大。距離上一次更新也有一段時間了,其實這篇文章我早就想寫,礙于一直沒來得及總結(jié)(懶)。所以一直沒有成文。來總結(jié)一下我RxJava遇到的坑,或者說我為什么不在推薦使用RxJava。 相信熟悉或者關(guān)注我的朋友,絕...

    zhangxiangliang 評論0 收藏0
  • 【Android】RxJava的使用(三)轉(zhuǎn)換——map、flatMap

    摘要:前兩篇的使用一基本用法的使用二介紹了的基本用法,對還不了解的請先看以上兩篇。這篇為大家講解中和的使用。注意對這些發(fā)射的數(shù)據(jù)做的是合并操作,因此它們可能是交錯的。如果要保證順的的話,可以使用。其他操作符除了和之外,還有其他操作符以供使用。 前兩篇Android RxJava的使用(一)基本用法、Android RxJava的使用(二)Action介紹了RxJava的基本用法,對Rxjav...

    caozhijian 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<