成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

Spark 學(xué)習(xí)筆記

zhoutk / 2476人閱讀

摘要:安裝從官網(wǎng)下載最新版本的發(fā)布。安裝完成后可以使用來測試是否安裝成功。在解壓后的目錄使用第一個程序是分析日志,中的。代碼如下中的所有轉(zhuǎn)換都是惰性的,只有發(fā)生一個要求返回結(jié)果給的動作時,這些轉(zhuǎn)換才會被執(zhí)行。資源官網(wǎng)知乎精華答案編程指南版

安裝

從官網(wǎng)下載最新版本的發(fā)布。目前是1.1.0

安裝Java和JDK。安裝完成后可以使用java -version來測試是否安裝成功。

在spark解壓后的目錄使用./sbt/sbt --assembly

Hello World
第一個程序是分析Nginx日志,中的http response code。代碼如下:

from pyspark import SparkContext

logFile = "20141010.log"

sc = SparkContext("local", "Hello Spark")
logData = sc.textFile(logFile).cache()

counts = logData.map(lambda line: line.split()[8]).map(lambda word: (word, 1)).reduceByKey(lambda a, b: a + b)

counts.saveAsTextFile("spark_results")

Debug Shell

./spark-1.1.0/bin/pyspark

Submit File

./bin/spark-submit  --master local[4]   SimpleApp.py

Notes

Spark中的所有轉(zhuǎn)換都是惰性的,只有發(fā)生一個要求返回結(jié)果給Driver的動作時,這些轉(zhuǎn)換才會被執(zhí)行。

資源
Spark官網(wǎng)
CSDN Spark
知乎精華答案
Spark編程指南(Python)版

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/39089.html

相關(guān)文章

  • Spark學(xué)習(xí)筆記之相關(guān)記錄

    摘要:編程指南例子集群模式與如何部署集群模式提交部署應(yīng)用如何監(jiān)控算子如何配置,有哪些配置選項配置大全提示默認(rèn)端口端口調(diào)優(yōu) 編程指南:http://spark.apache.org/docs/... ApiDoc: http://spark.apache.org/docs/... 0、例子 http://spark.apache.org/examp... 1、集群模式與如何部署? 集...

    daydream 評論0 收藏0
  • Spark綜合學(xué)習(xí)筆記(三)搜狗搜索日志分析

    摘要:學(xué)習(xí)致謝一數(shù)據(jù)數(shù)據(jù)網(wǎng)站二需求針對用戶查詢?nèi)罩緮?shù)據(jù)中不同字段,使用讀取日志數(shù)據(jù),封裝到數(shù)據(jù)集中,調(diào)用函數(shù)和函數(shù)進(jìn)行處理不同業(yè)務(wù)統(tǒng)計分析三分詞工具測試使用比較流行好用的中文分區(qū)面向生產(chǎn)環(huán)境的自然語言處理工具包,是由一系列模 ...

    AZmake 評論0 收藏0

發(fā)表評論

0條評論

zhoutk

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<