Spark第乙個程式

2021-10-04 23:16:38 字數 1332 閱讀 6941

linux環境

使用 jupyter notebook作為互動工具,可以用python,scala語言編寫。

具體看 spark 初入門中啟動spark的四種方式.

python語言

在jupyter notebook新建python的notebook。

計算圓周率:

import random

num_samples =

100000000

def inside

(p):

x, y = random.

random()

, random.

random()

return x*x + y*y <

1count = sc.

parallelize

(range(0

, num_samples)).

filter

(inside)

.count()

pi =

4* count / num_samples

print

(pi)

sc.stop

()

執行結果:

3.1417056
scala版本

在notebook 選擇 spylon-kernel,新建notebook。

val data = seq((1

,2,3

),(4

,5,6

),(6

,7,8

),(9

,19,10

))val ds = spark.createdataset(data)

ds.show(

)

結果:

data: seq[

(int, int, int)

]= list((1

,2,3

),(4

,5,6

),(6

,7,8

),(9

,19,10

))ds: org.apache.spark.sql.dataset[

(int, int, int)]=

[_1:

int, _2:

int...

1 more field]

參考:

how to install pyspark and jupyter notebook in 3 minutes

執行第乙個spark程式

執行第乙個spark程式 wordcount 首先在ide中建立工程 如下 將上述工程打包,上傳到集群 使用 spark submit 執行 spark submit name wordcount class cn.sjzc.wordcount master spark hadoop1 7077 e...

第乙個視窗程式

程式截圖 程式 include lresult callback wndproc hwnd,uint,wparam,lparam int winapi winmain hinstance hinstance,hinstance hprevinstance,pstr szcmdline,int icm...

第乙個popcap 程式

一 tips ddimage mmapimg ddimage 上f12,定位到ddimage.h,在vs2008 中ddimage.h tab標籤上alt o 定位到ddimage.cpp 二 vs2008 中c c code generation runtime library 設成multi t...