计算圆周率
[root@mini1 bin]# ./run-example SparkPi

[root@mini1 bin]# ./run-example SparkPi 10

[root@mini1 bin]# ./run-example SparkPi 1000

运行spark-shell的两种方式:
1直接运行spark-shell
单机通过多线程跑任务,只运行一个进程叫submit
2运行spark-shell --master spark://mini1:7077
将任务运行在集群中,运行submit在master上,运行executor在worker上
启动
[root@mini1 bin]# ./spark-shell

hdfs
hadoop/sbin/start-dfs.sh

计算wordcount
sc.textFile("/root/words.txt").flatMap(_.split(" ")).map((_,1)).reduceByKey(_+_).collect


升序,降序排列

mapReduce执行流程

原文:https://www.cnblogs.com/feifeicui/p/10999551.html