首页 > 其他 > 详细

spark源码编译

时间:2019-03-06 10:17:34      阅读:129      评论:0      收藏:0      [点我收藏+]

编译环境准备

      1. 安装JDK1.8并配置环境变量
      2. 安装maven并配置环境变量

下载spark源码并解压

[root@MySQL ~]# wget https://archive.apache.org/dist/spark/spark-2.4.0/spark-2.4.0.tgz

[root@MySQL ~]# tar zxvf spark-2.4.0.tgz 

[root@MySQL ~]# cd spark-2.4.0

修改配置

[root@MySQL ~]# cd spark-2.4.0/dev

修改文件make-distribution.sh

添加内容

VERSION=2.4.0

SCALA_VERSION=2.12.8

SPARK_HADOOP_VERSION=2.6.0-cdh5.14.0

SPARK_HIVE=1

 

注释掉以下内容

#VERSION=$("$MVN" help:evaluate -Dexpression=project.version $@ 2>/dev/null | grep -v "INFO" | tail -n 1)

#SCALA_VERSION=$("$MVN" help:evaluate -Dexpression=scala.binary.version $@ 2>/dev/null
#    | grep -v "INFO"
#    | tail -n 1)

#SPARK_HADOOP_VERSION=$("$MVN" help:evaluate -Dexpression=hadoop.version $@ 2>/dev/null
#    | grep -v "INFO"
#    | tail -n 1)

#SPARK_HIVE=$("$MVN" help:evaluate -Dexpression=project.activeProfiles -pl sql/hive $@ 2>/dev/null
#    | grep -v "INFO"
#    | fgrep --count "<id>hive</id>";\

# Reset exit status to 0, otherwise the script stops here if the last grep finds nothing
# because we use "set -o pipefail"

#    echo -n)

添加maven编译库,修改pom.xml文件

修改Hadoop、flume以及zookeeper的版本

<hadoop.version>2.6.0-cdh5.14.0</hadoop.version>

<flume.version>1.6.0-cdh5.14.0</flume.version>

<zookeeper.version>3.4.5-cdh5.14.0</zookeeper.version>

添加CDH以及阿里云的仓库地址

<repository>

<id>cloudera</id>

<url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>

</repository>

<repository>

<id>aliyun</id>

<name>aliyun</name>

<url>http://maven.aliyun.com/nexus/content/groups/public/</url>

<layout>default</layout>

<releases>

<enabled>true</enabled>

<updatePolicy>never</updatePolicy>

</releases>

<snapshots>

<enabled>true</enabled>

<updatePolicy>never</updatePolicy>

</snapshots>

</repository>

添加pluginRepository

<pluginRepository>

<id>cloudera</id>

<url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>

</pluginRepository>

执行编译命令

[root@MySQL ~]# cd spark-2.4.0/

[root@MySQL ~]# export MAVEN_OPTS="-Xmx4g -XX:ReservedCodeCacheSize=1024m"

[root@MySQL ~]# ./dev/make-distribution.sh --name 2.6.0-cdh5.14.0 --tgz  -Pyarn -Phadoop-2.6 -Phive -Phive-thriftserver -Dhadoop.version=2.6.0-cdh5.14.0 -DskipTests

spark源码编译

原文:https://www.cnblogs.com/starzy/p/10481122.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!