首页 > 编程语言 > 详细

Spark --jars 依赖包的优先级顺序

时间:2019-12-31 15:17:01      阅读:465      评论:0      收藏:0      [点我收藏+]

Spark 依赖包来源
我们知道Spark application运行加载依赖有三个地方:

SystemClasspath -- Spark安装时候提供的依赖包
Spark-submit --jars 提交的依赖包
Spark-submit --config "spark.{driver/executor}.extraClassPath=someJar"提交的依赖包
 

Spark 依赖包优先级
三者的优先级顺序是怎样的呢?

我通过测试发现优先级如下:

1. spark-submit --config "spark.{driver/executor}.extraClassPath=someJar"提交的依赖包

2. SystemClasspath -- Spark安装时候提供的依赖包

3. spark-submit --jars 提交的依赖包

 

三者用途:
spark.{driver/executor}.extraClassPath 优先级最高,一般有相同jar但是版本不同,需要解决冲突时使用;

SystemClasspath 系统安装的包,默认优先使用环境的包,这样更加稳定安全。

spark-submit --jars 在默认spark环境里没有需要的包时,自己上传提供。

 

总结:
A)在我们提交一个spark2 程序时,系统没有的包--jars 提交;

B)在我们需要和系统中已有的包的不同版本时,使用spark.{driver/executor}.extraClassPath来指定。

Spark --jars 依赖包的优先级顺序

原文:https://www.cnblogs.com/itboys/p/12124515.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!