RDD无reduceByKey方法

时间：2015-05-05 18:25:21 阅读：839 评论：0 收藏：0 [点我收藏+]

经常写代码的时候发现rdd没有reduceByKey的方法，这个发生在spark1.2及其以前对版本，因为rdd本身不存在reduceByKey的方法，需要隐式转换成
PairRDDFunctions才能访问，因此需要引入Import org.apache.spark.SparkContext._。不过到了spark1.3的版本后，隐式转换的放在rdd的object中，自动引入，不要引入其他的包。

定义了额外的rdd操作，比如哦说key-value-pair RDDs的 reduceByKey方法需要用到的隐式转换.
object RDD {
//下面这个隐式转换在spark1.3之前原来是在SparkContext中，需要import SparkContext._ 之后才能使用。现在已经把他移到这，现在代码能够自动编译引入。但是原来的sparkContext中的继续保留。

implicit def rddToPairRDDFunctions[K, V](rdd: RDD[(K, V)])
(implicit kt: ClassTag[K], vt: ClassTag[V], ord: Ordering[K] = null): PairRDDFunctions[K, V] = {
new PairRDDFunctions(rdd)
}

至于什么是隐式转换，简单来讲就是scala偷梁换柱换柱，让隔壁老王来干你干不了的事情了。

RDD无reduceByKey方法

原文：http://www.cnblogs.com/luckuan/p/4479551.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)