在eclipse上开发hadoop2.5.2程序的快捷方法

时间：2016-10-29 02:11:54 阅读：188 评论：0 收藏：0 [点我收藏+]

　　本文仍然使用MapReduce的经典例子 WordCount来测试eclipse的开发环境。

　　与大部分教程不同的是，本文使用的hadoop是2.5.2的版本，相较于之前的0.X版本，hadoop 2.X有较大改动

　　在jar包方面，Hadoop 2.x 版本中 jar 不再集中在一个 hadoop-core*.jar 中，而是分成多个 jar，如使用 Hadoop 2.5.2 运行 WordCount 实例至少需要如下三个 jar:

$HADOOP_HOME/share/hadoop/common/hadoop-common-2.5.2.jar
$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-core-2.5.2.jar
$HADOOP_HOME/share/hadoop/common/lib/commons-cli-1.2.jar

　　实际上，通过命令 hadoop classpath 我们可以得到运行 Hadoop 程序所需的全部 classpath 信息。如下图所示：

技术分享

　　弄清楚jar包的添加后下面开始编译hadoop程序

　　编译MapReduce程序常见的有两种方法：

　　1、使用命令行编译、打包MapReduce程序

　　2、安装eclipse插件编译MapReduce程序

下面介绍一种比较快捷的编译方法

　　在eclipse中新建Java程序之后，导入相应的jar包，这样在编写MapReduce程序时，就可以直接import jar包。这种方法相较于前面两张方法要快捷。需要导入哪些jar包需根据程序用到的Java类来确定，要注意的是包的路径，因为与0.X有所不同，可以按照上述方法先查看jar包的路径。jar包的导入如下：

　　右键所创建的Java工程--->Properties，然后选择Java Build Path，再选择Libraries项，点击 Add External JARs 添加所需的jar包

打包JAR文件

　　编辑好Java程序之后，将MapReduce工程打包成JAR文件，然后发送到hadoop的Master节点上即可运行MapReduce程序。步骤如下：

　　右键Java工程--->Export--->JAR file。

技术分享