http://blog.csdn.net/greatelite/article/details/18676281
遇到的问题:
在连接到hdfs服务器上,一直提示unable to connect to HDFS Server
解决过程中:
①网上找了各种说是jar包驱动不兼容,端口号不对,最后都没解决
②最后发现,是服务器上hadoop与kettle所用hadoop插件不一致,
服务器上用的是Hadoop 2.0.0-cdh4.5.0,这是一个经过第三方包装过的hadoop,而我在$PDI_HOME/data-integration/plugins/pentaho-big-data-plugin/plugin.properties配置文件中,
active.hadoop.configuration=hadoop-20,应该改为active.hadoop.configuration=cdh42。问题解决,可以成功向hdfs复制文件。
【第二天】用kettle向hdfs复制文件,布布扣,bubuko.com
原文:http://www.cnblogs.com/allan00/p/3838256.html