首页 > 其他 > 详细

hadoop常用技巧

时间:2020-04-04 00:01:15      阅读:68      评论:0      收藏:0      [点我收藏+]

hadoop输入多个文件时获取输入文件名,目的是可以对多个输入文件进行区分

filepath = os.environ["map_input_file"]
filename = os.path.split(filepath)[-1]

hadoop多路输出

hadoop touchz命令:创建一个空文件

  • hadoop fs -touchz xx.done[check文件完成小技巧]

hadoop text命令:将源文件输出为文本格式

  • hadoop fs -text

hadoop grep命令,grep on Hadoop

   hadoop jar hadoop-streaming-1.2.1.jar     -D mapreduce.job.name="grep"     -D stream.non.zero.exit.is.failure=false     -mapper "grep $1"     -numReduceTasks 0     -input /INPUT     -output /OUTPUT

hadoop动态修改任务优先级

  • hadoop job -set-priority job_name HIGH

hadoop数据去重的例子

hadoop join的方法【待实现】

hadoop常用技巧

原文:https://www.cnblogs.com/baisheng/p/12629672.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!