首页 > 其他 > 详细

MapReduce的FileInputFormat切片机制

时间:2021-03-17 17:24:09      阅读:32      评论:0      收藏:0      [点我收藏+]
  • Client查看输入目录的文件,计算任务分片,如果剩余大小大于切片大小的1.1倍,则分出一个任务片,否则剩余部分为一个任务片,切片计算结果是一个FileSplit[]数组,会序列化任务切片信息数组到资源提交路径

  • 计算切片大小的逻辑是Math.max(minSize, Math.min(maxSize, blockSize))

    mapreduce.input.fileinputformat.split.minsize默认值为1

    mapreduce.input.fileinputformat.split.maxsize默认值为Long.MAXValue

    默认情况下切片大小为blocksize

MapReduce的FileInputFormat切片机制

原文:https://www.cnblogs.com/lijiong/p/14550021.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!