鲁春利的工作笔记,谁说程序员不能有文艺范?
TextInputFormat提供了对文本文件的处理方式,通过InputSplit进行分片(FileSplit),每一个分片分别new一个LineRecordReader进行读取解析,解析得到的每一行以<key, value>的形式传给Mapper的map()函数。
本文出自 “闷葫芦的世界” 博客,请务必保留此出处http://luchunli.blog.51cto.com/2368057/1718819
Hadoop2.6.0学习笔记(五)自定义InputFormat和RecordReader
原文:http://luchunli.blog.51cto.com/2368057/1718819