InputFormat 的作用:
数据输入->splits-><key,val>键值对。
将数据转化成为键值对,供Map使用。
所以InputFormat后面跟随的泛型,就是map所处理的类型。
InputFormat之中的 getSplits() 获取split。
内部的RecordReader 将split 转化成为键值对。
自定义InputFormat 的关键 在于 自定义实现 RecordReader
这个类用来解析split,来确定,返回的键值对是什么。
自定义的RecordReader
自定义InputFormat