3. MapReduce----MapReduce是一种计算模型,用以进行大数据量的计算。
(二)三大核心项目目录结构
1.Common: 源码位于src/core文件夹下
src/core:
--org.apache.hadoop
--classification
--conf
--filecache(空)
--fs
--ftp
--kfs
--permission
--s3
--s3native
--shell
--http
--lib
--io
--compress
--bzip2
--snappy
--zlib
--file.tfile
--nativeio
--retry
--serializer
--ipc
--metrics
--jmx
--log
--metrics
--metrics
--file
--ganglia
--jvm
--spi
--util
--metrics2
--filter
--impl
--lib
--sink
--ganglia
--source
--util
--net
--record
--compiler
--ant
--generated
--meta
--security
--authentication
--client
--server
--util
--authorize
--token
--delegation
--util
--bloom
--hash
2. HDFS:源码位于src/hdfs文件夹下
src/hdfs
org.apache.hadoop.hdfs
--protocol
--security.token
--block
--delegation
--server
--balancer
--common
--datanode
--metrics
--web.resources
--namenode
--metrics
--web.resources
--protocol
--tools
--util
--web
--resources
3.MapReduce:源码位于src/mapred文件夹下
src/mapred
--org.apache.hadoop
--filecache
--mapred
--jobcontrol
--join
--lib
--aggregate
--db
--pipes
--tools
--mapreduce
--example(空)
--lib
--db
--fieldsel
--input
--jobcontrol
--map
--output
--partition
--reduce
--security
--token
--delegation
--server
--jobtracker
--tasktracker
--split原文:http://blog.csdn.net/zhouhong1026/article/details/19831135