HDFS :分布式存储
MapReduce: 分布式海量数据处理.
MR : MapReduce 的简称.
Hadoop 2.0 架构与1.0版本差距很大.
还有一些 Hadoop 的商业版本, 别的公司出的, Hortonworks, cloudera (CDH), MapR
Hive: 数据仓库, 满足企业决策分析的需求. (SQL -> 批量 MapReduce 作业)
Hbase: 非关系型分布式数据库.
Flume: 实时的日志收集
Sqoop: 数据库导入导出工具, ETL 工具.
Ambari: 在 Hadoop 安装和部署套件.
useradd -m hadoop -s /bin/bash
passwd hadoop
adduser hadoop sudo (增加sudo 权限给 hadoop)
原文:https://www.cnblogs.com/moveofgod/p/12367793.html