首页 > 其他 > 详细

大数据XD 02 hadoop

时间:2020-02-26 17:53:07      阅读:53      评论:0      收藏:0      [点我收藏+]

Hadoop

HDFS :分布式存储

MapReduce: 分布式海量数据处理.

Hadoop 在企业中的应用

技术分享图片

 

MR : MapReduce 的简称.

Apache Hadoop 版本 

技术分享图片

 

Hadoop 2.0 架构与1.0版本差距很大.

 技术分享图片

 

还有一些 Hadoop 的商业版本, 别的公司出的, Hortonworks, cloudera (CDH), MapR

技术分享图片

 

技术分享图片

 

 

Hadoop 项目结构(生态)

 技术分享图片

 

Hive: 数据仓库, 满足企业决策分析的需求. (SQL -> 批量 MapReduce 作业)

Hbase: 非关系型分布式数据库.

Flume: 实时的日志收集

Sqoop: 数据库导入导出工具, ETL 工具.

Ambari: 在 Hadoop 安装和部署套件.

 

Hadoop 的安装

技术分享图片

 

 技术分享图片

 

useradd -m hadoop -s /bin/bash

passwd hadoop

adduser hadoop sudo           (增加sudo 权限给 hadoop)

大数据XD 02 hadoop

原文:https://www.cnblogs.com/moveofgod/p/12367793.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!