初识hadoop

时间：2017-07-23 00:17:10 阅读：175 评论：0 收藏：0 [点我收藏+]

今日根据《hadoop权威指南》和炼数成金的黄志洪老师的视频，了解了hadoop的基本原理、基本构架和简单实现。

hadoop本身是一个分布式文件系统（HDFS）和计算框架（MapReduce）；YARN （Yet Another Resource Negotiator，另一种资源协调者）是一种新的 Hadoop 资源管理器，它是一个通用资源管理系统，可为上层应用提供统一的资源管理和调度，不仅仅只能运行MapReduce。

为了实现单机hadoop，首先必须下载安装相应的JDK，一般放置在~/usr下；

其次下载最新的、稳定版本的hadoop，解压缩，依次编辑下面的文件：

1、hadoop-env.sh 指定jdk地址： export JAVA_HOME=/usr/java/jdk1.8.0_141；

2、core-site.xml 指定namenode监听的端口，临时文件存放地址

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
  <property>
  <name>hadoop.tmp.dir</name>
  <value>/grid/hadoop2.7.3/tmp</value>
</property>
</configuration>

3、hdfs-site.xml：

configuration>
<property>
<name>dfs.replication</name>
<value>1</value> #因为单机，所以设置文件只要保存1份，系统默认是3份：
</property>
</configuration>

4、mapred-site.xml，mapreduce监听的端口

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>

接下来，用命令bin/hdfs namenode -format 格式化HDFS，随即，用命令sbin/start-dfs.sh启动hadoop，如果成功，运行/usr/jdk1.8.0_141/bin/jps 会显示namenode进程。

初识hadoop

原文：http://www.cnblogs.com/gangzhuzi/p/7223233.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)