单机安装hdfs

时间：2021-05-20 22:37:13 阅读：41 评论：0 收藏：0 [点我收藏+]

服务器规划

正常的Hadoop集群环境最少需要3台以上的服务器组合，而且要保持一半以上的服务器存活量。

而目前客户方只提供了一台服务器，那就只能安装伪分布式集群环境，即namenode、datanode和secondarynamenode均存放在一台机器上。

服务器信息：

地址：10.36.161.153

用户：root

JDK安装目录：/ZIP_HDFS_DATAS/jdk1.7.0_80

HDFS安装目录：/ZIP_HDFS_DATAS/hadoop-2.7.3

HDFS数据目录：/ZIP_HDFS_DATAS/hadoop-2.7.3/data

配置hosts

在/etc/hosts配置文件中配置服务器IP和主机名之间的映射关系；

如：10.36.161.153 hdfs iZ88rvassw1Z

其中中间的hdfs是一个伪主机名，因为hadoop对主机的命名很挑剔，不能太长或有一些特殊字符，因此在真正的主机名之前添加一个简单的、短的主机名骗一骗hadoop。

创建用户

hadoop可以以root用户安装和运行，也可以使用普通用户安装和运行。我这里使用root用户安装

本次安装没有特殊要求使用普通用户安装，则在root用户下执行。

如果需要在普通用户下安装及运行则使用如下命令创建用户和修改密码：

useradd -m vHADOOP-1

passwd vHADOOP-1

上传安装介质

通过SFTP等工具将JDK和Hadoop的安装介质上传至服务器；

本次安装使用的版本如下：

jdk-7u80-linux-x64.tar.gz

hadoop-2.7.3.tar.gz

JDK下载地址：

http://www.oracle.com/technetwork/java/javase/archive-139210.html

Hadoop下载地址（是不是很贴心？）：

http://hadoop.apache.org/releases.html

安装JDK并配置环境变量

在用户根目录（如：/root/）下执行如下命令：

vi .bash_profile

添加如下内容：

export JAVA_HOME=/ZIP_HDFS_DATAS/jdk1.7.0_80

export PATH=$JAVA_HOME/bin:$PATH

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

保存退出。

之后执行如下命令生效最新环境变量配置：

source .bash_profile

安装HDFS

Hadoop HDFS单机安装比较简单，解压安装介质即可完成安装。

解压命令：tar zxvf hadoop-2.7.3.tar.gz

备注：按照服务器规划章节中本次解压在/ZIP_HDFS_DATAS/hadoop-2.7.3目录。

因为数据目录和hadoop安装在同一个目录中，需要手动创建数据文件夹:

cd /ZIP_HDFS_DATAS/hadoop-2.7.3

mkdir -p data/tmp

修改HDFS配置

Hadoop的配置文件统一放置在<HADOOP_HOME>/etc/hadoop/目录下。

这里面包含了很多配置文件，跟HDFS相关的配置文件包括：

core-site.xml
slaves

另外还需要配置Hadoop的启动脚本，引入JDK变量：

hadoop-env.sh

core-site.xml

core-site.xml配置文件是对HDFS的基本配置。

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://10.200.12.187:9000/</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/middleware/hdfs/hadoop-2.10.1/data/tmp</value>
    </property>
</property>