首页 > 其他 > 详细

Hadoop单机模式安装

时间:2021-05-23 14:55:50      阅读:13      评论:0      收藏:0      [点我收藏+]

Hadoop单机模式安装

默认情况下,Hadoop被配置成以非分布式模式运行的一个独立Java进程。对调试非常有帮助。

一、环境准备

平台 阿里云服务器(1核2G)
系统 CentOS7.3
远程工具 FinalShell
安装包 hadoop-3.2.0.tar.gz,jdk-8u241-linux-x64.tar.gz
存放路径 /usr/local/share/applications/
环境变量 hadoop:/usr/local/share/applications/hadoop;jdk:/usr/local/share/applications/jdk

技术分享图片
技术分享图片

1、使用远程连接

这里使用FinalShell

技术分享图片
技术分享图片

选择->SSH连接

技术分享图片
技术分享图片

2、修改主机名

[root@izwz9gkqceq3fljxybvvt2z ~]# vim /etc/hostname 

技术分享图片

修改主机的IP映射

[root@izwz9gkqceq3fljxybvvt2z ~]# ifconfig 

技术分享图片

[root@izwz9gkqceq3fljxybvvt2z ~]# vim /etc/hosts

技术分享图片

配置完成后,重启服务器

[root@izwz9gkqceq3fljxybvvt2z ~]# reboot

技术分享图片

3、将安装包传入FinalShell

将搭建环境所用的HADOOP和JDK安装包放到/usr/local/share/applications目录下

技术分享图片

[root@centos7 applications]# ll
总用量 432912
-rw-r--r-- 1 root root 248747707 5月  23 10:22 hadoop-3.2.0.tar.gz
-rw-r--r-- 1 root root 194545143 5月  23 10:22 jdk-8u241-linux-x64.tar.gz

解压

[root@centos7 applications]# tar -xvf hadoop-3.2.0.tar.gz 
[root@centos7 applications]# tar -xvf jdk-8u241-linux-x64.tar.gz 

压缩包改名

[root@centos7 applications]# mv hadoop-3.2.0 hadoop
[root@centos7 applications]# mv jdk1.8.0_241 jdk

技术分享图片

4、修改环境变量

[root@centos7 hadoop]# vim /etc/profile

JAVA环境变量

export JAVA_HOME=/usr/local/share/applications/jdk		#存放JDK文件夹的路径	
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:.
export PATH=$JAVA_HOME/bin:$PATH

HADOOP环境变量

export HADOOP_HOME=/usr/local/share/applications/hadoop		#存放HADOOP文件夹的路径	
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

技术分享图片

使设置生效

[root@centos7 hadoop]# source /etc/profile

检验JDK是否安装成功 (失败的话检查路径)

[root@centos7 hadoop]# java -version

技术分享图片

检验HADOOP是否安装成功

[root@centos7 hadoop]# hadoop version

技术分享图片

二、Hadoop安装过程

1、安装ssh

[root@centos7 hadoop]# yum install -y openssh-server openssh-client

技术分享图片

2、登录免密操作

[root@centos7 hadoop]# ssh-keygen -t rsa

技术分享图片

技术分享图片
因为是单机安装,这里免密是本机登录本机

##切换目录
[root@centos7 .ssh]# cd /root/.ssh/
[root@centos7 .ssh]# pwd
/root/.ssh
##复制公钥
[root@centos7 .ssh]# ssh-copy-id -i id_rsa.pub cento7

技术分享图片

尝试免密登录是否成功(注意登录前后的目录变化)
[root@centos7 .ssh]# pwd
/root/.ssh
[root@centos7 .ssh]# ssh centos7

Welcome to Alibaba Cloud Elastic Compute Service !

[root@centos7 ~]# pwd
/root

技术分享图片

[root@centos7 ~]# exit			#退出
Connection to centos7 closed.
[root@centos7 .ssh]# 

技术分享图片

3、单机模式安装完成!

三、WordCount

1、创建input文件夹

/usr/local/share/applications/hadoop下创建input文件夹

技术分享图片

2、把该目录下/etc/hadoop中的所有文件都拷贝到input文件夹中

##/usr/local/share/applications/hadoop/etc/hadoop
[root@centos7 hadoop]# cd /usr/local/share/applications/hadoop/etc/hadoop

技术分享图片

[root@centos7 hadoop]# cp ./* /usr/local/share/applications/hadoop/input/
[root@centos7 hadoop]# ls /usr/local/share/applications/hadoop/input/

技术分享图片

3、下载jar包

运行wordcount程序,并将结果保存在output中。我没找到自带的 hadoop example jar包,所以自己下载了一个。

hadoop example jar下载地址:http://www.java2s.com/Code/Jar/h/Downloadhadoopexamples120jar.htm

将下载的jar包放到/usr/local/share/applications/hadoop目录下
技术分享图片

解压jar包

[root@centos7 hadoop]# unzip hadoop-examples-1.2.0.jar.zip 

技术分享图片

若是出现未找到命令

[root@centos7 hadoop]# unzip --help
-bash: unzip: 未找到命令

则用yum install 下载

[root@centos7 hadoop]# yum install -y unzip

4、运行

查看hadoop-examples-1.2.0.jar文件权限

技术分享图片

[root@centos7 hadoop]# chmod a+x hadoop-examples-1.2.0.jar

技术分享图片

运行

[root@centos7 hadoop]# hadoop jar hadoop-examples-1.2.0.jar wordcount input output

技术分享图片

技术分享图片

查看统计的单词和出现的频数

[root@centos7 hadoop]# cat output/*

技术分享图片

四、简单版WordCount

1、自己创建一个文本

先删除刚刚input下所有文件,删除output文件夹

也可以不删除output文件夹,后面进行测试的时候可以创建另一个名字的文件存放也是可以的

[root@centos7 hadoop]# pwd
/usr/local/share/applications/hadoop		#当前所在目录
[root@centos7 hadoop]# rm -rfv input/*		#删除input下所有文件
[root@centos7 hadoop]# ls input/
[root@centos7 hadoop]# rm -rf output/

创建一个文本,自己写一些单词

[root@centos7 hadoop]# cd input/			 #切换到input目录下
[root@centos7 input]# pwd
/usr/local/share/applications/hadoop/input		 #当前绝对路径
[root@centos7 input]# ls				 #当前目录确保被清空
[root@centos7 input]# vim test				 #自己创建一个单词文本
happy new years
new
yes
one
two two
go go go

技术分享图片

2、运行

运行格式:hadoop jar <hadoop-examplesXXX.jar所在路径> wordcount <要处理文件夹的存放路径> <输出结果的存放路径>

[root@centos7 input]# hadoop jar ../hadoop-examples-1.2.0.jar wordcount ../input ../output

技术分享图片

如果cat output/*发现还是之前的数据的话,查看刚刚运行Wordcount的信息,出现如下情况表示输出文件夹有重名。

解决方法

一、删除原有的输出文件夹
二、修改hadoop jar命令重新命名一个文件夹名字(系统会自动生成,不用事先创建)
技术分享图片
之后重新运行hadoop jar命令即可

Hadoop单机模式安装

原文:https://www.cnblogs.com/kyokyo-w/p/14801012.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!