大数据相关

时间：2020-03-16 21:14:44 阅读：68 评论：0 收藏：0 [点我收藏+]

一、写出hadoop集群常用进程以及进程含义

　　1、Namenode
　　　　它是Hadoop 中的主服务器，管理文件系统名称空间和对集群中存储的文件的访问。
　　2、Datanode
　　　　它负责管理连接到节点的存储（一个集群中可以有多个节点）。每个存储数据的节点运行一个 datanode 守护进程。
　　3、secondaryNameNode
　　　　它不是 namenode 的冗余守护进程，而是提供周期检查点和清理任务。出于对可扩展性和容错性等考虑，我们一般将SecondaryNameNode运行在一台非NameNode的机器上。
　　4、ResourceManager
　　　　负责调度 DataNode上的工作。每个 DataNode有一个NodeManager，它们执行实际工作。
　　　5、NodeManager
　　　　负责执行ResourceManager分发的任务

2.Hadoop安装部署需要修改的配置文件，以及常用端口，举例说明
　　hadoop-env.sh hadoop jdk配置
　　core-site.xml hadoop核心文件-配置hadoop的命名服务和tmp目录和zookeeper集群
　　hdfs-site.xml 配置通信端口 http端口等。
　　mapred-site.xml 配置mapreduce的资源调度框架 yarn
　　yarn-site.xml yarn相关配置
　　Slaves 文件指定hadoop集群的子节点位置
　　端口：
　　50070 namenode的web访问端口
　　9000 RPC通信端口
　　2181 zookeeper端口
3.使用过的hadoop shell 命令
　　Hadoop fs -ls /
　　Hadoop fs -mkdir /test
　　Hadoop fs -cat /

大数据相关

原文：https://www.cnblogs.com/Robi-9662/p/12506401.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年09月23日 (328)
2021年09月24日 (313)
2021年09月17日 (191)
2021年09月15日 (369)
2021年09月16日 (411)
2021年09月13日 (439)
2021年09月11日 (398)
2021年09月12日 (393)
2021年09月10日 (160)
2021年09月08日 (222)