<!--配置HDFS文件系统的命名空间--> <property> <name>fs.defaultFS</name> <value>hdfs://jh01:9000</value> </property> <!--HDFS读取文件的缓冲大小--> <property> <name>io.file.buffer.size</name> <value>4096</value> </property> |
<!--配置hdfs文件系统的副本数--> <property> <name>dfs.replication</name> <value>3</value> </property> <!--指定hdfs文件系统的元数据存放目录--> <property> <name>dfs.namenode.name.dir</name> <value>file:///opt/hadoopdata/dfs/name</value> </property> <!--指定hdfs文件系统的数据块存放目录--> <property> <name>dfs.datanode.data.dir</name> <value>file:///opt/hadoopdata/dfs/data</value> </property> <!--配置HDFS的web管理地址--> <property> <name>dfs.http.address</name> <value>jh01:50070</value> </property> <!--配置secondaryNamenode的web管理地址--> <property> <name>dfs.secondary.http.address</name> <value>jh02:50090</value> </property> <!--配置是否打开web管理--> <property> <name>dfs.webhdfs.enabled</name> <value>true</value> </property> <!--指定hdfs文件系统权限是否开启--> <property> <name>dfs.permissions</name> <value>false</value> </property> |
13.cp mapred-site.xml.template mapred-site.xml
14.
15.编辑mapred-site.xml,配置框架名字,历史记录组件等
16.
<!--指定mapreduce运行的框架名--> <property> <name>mapreduce.framework.name</name> <value>yarn</value> <final>true</final> </property> <!--配置mapreduce的历史记录组件的内部通信地址--> <property> <name>mapreduce.jobhistory.address</name> <value>jh01:10020</value> </property> <!--配置mapreduce的历史记录服务的web管理地址--> <property> <name>mapreduce.jobhistory.webapp.address</name> <value>jh01:19888</value> </property> <property> <name>mapreduce.job.ubertask.enable</name> <value>true</value> </property> <property> <name>mapreduce.job.ubertask.maxmaps</name> <value>9</value> </property> <property> <name>mapreduce.job.ubertask.maxreduces</name> <value>1</value> </property> |
<!-- Site specific YARN configuration properties --> <!--指定resourcemanager所启动服务的主机名/ip--> <property> <name>yarn.resourcemanager.hostname</name> <value>jh01</value> </property> <!--指定mapreduce的shuffle处理数据方式--> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <!--配置resourcemanager内部通讯地址--> <property> <name>yarn.resourcemanager.address</name> <value>jh01:8032</value> </property> <!--配置resourcemanager的scheduler组件的内部通信地址--> <property> <name>yarn.resourcemanager.scheduler.address</name> <value>jh01:8030</value> </property> <!--配置resource-tracker组件的内部通信地址--> <property> <name>yarn.resourcemanager.resource-tracker.address</name> <value>jh01:8031</value> </property> <!--配置resourcemanager的admin的内部通信地址--> <property> <name>yarn.resourcemanager.admin.address</name> <value>jh01:8033</value> </property> <!--配置yarn的web管理地址--> <property> <name>yarn.resourcemanager.webapp.address</name> <value>jh01:8088</value> </property>
<!--yarn的聚合日志是否开启--> <property> <name>yarn.log-aggregation-enable</name> <value>true</value> </property> <!--聚合日志报错hdfs上的时间--> <property> <name>yarn.log-aggregation.retain-seconds</name> <value>86400</value> </property> <!--聚合日志的检查时间段--> <property> <name>yarn.log-aggregation.retain-check-interval-seconds</name> <value>3600</value> </property> <!----> <property> <name>yarn.nodemanager.log.retain-seconds</name> <value>10800</value> </property> <!--当应用程序运行结束后,日志被转移到的HDFS目录(启用日志聚集功能时有效)--> <property> <name>yarn.nodemanager.remote-app-log-dir</name> <value>/opt/hadoopdata/logs</value> </property> |
生成ssh免登陆密钥
ssh-keygen -t rsa (四个回车)
//执行完这个命令后,会生成两个文件id_rsa(私钥)、id_rsa.pub(公钥)
//将公钥拷贝到要免登陆的机器上
jh01 namenode\resourcemanager\datanode\nodemanager(要启动的服务)
jh02 secondaryNamenode\datanode\nodemanager
jh03 datanode\nodemanager
jh01 免登录jh02和jh03和自己
jh02 免登录jh03和自己
jh03 免登录 自己
32.start-all.sh
(开启服务)
33.12.通过web UI查看HDFS和yarn集群是否正常
原文:https://www.cnblogs.com/zxn0628/p/11224922.html