准备linux环境【java、ip、hostname、hosts、iptables、chkconfig、ssh、免密码登录】
依赖环境 jdk1.8
下载地址:
官网下载地址:https://archive.apache.org/dist/hadoop/common/hadoop-2.7.5/ 【版本最全,国内下载速度慢】
镜像站下载地址:https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop 【只有最近的一些版本,国内下载速度快】
解压缩安装包hadoop-2.7.5.tar.gz
主要修改$HADOOP_HOME/etc/hadoop目录下的配置文件core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml
还有hadoop-env.sh、yarn-env.sh、slaves文件中的内容也需要修改
启动
第一次启动之前需要先格式化
验证
jps验证
浏览器验证
hdfs web地址:http://hadoop100:50070
yarn web地址:http://hadoop100:8088
hadoop-env.sh
export JAVA_HOME={your JAVA_HOME}
export HADOOP_LOG_DIR=/data/hadoop_repo/logs/hadoop
yarn-env.sh
export JAVA_HOME=/data/soft/jdk1.8
export YARN_LOG_DIR=/data/hadoop_repo/logs/yarn
core-site.xml
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoop100:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/data/hadoop_repo</value>
</property>
</configuration>
hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
yarn-site.xml
<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
mapred-site.xml
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
slaves
localhost
bin/hdfs namenode -format
# 格式化操作不能重复执行。
# 如果一定要重复格式化,带参数-force即可。
执行jps命令,能看到下面进程就说明启动成功