云服务器伪分布式hadoop配置+javaAPI上传下载删除操纵(踩坑总结) --菜鸟慧言.md
云服务器伪分布式hadoop配置+javaAPI上传下载删除操纵(踩坑总结)
注:本博文主要针对单台云服务器hadoop安装配置。博主使用阿里云的ECS服务器,Centos7系统,公网ip:120.27.244.176 私网ip:172.16.236.135 安全组开放所有端口,即1/65535
一、准备
- 创建:
mkdir -p /opt/hadoop
- 进入:
cd -p /opt/hadoop
- 上传:
- 解压:
tar -zxvf hadoop-2.7.3.tar.gz
- 配置hosts:
1
2
3vi /etc/hosts
//必须添加内网ip
172.16.236.135 hadoop.idse.top - 配置环境变量
1
2
3
4
5
6
7vi /etc/profile
//添加环境变量
#配置hadoop
export HADOOP_HOME=/opt/hadoop/hadoop-2.7.3
export PATH=$PATH:$HADOOP_HOME/bin
//刷新配置
source /etc/profile
二、 配置hadoop
修改hadoop-env.sh
1
2
3
4cd /opt/hadoop/hadoop-2.7.3/etc/hadoop/
vi hadoop-env.sh
//找到并修改
export JAVA_HOME=/opt/java/jdk1.8.0_141修改core-site.xml
1
2
3
4
5
6
7
8
9
10
11vi core-site.xml
//注意域名端口改为自己的hosts中设置
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoop.idse.top:9000</value>
</property>
<!-- 指定hadoop运行时产生文件的存储目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/zhiyou/hadoop/tmp</value>
</property>配置hdfs-site.xml
1
2
3
4
5vi hdfs-site.xml
<property>
<name>dfs.replication</name>
<value>1</value>
</property>配置yarn-site.xml
1
2
3
4
5
6
7
8
9
10
11vi yarn-site.xml
//注意修改域名配置
<property>
<name>yarn.resourcemanager.hostname</name>
<value>hadoop.idse.top</value>
</property>
<!-- reducer获取数据的方式 -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>配置mapred-site.xml
1
2
3
4
5
6mv mapred-site.xml.template mapred-site.xml
vi mapred-site.xml
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>启动
1
2cd /opt/hadoop/hadoop-2.7.3/sbin/
./start-all.sh查看进程:
jps
浏览器访问(公网ip+端口):
120.27.244.176:50070
坑1:未成功访问请去安全组开放端口,自行百度hadoop所需端口,博主全开。
三、javaAPI上传下载文件测试
1 |
|
坑2:必须加上 conf.set(“dfs.replication”, “1”);
conf.set(“dfs.client.use.datanode.hostname”, “true”);不然上传会为空文件
云服务器伪分布式hadoop配置+javaAPI上传下载删除操纵(踩坑总结) --菜鸟慧言.md
http://example.com/57255.html