hadoop2.7.3搭建

2024-04-27 17:08
文章标签 搭建 hadoop2.7

本文主要是介绍hadoop2.7.3搭建,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

实验环境中搭建hadoop集群(3台示例)

1.修改主机名、修改hosts

vi /etc/sysconfig/network,然后将HOSTNAME修改成hadoop-node1(自定义)

  vi /etc/hosts ,添加hostname及其对应的ip


2.安装jdk和配置环境变量

2.1jdk下载安装不赘述

2.2环境变量:

/etc/profile文件中添加:

export HADOOP_HOME=/home/scada/hadoop(hadoop安装路径)
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop
export JAVA_HOME=/home/scada/jdk1.7.0_80(jdk安装路径)
export PATH=$PATH:$JAVA_HOME/bin
3.实现主节点可无秘钥登录其他节点

3.1安装ssh(ps -e | grep ssh存在ssh进程可忽略)

sudo apt-get install openssh-server

3.2在主节点上生成秘钥对

ssh-keygen -t rsa(一直enter即可)

3.3将公钥加入authorized_keys

cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

3.4将主节点上的authorized_keys拷贝到其他主机上

3.5修改所有节点上authorized_keys权限:

chmod 600 .ssh/authorized_keys

4.解压hadoop包,在hadoop目录下创建文件系统目录
tar -zxvf hadoop...

mv hadoop... hadoop

cd hadoop

mkdir /dfs/name -p

mkdir /dfs/data -p

mkdir /tmp

5.配置相关hadoop文件

5.1 hadoop-env.sh, yarn-env.sh

修改JAVA_HOME值:export JAVA_HOME=/home/scadajdk1.7.0_80(jdk安装路径)

5.2 slaves(集群中从节点HOSTNAME)

hadoop-node2
hadoop-node3
5.3 core-site.xml

<configuration>  <property>  <name>fs.defaultFS</name>  <value>hdfs://hadoop-node1:9000</value>  </property>    <property>  <name>hadoop.tmp.dir</name>  <value>file:/home/scada/hadoop/tmp</value>  </property>  
</configuration>  
5.4 hdfs-site.xml

<configuration>  <property>  <name>dfs.namenode.secondary.http-address</name>  <value>hadoop-node1:9001</value>  </property>  <property>  <name>dfs.namenode.name.dir</name>  <value>file:/home/scada/hadoop/dfs/name</value>  </property>  <property>  <name>dfs.datanode.data.dir</name>  <value>file:/home/scada/hadoop/dfs/data</value>  </property>  <property>  <name>dfs.replication</name>  <value>2</value>  </property>  
</configuration> 
5.5 mapred-site.xml

<configuration>  <property>                                                                    <name>mapreduce.framework.name</name>  <value>yarn</value>  </property>  
</configuration> 
5.6 yarn-site.xml

<configuration>  <property>  <name>yarn.resourcemanager.hostname</name>  <value>hadoop-node1</value>  </property>  <property>  <name>yarn.nodemanager.aux-services</name>  <value>mapreduce_shuffle</value>  </property>  
</configuration>

6.将hadoop目录拷贝到其他节点

7.启动hadoop

hdfs namenode -format

start-all.sh

// hadoop-node1:/home/scada % jps
30099 NameNode
30270 SecondaryNameNode
22019 Jps
27124 ResourceManager
// hadoop-node2:/home/scada/hadoop/etc/hadoop % jps
17009 DataNode
30414 Jps
30277 NodeManager


测试:

1.上传文件:

/home/scada % hadoop fs -put jdk-7u80-linux-x64.tar.gz /
put: Call From hadoop-node1/172.16.1.216 to hadoop-node1:9000 failed on connection exception: java.net.ConnectException: 拒绝连接; For more details see:  http://wiki.apache.org/hadoop/ConnectionRefuse
上传文件失败,查看datanode节点日志:
tail yarn-scada-nodemanager-hadoop-node2.log 
2017-04-01 06:48:00,878 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: hadoop-node1/172.16.1.216:8031. Already tried 8 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)
2017-04-01 06:48:01,879 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: hadoop-node1/172.16.1.216:8031. Already tried 9 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)
问题解决方法:http://www.cnblogs.com/dyllove98/archive/2013/06/20/3147024.html

上传文件:

// hadoop-node1:/home/scada % hadoop fs -put jdk-7u80-linux-x64.tar.gz /

查看是否上传成功:

// hadoop-node1:/home/scada % hadoop fs -ls /
Found 4 items
drwxr-xr-x   - scada supergroup          0 2017-03-27 08:35 /data
-rw-r--r--   2 scada supergroup  153530841 2017-04-01 06:57 /jdk-7u80-linux-x64.tar.gz
drwxr-xr-x   - scada supergroup          0 2017-03-28 00:59 /test
drwx------   - scada supergroup          0 2017-03-27 08:35 /tmp

将本地目录下的jdk压缩包删除,从hadoop分布式文件系统中下载刚刚上传的文件

// hadoop-node1:/home/scada % lsjdk-7u80-linux-x64.tar.gz  
// hadoop-node1:/home/scada % rm jdk-7u80-linux-x64.tar.gz 
// hadoop-node1:/home/scada % ls
// hadoop-node1:/home/scada % hadoop fs -get /jdk-7u80-linux-x64.tar.gz
// hadoop-node1:/home/scada % ls
jdk-7u80-linux-x64.tar.gz 
ok,先到这了~




这篇关于hadoop2.7.3搭建的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/941063

相关文章

利用Python快速搭建Markdown笔记发布系统

《利用Python快速搭建Markdown笔记发布系统》这篇文章主要为大家详细介绍了使用Python生态的成熟工具,在30分钟内搭建一个支持Markdown渲染、分类标签、全文搜索的私有化知识发布系统... 目录引言:为什么要自建知识博客一、技术选型:极简主义开发栈二、系统架构设计三、核心代码实现(分步解析

使用Python实现快速搭建本地HTTP服务器

《使用Python实现快速搭建本地HTTP服务器》:本文主要介绍如何使用Python快速搭建本地HTTP服务器,轻松实现一键HTTP文件共享,同时结合二维码技术,让访问更简单,感兴趣的小伙伴可以了... 目录1. 概述2. 快速搭建 HTTP 文件共享服务2.1 核心思路2.2 代码实现2.3 代码解读3.

MySQL双主搭建+keepalived高可用的实现

《MySQL双主搭建+keepalived高可用的实现》本文主要介绍了MySQL双主搭建+keepalived高可用的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录一、测试环境准备二、主从搭建1.创建复制用户2.创建复制关系3.开启复制,确认复制是否成功4.同

使用DeepSeek搭建个人知识库(在笔记本电脑上)

《使用DeepSeek搭建个人知识库(在笔记本电脑上)》本文介绍了如何在笔记本电脑上使用DeepSeek和开源工具搭建个人知识库,通过安装DeepSeek和RAGFlow,并使用CherryStudi... 目录部署环境软件清单安装DeepSeek安装Cherry Studio安装RAGFlow设置知识库总

Linux搭建Mysql主从同步的教程

《Linux搭建Mysql主从同步的教程》:本文主要介绍Linux搭建Mysql主从同步的教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux搭建mysql主从同步1.启动mysql服务2.修改Mysql主库配置文件/etc/my.cnf3.重启主库my

国内环境搭建私有知识问答库踩坑记录(ollama+deepseek+ragflow)

《国内环境搭建私有知识问答库踩坑记录(ollama+deepseek+ragflow)》本文给大家利用deepseek模型搭建私有知识问答库的详细步骤和遇到的问题及解决办法,感兴趣的朋友一起看看吧... 目录1. 第1步大家在安装完ollama后,需要到系统环境变量中添加两个变量2. 第3步 “在cmd中

本地搭建DeepSeek-R1、WebUI的完整过程及访问

《本地搭建DeepSeek-R1、WebUI的完整过程及访问》:本文主要介绍本地搭建DeepSeek-R1、WebUI的完整过程及访问的相关资料,DeepSeek-R1是一个开源的人工智能平台,主... 目录背景       搭建准备基础概念搭建过程访问对话测试总结背景       最近几年,人工智能技术

5分钟获取deepseek api并搭建简易问答应用

《5分钟获取deepseekapi并搭建简易问答应用》本文主要介绍了5分钟获取deepseekapi并搭建简易问答应用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需... 目录1、获取api2、获取base_url和chat_model3、配置模型参数方法一:终端中临时将加

Mycat搭建分库分表方式

《Mycat搭建分库分表方式》文章介绍了如何使用分库分表架构来解决单表数据量过大带来的性能和存储容量限制的问题,通过在一对主从复制节点上配置数据源,并使用分片算法将数据分配到不同的数据库表中,可以有效... 目录分库分表解决的问题分库分表架构添加数据验证结果 总结分库分表解决的问题单表数据量过大带来的性能

Java汇编源码如何查看环境搭建

《Java汇编源码如何查看环境搭建》:本文主要介绍如何在IntelliJIDEA开发环境中搭建字节码和汇编环境,以便更好地进行代码调优和JVM学习,首先,介绍了如何配置IntelliJIDEA以方... 目录一、简介二、在IDEA开发环境中搭建汇编环境2.1 在IDEA中搭建字节码查看环境2.1.1 搭建步