Hadoop-2.7.1安装与配置

2024-09-04 16:18
文章标签 配置 安装 2.7 hadoop

本文主要是介绍Hadoop-2.7.1安装与配置,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Hadoop-2.7.1安装与配置

     前面我们说了,旧版hadoop-1.2.1的安装配置,这也是好几年前的版本了吧。而现在最新版本是hadoop-2.7.1 。虽然,大体上hadoop的安装步骤基本一致,但是最新版本与hadoop-1.2.1不管是目录结构,亦或是脚本什么的都有了个很大的改变。所以,我便有写了一篇关于hadoop-2.7.1的安装配置博客。当然,最好的教程还是在官网,所以本文仅供参考,真正可行的还是在官网: http://hadoop.apache.org/docs/r2.7.1/hadoop-project-dist/hadoop-common/SingleCluster.html

一、准备

jdk-7u17-linux-x64.tar.gz

hadoop-2.7.1.tar.gz

二、jdk、ssh安装

      可以参考前面的安装步骤:

http://cyw.iteye.com/blog/2251727

三、安装hadoop-2.7.1

1、将hadoop-2.7.1.tar.gz放在桌面,打开终端,cp到喜欢的目录之下。比如我安装在/home/hadoop/目录下

cp hadoop-2.7.1.tar.gz /home/hadoop/ 

 

 

2、解压安装hadoop-2.7.1

sudo tar -zxvf hadoop-2.7.1.tar.gz 

 

3、进入hadoop-2.7.1文件夹,配置环境变量,打开etc/hadoop/hadoop-env.sh。

sudo gedit etc/hadoop/hadoop-env.sh

 

 在文件里编辑如下JAVA_HOME变量,改为自己的java安装目录:

export JAVA_HOME=/usr/lib/java/jdk1.7.0_17 

 

4、进入hadoop文件夹

bin/hadoop

 

      输出如下:



 

5、如果是单机模式的话,这是便可以使用了:



 

6、如果是伪分布式的话,则还需要配置一些。打开etc/hadoop/core-site.xml

      sudo gedit etc/hadoop/core-site.xml

 

 编辑内容如下:

<configuration><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property></configuration>

 

 

7、打开etc/hadoop/hdfs-site.xml

sudo gedit etc/hadoop/hdfs-site.xml

 

 编辑内容如下:

<configuration><property><name>dfs.replication</name><value>1</value></property>
</configuration>

 

 

8、此时,hdfs的配置已经完成。可以开启namenode 、secondarynomenode、datanode了。此时,hadoop-2.7.1建议我们使用hdfs而不是hadoop脚本,而且部分hdfs的操作放在sbin目录的脚本里面。所以:

 #格式化namenodebin/hdfs namenode -format#开启hdfs的相关节点sbin/start-dfs.sh#关闭hdfs节点sbin/stop-dfs.sh

 

可以使用浏览器url:localhost:50070进行web查看管理。

 

9、配置yarn计算框架(算是Map/Reduce的升级版)

 打开etc/hadoop/mapred-queues.xml.template

sudo gedit etc/hadoop/mapred-queues.xml.template

 

 编辑内容如下:

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property></configuration>

 

 

10、打开etc/hadoop/yarn.site.xml

sudo gedit etc/hadoop/yarn-site.xml

 

 编辑如下:

<configuration><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property>
</configuration>

 

 

11、此时,关于yarn计算框架也配置完成了,可以开始使用了。

  #启动yarnsbin/start-yarn.sh#关闭yarnsbin/stop-yarn.sh

 

 

    12、已经配置完成,全部开启之后,输入命令:

 jps

 


出现以上输出,即是说明安装配置完成了。

注意:如果在开启的时候,出现无法创建、打开目录文件的情况时,即是说明,当前用户没有此文件操作权限,所以需要修改权限:

 sudo chmod 777 *

     尤其是修改hadoop-2.7.1目录、logs目录及其中文件、etc目录及其中的hadoop目录及其其中的文件,这些的权限。

      以上,便安装配置完成了。以下链接是所需要的安装包:

http://pan.baidu.com/s/14uFy2

      以及hadoop-1.2.1的安装配置文章: 

http://cyw.iteye.com/blog/2251727

这篇关于Hadoop-2.7.1安装与配置的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1136416

相关文章

Win安装MySQL8全过程

《Win安装MySQL8全过程》:本文主要介绍Win安装MySQL8全过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Win安装mysql81、下载MySQL2、解压文件3、新建文件夹data,用于保存数据库数据文件4、在mysql根目录下新建文件my.ini

SpringBoot3.4配置校验新特性的用法详解

《SpringBoot3.4配置校验新特性的用法详解》SpringBoot3.4对配置校验支持进行了全面升级,这篇文章为大家详细介绍了一下它们的具体使用,文中的示例代码讲解详细,感兴趣的小伙伴可以参考... 目录基本用法示例定义配置类配置 application.yml注入使用嵌套对象与集合元素深度校验开发

IntelliJ IDEA 中配置 Spring MVC 环境的详细步骤及问题解决

《IntelliJIDEA中配置SpringMVC环境的详细步骤及问题解决》:本文主要介绍IntelliJIDEA中配置SpringMVC环境的详细步骤及问题解决,本文分步骤结合实例给大... 目录步骤 1:创建 Maven Web 项目步骤 2:添加 Spring MVC 依赖1、保存后执行2、将新的依赖

SpringBoot基于配置实现短信服务策略的动态切换

《SpringBoot基于配置实现短信服务策略的动态切换》这篇文章主要为大家详细介绍了SpringBoot在接入多个短信服务商(如阿里云、腾讯云、华为云)后,如何根据配置或环境切换使用不同的服务商,需... 目录目标功能示例配置(application.yml)配置类绑定短信发送策略接口示例:阿里云 & 腾

如何为Yarn配置国内源的详细教程

《如何为Yarn配置国内源的详细教程》在使用Yarn进行项目开发时,由于网络原因,直接使用官方源可能会导致下载速度慢或连接失败,配置国内源可以显著提高包的下载速度和稳定性,本文将详细介绍如何为Yarn... 目录一、查询当前使用的镜像源二、设置国内源1. 设置为淘宝镜像源2. 设置为其他国内源三、还原为官方

最详细安装 PostgreSQL方法及常见问题解决

《最详细安装PostgreSQL方法及常见问题解决》:本文主要介绍最详细安装PostgreSQL方法及常见问题解决,介绍了在Windows系统上安装PostgreSQL及Linux系统上安装Po... 目录一、在 Windows 系统上安装 PostgreSQL1. 下载 PostgreSQL 安装包2.

Maven如何手动安装依赖到本地仓库

《Maven如何手动安装依赖到本地仓库》:本文主要介绍Maven如何手动安装依赖到本地仓库问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、下载依赖二、安装 JAR 文件到本地仓库三、验证安装四、在项目中使用该依赖1、注意事项2、额外提示总结一、下载依赖登

CentOS7更改默认SSH端口与配置指南

《CentOS7更改默认SSH端口与配置指南》SSH是Linux服务器远程管理的核心工具,其默认监听端口为22,由于端口22众所周知,这也使得服务器容易受到自动化扫描和暴力破解攻击,本文将系统性地介绍... 目录引言为什么要更改 SSH 默认端口?步骤详解:如何更改 Centos 7 的 SSH 默认端口1

Maven的使用和配置国内源的保姆级教程

《Maven的使用和配置国内源的保姆级教程》Maven是⼀个项目管理工具,基于POM(ProjectObjectModel,项目对象模型)的概念,Maven可以通过一小段描述信息来管理项目的构建,报告... 目录1. 什么是Maven?2.创建⼀个Maven项目3.Maven 核心功能4.使用Maven H

SpringBoot多数据源配置完整指南

《SpringBoot多数据源配置完整指南》在复杂的企业应用中,经常需要连接多个数据库,SpringBoot提供了灵活的多数据源配置方式,以下是详细的实现方案,需要的朋友可以参考下... 目录一、基础多数据源配置1. 添加依赖2. 配置多个数据源3. 配置数据源Bean二、JPA多数据源配置1. 配置主数据