linux hadoop 2.7 伪分布式安装简单几步实现

2024-06-09 17:18

本文主要是介绍linux hadoop 2.7 伪分布式安装简单几步实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本机配置

1. ubuntu 64bit

2. hadoop 2.7.1


Contents

1.安装jdk

2.安装ssh

3.安装hadoop


Steps

1.安装jdk

a)下载这个网址中跟自己操作系统相对应的jdk版本:http://www.oracle.com/technetwork/cn/java/javase/downloads/jdk7-downloads-1880260.html   我选择的是jdk-7u79-linux-x64.tar.gz。

b)解压后移动到/opt目录下

sudo tar -zxvf jdk-7u79-linux-x64.tar.gz

mv jdk1.7.0_79 /opt

c)编辑/etc/profile配置jdk环境变量

vim /etc/profile

按i进入插入模式,在文件末尾添加

# set java jdk path
export JAVA_HOME=/opt/jdk1.7.0_79 
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin 
export JRE_HOME=/opt/jdk1.7.0_79/jre
export PATH=$PATH:$JRE_HOME/bin
保存后,在命令行中输入source /etc/profile回车就能保存jdk的配置

d)检查jdk安装是否成功

运行javac -version查看:

couragek@couragek:~/下载$ javac -version
javac 1.7.0_79

-------------------------------------------------------------分割线---------------------------------------------------------------------------------

2.安装ssh

a)在终端中输入命令: 

sudo apt-get install ssh openssh-server

b)创建ssh-key,采用rsa方式:

ssh-keygen -t rsa -P ""

c)无密码登陆ssh:

ssh localhost

-------------------------------------------------------------分割线---------------------------------------------------------------------------------

3.安装hadoop

a)下载hadoop安装包,可直接采用命令,如下:

wget http://mirrors.hust.edu.cn/apache/hadoop/core/stable/hadoop-2.7.1.tar.gz

b)解压缩hadoop安装包,如下:

sudo tar -zxvf hadoop-2.7.1.tar.gz

c)配置hadoop文件夹中的配置文件,所有文件位于hadoop2.7.1/etc/hadoop下:

I) core-site.xml

<configuration><property><name>fs.default.name</name><value>hdfs://localhost:9000</value></property>
</configuration>
II) mapred-site.xml.template

<pre name="code" class="html"><configuration><property><name>mapred.job.tracker</name><value>localhost:9001</value></property>
</configuration>

 
 
III) hdfs-site.xml 

<configuration><property><name>dfs.replication</name><value>1</value></property>
</configuration>
IV) hadoop-env.sh,在该文件中添加下面一行:

export JAVA_HOME=/opt/jdk1.7.0_79

d) 运行hadoop

I) 初始化hdfs系统

在hadoop2.7.1目录下输入如下命令:

bin/hdfs namenode -format 

II) 开启namenode和datanode守护进程:

sbin/start-dfs.sh

III) 查看进程信息,采用命令jps,如下所示:

couragek@couragek:~/hadoop-2.7.1$ jps
2814 NameNode
3298 Jps
3177 SecondaryNameNode
2977 DataNode
IV) 查看web UI,在浏览器中输入网址: http://localhost:50070,如下所示:

4.参考文献

http://www.tuicool.com/articles/bmeUneM

http://www.linuxidc.com/Linux/2015-10/123983.htm

http://hadoop.apache.org/docs/r1.0.4/single_node_setup.html


这篇关于linux hadoop 2.7 伪分布式安装简单几步实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1045802

相关文章

python设置环境变量路径实现过程

《python设置环境变量路径实现过程》本文介绍设置Python路径的多种方法:临时设置(Windows用`set`,Linux/macOS用`export`)、永久设置(系统属性或shell配置文件... 目录设置python路径的方法临时设置环境变量(适用于当前会话)永久设置环境变量(Windows系统

Python对接支付宝支付之使用AliPay实现的详细操作指南

《Python对接支付宝支付之使用AliPay实现的详细操作指南》支付宝没有提供PythonSDK,但是强大的github就有提供python-alipay-sdk,封装里很多复杂操作,使用这个我们就... 目录一、引言二、准备工作2.1 支付宝开放平台入驻与应用创建2.2 密钥生成与配置2.3 安装ali

Spring Security 单点登录与自动登录机制的实现原理

《SpringSecurity单点登录与自动登录机制的实现原理》本文探讨SpringSecurity实现单点登录(SSO)与自动登录机制,涵盖JWT跨系统认证、RememberMe持久化Token... 目录一、核心概念解析1.1 单点登录(SSO)1.2 自动登录(Remember Me)二、代码分析三、

PyCharm中配置PyQt的实现步骤

《PyCharm中配置PyQt的实现步骤》PyCharm是JetBrains推出的一款强大的PythonIDE,结合PyQt可以进行pythion高效开发桌面GUI应用程序,本文就来介绍一下PyCha... 目录1. 安装China编程PyQt1.PyQt 核心组件2. 基础 PyQt 应用程序结构3. 使用 Q

Linux系统中查询JDK安装目录的几种常用方法

《Linux系统中查询JDK安装目录的几种常用方法》:本文主要介绍Linux系统中查询JDK安装目录的几种常用方法,方法分别是通过update-alternatives、Java命令、环境变量及目... 目录方法 1:通过update-alternatives查询(推荐)方法 2:检查所有已安装的 JDK方

Linux系统之lvcreate命令使用解读

《Linux系统之lvcreate命令使用解读》lvcreate是LVM中创建逻辑卷的核心命令,支持线性、条带化、RAID、镜像、快照、瘦池和缓存池等多种类型,实现灵活存储资源管理,需注意空间分配、R... 目录lvcreate命令详解一、命令概述二、语法格式三、核心功能四、选项详解五、使用示例1. 创建逻

Python实现批量提取BLF文件时间戳

《Python实现批量提取BLF文件时间戳》BLF(BinaryLoggingFormat)作为Vector公司推出的CAN总线数据记录格式,被广泛用于存储车辆通信数据,本文将使用Python轻松提取... 目录一、为什么需要批量处理 BLF 文件二、核心代码解析:从文件遍历到数据导出1. 环境准备与依赖库

Linux下在线安装启动VNC教程

《Linux下在线安装启动VNC教程》本文指导在CentOS7上在线安装VNC,包含安装、配置密码、启动/停止、清理重启步骤及注意事项,强调需安装VNC桌面以避免黑屏,并解决端口冲突和目录权限问题... 目录描述安装VNC安装 VNC 桌面可能遇到的问题总结描js述linux中的VNC就类似于Window

linux下shell脚本启动jar包实现过程

《linux下shell脚本启动jar包实现过程》确保APP_NAME和LOG_FILE位于目录内,首次启动前需手动创建log文件夹,否则报错,此为个人经验,供参考,欢迎支持脚本之家... 目录linux下shell脚本启动jar包样例1样例2总结linux下shell脚本启动jar包样例1#!/bin

go动态限制并发数量的实现示例

《go动态限制并发数量的实现示例》本文主要介绍了Go并发控制方法,通过带缓冲通道和第三方库实现并发数量限制,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录带有缓冲大小的通道使用第三方库其他控制并发的方法因为go从语言层面支持并发,所以面试百分百会问到