linux hadoop 2.7 伪分布式安装简单几步实现

2024-06-09 17:18

本文主要是介绍linux hadoop 2.7 伪分布式安装简单几步实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本机配置

1. ubuntu 64bit

2. hadoop 2.7.1


Contents

1.安装jdk

2.安装ssh

3.安装hadoop


Steps

1.安装jdk

a)下载这个网址中跟自己操作系统相对应的jdk版本:http://www.oracle.com/technetwork/cn/java/javase/downloads/jdk7-downloads-1880260.html   我选择的是jdk-7u79-linux-x64.tar.gz。

b)解压后移动到/opt目录下

sudo tar -zxvf jdk-7u79-linux-x64.tar.gz

mv jdk1.7.0_79 /opt

c)编辑/etc/profile配置jdk环境变量

vim /etc/profile

按i进入插入模式,在文件末尾添加

# set java jdk path
export JAVA_HOME=/opt/jdk1.7.0_79 
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin 
export JRE_HOME=/opt/jdk1.7.0_79/jre
export PATH=$PATH:$JRE_HOME/bin
保存后,在命令行中输入source /etc/profile回车就能保存jdk的配置

d)检查jdk安装是否成功

运行javac -version查看:

couragek@couragek:~/下载$ javac -version
javac 1.7.0_79

-------------------------------------------------------------分割线---------------------------------------------------------------------------------

2.安装ssh

a)在终端中输入命令: 

sudo apt-get install ssh openssh-server

b)创建ssh-key,采用rsa方式:

ssh-keygen -t rsa -P ""

c)无密码登陆ssh:

ssh localhost

-------------------------------------------------------------分割线---------------------------------------------------------------------------------

3.安装hadoop

a)下载hadoop安装包,可直接采用命令,如下:

wget http://mirrors.hust.edu.cn/apache/hadoop/core/stable/hadoop-2.7.1.tar.gz

b)解压缩hadoop安装包,如下:

sudo tar -zxvf hadoop-2.7.1.tar.gz

c)配置hadoop文件夹中的配置文件,所有文件位于hadoop2.7.1/etc/hadoop下:

I) core-site.xml

<configuration><property><name>fs.default.name</name><value>hdfs://localhost:9000</value></property>
</configuration>
II) mapred-site.xml.template

<pre name="code" class="html"><configuration><property><name>mapred.job.tracker</name><value>localhost:9001</value></property>
</configuration>

 
 
III) hdfs-site.xml 

<configuration><property><name>dfs.replication</name><value>1</value></property>
</configuration>
IV) hadoop-env.sh,在该文件中添加下面一行:

export JAVA_HOME=/opt/jdk1.7.0_79

d) 运行hadoop

I) 初始化hdfs系统

在hadoop2.7.1目录下输入如下命令:

bin/hdfs namenode -format 

II) 开启namenode和datanode守护进程:

sbin/start-dfs.sh

III) 查看进程信息,采用命令jps,如下所示:

couragek@couragek:~/hadoop-2.7.1$ jps
2814 NameNode
3298 Jps
3177 SecondaryNameNode
2977 DataNode
IV) 查看web UI,在浏览器中输入网址: http://localhost:50070,如下所示:

4.参考文献

http://www.tuicool.com/articles/bmeUneM

http://www.linuxidc.com/Linux/2015-10/123983.htm

http://hadoop.apache.org/docs/r1.0.4/single_node_setup.html


这篇关于linux hadoop 2.7 伪分布式安装简单几步实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1045802

相关文章

HTML5 getUserMedia API网页录音实现指南示例小结

《HTML5getUserMediaAPI网页录音实现指南示例小结》本教程将指导你如何利用这一API,结合WebAudioAPI,实现网页录音功能,从获取音频流到处理和保存录音,整个过程将逐步... 目录1. html5 getUserMedia API简介1.1 API概念与历史1.2 功能与优势1.3

Java实现删除文件中的指定内容

《Java实现删除文件中的指定内容》在日常开发中,经常需要对文本文件进行批量处理,其中,删除文件中指定内容是最常见的需求之一,下面我们就来看看如何使用java实现删除文件中的指定内容吧... 目录1. 项目背景详细介绍2. 项目需求详细介绍2.1 功能需求2.2 非功能需求3. 相关技术详细介绍3.1 Ja

使用Python和OpenCV库实现实时颜色识别系统

《使用Python和OpenCV库实现实时颜色识别系统》:本文主要介绍使用Python和OpenCV库实现的实时颜色识别系统,这个系统能够通过摄像头捕捉视频流,并在视频中指定区域内识别主要颜色(红... 目录一、引言二、系统概述三、代码解析1. 导入库2. 颜色识别函数3. 主程序循环四、HSV色彩空间详解

PostgreSQL中MVCC 机制的实现

《PostgreSQL中MVCC机制的实现》本文主要介绍了PostgreSQL中MVCC机制的实现,通过多版本数据存储、快照隔离和事务ID管理实现高并发读写,具有一定的参考价值,感兴趣的可以了解一下... 目录一 MVCC 基本原理python1.1 MVCC 核心概念1.2 与传统锁机制对比二 Postg

SpringBoot整合Flowable实现工作流的详细流程

《SpringBoot整合Flowable实现工作流的详细流程》Flowable是一个使用Java编写的轻量级业务流程引擎,Flowable流程引擎可用于部署BPMN2.0流程定义,创建这些流程定义的... 目录1、流程引擎介绍2、创建项目3、画流程图4、开发接口4.1 Java 类梳理4.2 查看流程图4

C++中零拷贝的多种实现方式

《C++中零拷贝的多种实现方式》本文主要介绍了C++中零拷贝的实现示例,旨在在减少数据在内存中的不必要复制,从而提高程序性能、降低内存使用并减少CPU消耗,零拷贝技术通过多种方式实现,下面就来了解一下... 目录一、C++中零拷贝技术的核心概念二、std::string_view 简介三、std::stri

C++高效内存池实现减少动态分配开销的解决方案

《C++高效内存池实现减少动态分配开销的解决方案》C++动态内存分配存在系统调用开销、碎片化和锁竞争等性能问题,内存池通过预分配、分块管理和缓存复用解决这些问题,下面就来了解一下... 目录一、C++内存分配的性能挑战二、内存池技术的核心原理三、主流内存池实现:TCMalloc与Jemalloc1. TCM

OpenCV实现实时颜色检测的示例

《OpenCV实现实时颜色检测的示例》本文主要介绍了OpenCV实现实时颜色检测的示例,通过HSV色彩空间转换和色调范围判断实现红黄绿蓝颜色检测,包含视频捕捉、区域标记、颜色分析等功能,具有一定的参考... 目录一、引言二、系统概述三、代码解析1. 导入库2. 颜色识别函数3. 主程序循环四、HSV色彩空间

Linux脚本(shell)的使用方式

《Linux脚本(shell)的使用方式》:本文主要介绍Linux脚本(shell)的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录概述语法详解数学运算表达式Shell变量变量分类环境变量Shell内部变量自定义变量:定义、赋值自定义变量:引用、修改、删

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取