Ubuntu12 部署 Hadoop 全流程总结

2024-05-26 14:08

本文主要是介绍Ubuntu12 部署 Hadoop 全流程总结,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

环境:
VMware® Workstation 8.0.4 build-744019
ubuntu-12.04-desktop-i386.iso
jdk-7u7-linux-i586.gz
hadoop-0.20.203.0rc1.tar.gz

第一步:搭建虚拟机基础环境
至少需要3台虚拟机才能模拟hadoop的真实运行场景:一台作为master节点,跑namenode和jobtracker进程;两台作为slave节点,跑datanode和tasktracker。
具体过程:
1.安装 VMware®  Workstation  8.0.4 build-744019
2.使用 ubuntu-12.04-desktop-i386.iso装一台虚拟机
3.安装 jdk-7u7-linux-i586.gz,具体步骤参见: http://user.qzone.qq.com/26896185/blog/1346764350
4.设置虚拟机的网络连接为bridged模式,这样的话虚拟机就可以和宿主机器在同一个网段;
5.复制两台虚拟机,在 VMware 中修改机器名以方便识别,具体步骤参见: http://user.qzone.qq.com/26896185/blog/1346553654
6.用 VMware加载复制出来的虚拟机,分别修改hostname文件(我将三台机器修改为masternode、slavenode1、slavenode2): 当使用VMware加载复制的虚拟机文件时,会提示“是否拷贝过”,选择“拷贝过”,vmware会自动帮修改mac地址等基本信息,但是hostname不会改动,所以复制后的虚拟机hostname和原来的虚拟机一致,千万别忘记手工修改  /etc/hostname 文件,主机名最好与 /etc/hosts 中的地址映射主机名保持一致!!!
7. 为三台虚拟机配置固定IP ;
8. 为三台虚拟机  /etc/hosts 
9.为每台虚拟机创建专门用来管理Hadoop的用户账号(可以三台都相同,或者在复制之前就创建好,我建的用户是grid);
10.配置SSH免登陆,具体步骤参见  http://user.qzone.qq.com/26896185/blog/1346862626

第二步:安装Hadoop
具体过程:
1.在目标目录解压hadoop安装包(我解压到/home/grid/hadoop);
2.修改hadoop/conf/下的配置文件: hadoop-env.sh   ,   core-site.xml  ,hdfs-site.xml  ,mapred-site.xml  ,  masters  , slaves
hadoop-env.sh 文件主要修改如下语句, 用于指明JDK位置
# The java implementation to use.  Required.
export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_07

core-site.xml 文件主要编辑如下语句, 用于指明namenode的域名/ip和端口
 <property>
  <name>fs.default.name</name>
  <value>hdfs://masternode:9000</value>
 </property>
 <property>
  <name>hadoop.tmp.dir</name>
  <value>/home/grid/hadoop_tmp</value>
  <description>A base for other temporary directories.</description>
 </property>

hdfs-site.xml 文件主要编辑如下语句, 用于指明namenode、datanode的数据存放位置,及数据副本的个数
<property>
<name>dfs.name.dir</name>
<value>/home/grid/hadoop/namedata</value>
</property>

<property>
<name>dfs.data.dir</name>
<value>/home/grid/hadoop/data</value>
</property>

<property>
<name>dfs.replication</name>
<value>2</value>
</property>

mapred-site.xml 主要编辑如下语句, 用于指明jobtracker进程所在节点的域名/ip和端口
<property>
<name>mapred.job.tracker</name>
<value>masternode:9001</value>
</property>

masters文件添加master节点的域名或ip地址,我添加的是
masternode

slaves文件添加slave节点的域名或ip地址,我添加的是
slavenode1
slavenode2


3.向各节点复制hadoop文件夹;

4.在master节点上执行命令格式化namenode: hadoop/bin/hadoop namenode -format

5.启动hadoop: hadoop/bin/ start-all.sh    (相反的关闭hadoop:hadoop/bin/stop-all.sh)

6.用jps检验各后台进程是否成功启动:进入到jdk安装目录,执行 bin/jps,在master节点应该能看到namenode、jobtracker、secondarynamenode 三个进程,在slave节点应该能看到datanode、tasktracker两个进程。
各种报错的解决办法请参见:
http://blog.csdn.net/u010967382/article/details/9069625  
和  
http://blog.csdn.net/u010967382/article/details/9069623

这篇关于Ubuntu12 部署 Hadoop 全流程总结的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1004681

相关文章

SpringBoot整合Flowable实现工作流的详细流程

《SpringBoot整合Flowable实现工作流的详细流程》Flowable是一个使用Java编写的轻量级业务流程引擎,Flowable流程引擎可用于部署BPMN2.0流程定义,创建这些流程定义的... 目录1、流程引擎介绍2、创建项目3、画流程图4、开发接口4.1 Java 类梳理4.2 查看流程图4

SQL中JOIN操作的条件使用总结与实践

《SQL中JOIN操作的条件使用总结与实践》在SQL查询中,JOIN操作是多表关联的核心工具,本文将从原理,场景和最佳实践三个方面总结JOIN条件的使用规则,希望可以帮助开发者精准控制查询逻辑... 目录一、ON与WHERE的本质区别二、场景化条件使用规则三、最佳实践建议1.优先使用ON条件2.WHERE用

java Long 与long之间的转换流程

《javaLong与long之间的转换流程》Long类提供了一些方法,用于在long和其他数据类型(如String)之间进行转换,本文将详细介绍如何在Java中实现Long和long之间的转换,感... 目录概述流程步骤1:将long转换为Long对象步骤2:将Longhttp://www.cppcns.c

Nginx Location映射规则总结归纳与最佳实践

《NginxLocation映射规则总结归纳与最佳实践》Nginx的location指令是配置请求路由的核心机制,其匹配规则直接影响请求的处理流程,下面给大家介绍NginxLocation映射规则... 目录一、Location匹配规则与优先级1. 匹配模式2. 优先级顺序3. 匹配示例二、Proxy_pa

Android学习总结之Java和kotlin区别超详细分析

《Android学习总结之Java和kotlin区别超详细分析》Java和Kotlin都是用于Android开发的编程语言,它们各自具有独特的特点和优势,:本文主要介绍Android学习总结之Ja... 目录一、空安全机制真题 1:Kotlin 如何解决 Java 的 NullPointerExceptio

spring-gateway filters添加自定义过滤器实现流程分析(可插拔)

《spring-gatewayfilters添加自定义过滤器实现流程分析(可插拔)》:本文主要介绍spring-gatewayfilters添加自定义过滤器实现流程分析(可插拔),本文通过实例图... 目录需求背景需求拆解设计流程及作用域逻辑处理代码逻辑需求背景公司要求,通过公司网络代理访问的请求需要做请

MySQL基本查询示例总结

《MySQL基本查询示例总结》:本文主要介绍MySQL基本查询示例总结,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录Create插入替换Retrieve(读取)select(确定列)where条件(确定行)null查询order by语句li

使用JavaConfig配置Spring的流程步骤

《使用JavaConfig配置Spring的流程步骤》JavaConfig是Spring框架提供的一种基于Java的配置方式,它通过使用@Configuration注解标记的类来替代传统的XML配置文... 目录一、什么是 JavaConfig?1. 核心注解2. 与 XML 配置的对比二、JavaConf

Web技术与Nginx网站环境部署教程

《Web技术与Nginx网站环境部署教程》:本文主要介绍Web技术与Nginx网站环境部署教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、Web基础1.域名系统DNS2.Hosts文件3.DNS4.域名注册二.网页与html1.网页概述2.HTML概述3.

Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例

《Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例》本文介绍Nginx+Keepalived实现Web集群高可用负载均衡的部署与测试,涵盖架构设计、环境配置、健康检查、... 目录前言一、架构设计二、环境准备三、案例部署配置 前端 Keepalived配置 前端 Nginx