Linux下搭建Hadoop集群

2024-04-28 23:08
文章标签 linux hadoop 集群 搭建

本文主要是介绍Linux下搭建Hadoop集群,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文地址:http://blog.csdn.net/huhui_cs/article/details/9990157

1.前言

本文描述的是如何使用3台Hadoop节点搭建一个集群。本文中,使用的是三个Ubuntu虚拟机,并没有使用三台物理机。在使用物理机搭建Hadoop集群的时候,也可以参考本文。首先这3个节点要保证能相互连通,本文中,3个虚拟机的ip地址如下:
Master192.168.21.130
Slaver1192.168.21.131
Slaver2192.168.21.132
这三个节点都要先按照好单机版的Hadoop环境,如果安装,请参考我之前写的一篇文章: http://blog.csdn.net/huhui_cs/article/details/8909415
hadoop-1.4.0下载地址: http://download.csdn.net/detail/huhui_bj/6028891
注:3个节点必须使用相同的用户名运行Hadoop,本文使用的用户名都是hadoop

2.安装过程

2.1各节点分别安装Hadoop

前面已经说过,在集群的各个结点,分别安装单机版Hadoop,这是第一步。如果你会写shell脚本,那么就可以写一个安装Hadoop的shell脚本,在各个节点分别运行这个脚本文件,那么hadoop就安装好了。

2.2修改配置文件

a. 需要在Master节点的/etc/hostname文件中修改主机名:
[plain]  view plain copy
  1. sudo gedit /etc/hostname  

这里多说一句,可以使用hostname命令,查看当前节点的主机名是否修改成功。然后需要在Slaver1和Slaver2中修改hostname,分别改成Slaver1和Slaver2。

b. 在/etc/hosts中配置主机名和IP地址的对应关系:
[plain]  view plain copy
  1. sudo gedit /etc/hosts  
以下为hosts的标准格式,如果有多余的行,要将其删除,不然在live nodes中可能显示为0。
127.0.0.1 localhost
192.168.21.130 Master
192.168.21.131 Slaver1
192.168.21.132 Slaver2
修改好了以后,在Master端,可以使用ping命令,验证你的修改:
[plain]  view plain copy
  1. ping Master  
如果能ping通,那么说明你目前的配置是正常的。继续下一步。

c. 在Slaver1节点和Slaver2节点,配置hostname和hosts,方法与步骤b中的相同
也就是说,在Slaver1和Slaver2中,都需要在hosts文件中配置Master、Slaver1和Slaver2的ip对应关系,验证是否配置成功,可以使用ping命令。

d. 现在需要将Master节点的.ssh目录下的id_rsa.pub文件拷贝到Slaver1和Slaver2节点的.ssh目录下,进入Master节点的.ssh目录下,执行命令:
[plain]  view plain copy
  1. scp id_rsa.pub Slaver1:~/.ssh  
[plain]  view plain copy
  1. scp id_rsa.pub Slaver2:~/.ssh  

e. 拷贝文件结束之后,ssh登录Slaver1和Slaver2节点,将刚才拷过来的文件,放入.ssh文件夹下的authorized_keys文件中:
[plain]  view plain copy
  1. cat id_rsa.pub>>authorized_keys  
这个时候,我们在Master节点ssh的登录Slaver1和Slaver2节点的时候,就不需要再输入密码了。这一点很重要,

f. 这一步很关键,需要将Slaver1和Slaver2的hadoop配置文件修改。修改Slaver的hadoop目录下的conf下的core-site.xml和mapred-site.xml文件,将其指向Master
[plain]  view plain copy
  1. hdfs://Master:9000  
[plain]  view plain copy
  1. Master:9001  

常用命令:
①关闭hdfs的safemode模式
bin/hadoop dfsadmin -safemode leave
②检查防火墙是否关闭
ufw status(ubuntu)     
③关闭防火墙
ufw disable (ubuntu)     centos:  service   iptables stop 停止        service iptables start 启动
原文地址: 点击打开链接

这篇关于Linux下搭建Hadoop集群的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/944505

相关文章

【Linux系统化学习】守护进程 | 序列化和反序列化

目录 前言 守护进程 会话 进程组 setsid系统调用 守护进程系统调用 再谈协议 序列化和反序列化 Json 前言 上两篇文章我们所编写的服务器,并算不上真正意义上的服务器一般的服务器都是要随时能够访问的,就像我们在任何时间段都可以打开抖音获取视频资源;要想实现只需要将我们的进程变成守护进程(精灵进程)。 守护进程 会话 当我们使用xshell登录我们自己的

【原创】(十)Linux内存管理 - zoned page frame allocator - 5

背景 Read the fucking source code! --By 鲁迅A picture is worth a thousand words. --By 高尔基 说明: Kernel版本:4.14ARM64处理器,Contex-A53,双核使用工具:Source Insight 3.5, Visio 1. 概述 本文将讨论memory reclaim内存回收这个话题。 在内存

Ubuntu系统搭建Tipask开源问答系统并发布公网分享好友远程访问

文章目录 1. 前言2.Tipask网站搭建2.1 Tipask网站下载和安装2.2 Tipask网页测试2.3 cpolar的安装和注册 3. 本地网页发布3.1 Cpolar临时数据隧道3.2 Cpolar稳定隧道(云端设置)3.3 Cpolar稳定隧道(本地设置) 4. 公网访问测试5. 结语 1. 前言 在我们的生活和工作中,经常会碰到各种各样的问题,而碰到问题的时候,

微信淘宝客查券返利机器人搭建教程分享

微信淘宝客查券返利机器人搭建教程分享 一、登陆淘宝联盟 手机淘宝扫码授权登陆淘宝联盟 地址:https://www.alimama.com 二、配置推广位,获取PID(推荐使用会员PID) 会员推广位PID新增教程 主要目的就是为了获取PID,PID后面有用到 三、注册微信公众号 地址:https://mp.weixin.qq.com/cgi-bin/registermidpage?a

Linux---windows 机器和远端的 Linux 机器如何通过 XShell 传输文件

一、关于rzsz   这个工具用于 windows 机器和远端的 Linux 机器通过 Xshell 传输文件. 二、下载rzsz软件 用root输入命令: sudo yum install -y lrzsz 下载完成: 三、如何传输 有图形化界面  1、从Windows机器传输给远端Linux机器 ① 直接拖拽 直接将要传输的文件拖拽在我们的Xshell上,就会自动传输

租赁小程序开发搭建支持时租日租月租

租赁小程序开发搭建支持时租日租月租 一款开源版的小程序,专为物品租赁服务设计,能满足客户在各种租赁场景中的需求。 该程序支持时租、日租、夜租等多种租赁方式,并配备了DIY页面和分销系统。用户可以通过平台轻松租赁商品,支付租金和押金,员工则可以方便地管理商品出库和归还。 一旦订单完成,押金将自动原路退回。 此外,该程序还具备以下强大的功能模块: 装修模块:允许用户根据需要自定义小程序端首页、

Linux-vi/vim

vi是一个文本编辑器,用于撰写文档或开发程序 vim是vi的增强版,功能一致,可视化效果更好一些,去鼠标化,编辑更加方便,可定制化 vim编辑器是一个模式化文本编辑工具 vim有三种模式 编辑模式、插入模式和末行模式 模式一:编辑模式 进入文档默认的模式 作用:删除、复制、剪切、粘贴、替换单个字符等等 复制内容 yy:单行复制 p:粘贴 #yy:多行复制(#代表数字) 剪

【Linux】自动化构建工具make/Makefile和git介绍

🌈个人主页:秦jh__https://blog.csdn.net/qinjh_?spm=1010.2135.3001.5343🔥 系列专栏:https://blog.csdn.net/qinjh_/category_12625432.html 目录 前言  Linux项目自动化构建工具-make/Makefile 举例  .PHONY 常见符号  依赖关系实例   L

CentOs搭建Kubernetes集群

kubeadm minikube 还是太“迷你”了,方便的同时也隐藏了很多细节,离真正生产环境里的计算集群有一些差距,毕竟许多需求、任务只有在多节点的大集群里才能够遇到,相比起来,minikube 真的只能算是一个“玩具”。 Kubernetes 是很多模块构成的,而实现核心功能的组件像 apiserver、etcd、scheduler 等本质上都是可执行文件,所以也可以采用和其他系统差不多的

TQ2440成功移植linux-2.6.29内核

一.修改平台输入时钟和机器码     修改内核源码arch/arm/mach-s3c2440/mach-smdk2440.c” 文件的大概162行或163行,把16.9344MHz改为12MHz,因为TQ2440使用的就是12MHz的外部时钟源输入,即把16934400改为12000000。     在TQ2440使用的uboot中设定了机器码为168,所以内核这里需要修改机器码,否则会