【openLooKeng集成Hive连接器完整过程】

2024-05-02 13:12

本文主要是介绍【openLooKeng集成Hive连接器完整过程】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【openLooKeng集成Hive连接器完整过程】

  • 一、摘要
  • 二、正文
    • 2.1 环境说明
    • 2.2 Hadoop安装
      • 2.2.1. 准备工作
      • 2.2.2 在协调节点coordinator上进行安装hadoop
      • 2.2.3、将Hadoop安装目录分发到从节点worker
      • 2.2.4、在协调节点coordinator上启动hadoop集群
    • 2.3 MySQL安装
    • 2.4 Hive安装及基本操作
    • 2.5 openLooKeng配置Hive连接器
    • 2.6 openLooKeng操作Hive
  • 三、总结

一、摘要

本文主要介绍在openLooKeng中如何使用Hive连接器,并在Hive连接器上对表进行增删改查等操作。openLooKeng如想正常使用Hive连接器相关功能,前提是需要事先安装部署Hive,而Hive的安装依赖于Hadoop环境(如Hive使用远程模式安装则还需要依赖于MySQL,其元数据存储于MySQL中)。故,本文将先完成对Hadoop的安装和MySQL的安装,再对hive进行安装,最后在openLooKeng中配置Hive连接器即可。

二、正文

2.1 环境说明

  • 相关软件说明

    软件说明
    Hadoophadoop-2.7.7.tar.gz
    Hiveapache-hive-2.3.3-bin.tar.gz
    openLooKenghetu-server-1.10.0.tar.gz
    JDK1.8.0_401
    MySQL5.7.44
  • 拓扑结构
    在这里插入图片描述

2.2 Hadoop安装

2.2.1. 准备工作

  • 1、所有主机安装jdk
    上传jdk-8u401-linux-x64.tar.gz到/root目录下,执行如下解压安装:

    tar -zvxf jdk-8u401-linux-x64.tar.gz -C /opt
    

    配置环境变量,编辑/etc/profile文件,添加如下内容:

    # jdk
    export JAVA_HOME=/opt/jdk1.8.0_401
    export JRE_HOME=$JAVA_HOME/jre
    export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JRE_HOME/lib
    export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
    

    环境变量生效,执行:

    source /etc/profile
    

    验证Java安装正确与否:

    [root@coordinator ~]# java -version
    java version "1.8.0_401"
    Java(TM) SE Runtime Environment (build 1.8.0_401-b10)
    Java HotSpot(TM) 64-Bit Server VM (build 25.401-b10, mixed mode)
    [root@coordinator ~]#
    
  • 2、所有主机都需要关闭防火墙

    systemctl stop firewalld
    systemctl disable firewalld
    
  • 3、所有主机都需要配置主机名映射关系 :vim /etc/hosts

    192.168.56.101 coordinator coordinator.openlookeng.com
    192.168.56.102 worker worker.openlookeng.com
    
  • 4、配置免密码登录(配置两两之间的免密码登录)
    所有的机器都需要产生一对密钥:公钥和私钥,执行如下命令:

    ssh-keygen -t rsa
    

    一直回车即可。当秘钥对生成后,所有主机需要执行如下命令:

    ssh-copy-id -i ~/.ssh/id_rsa.pub root@coordinator
    ssh-copy-id -i ~/.ssh/id_rsa.pub root@worker
    

    第一次执行时,需要输入root密码。

2.2.2 在协调节点coordinator上进行安装hadoop

  • 上传hadoop安装包/root目录下,解压:

    tar -zvxf /root/hadoop-2.7.7.tar.gz -C /opt/
    
  • 配置环境变量
    注意需要同时设置:coordinator和worker两个节点

    # hadoop
    export HADOOP_HOME=/opt/hadoop-2.7.7
    export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
    
  • 创建tmp目录

    mkdir /opt/hadoop-2.7.7/tmp
    
  • 修改配置文件
    1)修改hadoop-env.sh文件

    vim /opt/hadoop-2.7.7/etc/hadoophadoop-env.sh
    

    设置JAVA_HOME的路径为本机jdk安装路径:
    export JAVA_HOME=/opt/jdk1.8.0_401
    在这里插入图片描述
    2)修改hdfs-site.xml文件

    vim /opt/hadoop-2.7.7/etc/hadoop/hdfs-site.xml
    

    添加如下信息:
    <configuration></configuration>之间添加

    <property><name>dfs.replication</name><value>1</value>
    </property>
    <property><name>dfs.permissions</name><value>false</value>
    </property>
    

    3)修改core-site.xml文件

    vim /opt/hadoop-2.7.7/etc/hadoop/core-site.xml
    

    添加如下信息:

    <property><name>fs.defaultFS</name><value>hdfs://coordinator:9000</value></property><property><name>hadoop.tmp.dir</name><value>/opt/hadoop-2.7.7/tmp</value></property><property><name>hadoop.proxyuser.root.hosts</name><value>*</value></property><property><name>hadoop.proxyuser.root.groups</name><value>*</value></property>
    

    4)修改mapper-site.xml文件

    vim /opt/hadoop-2.7.7/etc/hadoop/mapper-site.xml
    

    添加如下信息:

    <property><name>mapreduce.framework.name</name><value>yarn</value>
    </property>
    <!-- 历史服务器端地址

这篇关于【openLooKeng集成Hive连接器完整过程】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/954323

相关文章

SpringBoot3应用中集成和使用Spring Retry的实践记录

《SpringBoot3应用中集成和使用SpringRetry的实践记录》SpringRetry为SpringBoot3提供重试机制,支持注解和编程式两种方式,可配置重试策略与监听器,适用于临时性故... 目录1. 简介2. 环境准备3. 使用方式3.1 注解方式 基础使用自定义重试策略失败恢复机制注意事项

canal实现mysql数据同步的详细过程

《canal实现mysql数据同步的详细过程》:本文主要介绍canal实现mysql数据同步的详细过程,本文通过实例图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的... 目录1、canal下载2、mysql同步用户创建和授权3、canal admin安装和启动4、canal

MySQL存储过程之循环遍历查询的结果集详解

《MySQL存储过程之循环遍历查询的结果集详解》:本文主要介绍MySQL存储过程之循环遍历查询的结果集,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言1. 表结构2. 存储过程3. 关于存储过程的SQL补充总结前言近来碰到这样一个问题:在生产上导入的数据发现

SpringBoot集成LiteFlow实现轻量级工作流引擎的详细过程

《SpringBoot集成LiteFlow实现轻量级工作流引擎的详细过程》LiteFlow是一款专注于逻辑驱动流程编排的轻量级框架,它以组件化方式快速构建和执行业务流程,有效解耦复杂业务逻辑,下面给大... 目录一、基础概念1.1 组件(Component)1.2 规则(Rule)1.3 上下文(Conte

java对接海康摄像头的完整步骤记录

《java对接海康摄像头的完整步骤记录》在Java中调用海康威视摄像头通常需要使用海康威视提供的SDK,下面这篇文章主要给大家介绍了关于java对接海康摄像头的完整步骤,文中通过代码介绍的非常详细,需... 目录一、开发环境准备二、实现Java调用设备接口(一)加载动态链接库(二)结构体、接口重定义1.类型

SpringBoot3中使用虚拟线程的完整步骤

《SpringBoot3中使用虚拟线程的完整步骤》在SpringBoot3中使用Java21+的虚拟线程(VirtualThreads)可以显著提升I/O密集型应用的并发能力,这篇文章为大家介绍了详细... 目录1. 环境准备2. 配置虚拟线程方式一:全局启用虚拟线程(Tomcat/Jetty)方式二:异步

Python远程控制MySQL的完整指南

《Python远程控制MySQL的完整指南》MySQL是最流行的关系型数据库之一,Python通过多种方式可以与MySQL进行交互,下面小编就为大家详细介绍一下Python操作MySQL的常用方法和最... 目录1. 准备工作2. 连接mysql数据库使用mysql-connector使用PyMySQL3.

Linux中修改Apache HTTP Server(httpd)默认端口的完整指南

《Linux中修改ApacheHTTPServer(httpd)默认端口的完整指南》ApacheHTTPServer(简称httpd)是Linux系统中最常用的Web服务器之一,本文将详细介绍如何... 目录一、修改 httpd 默认端口的步骤1. 查找 httpd 配置文件路径2. 编辑配置文件3. 保存

Spring Boot 整合 Apache Flink 的详细过程

《SpringBoot整合ApacheFlink的详细过程》ApacheFlink是一个高性能的分布式流处理框架,而SpringBoot提供了快速构建企业级应用的能力,下面给大家介绍Spri... 目录Spring Boot 整合 Apache Flink 教程一、背景与目标二、环境准备三、创建项目 & 添

Python使用Tkinter打造一个完整的桌面应用

《Python使用Tkinter打造一个完整的桌面应用》在Python生态中,Tkinter就像一把瑞士军刀,它没有花哨的特效,却能快速搭建出实用的图形界面,作为Python自带的标准库,无需安装即可... 目录一、界面搭建:像搭积木一样组合控件二、菜单系统:给应用装上“控制中枢”三、事件驱动:让界面“活”