【openLooKeng集成Hive连接器完整过程】

2024-05-02 13:12

本文主要是介绍【openLooKeng集成Hive连接器完整过程】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【openLooKeng集成Hive连接器完整过程】

  • 一、摘要
  • 二、正文
    • 2.1 环境说明
    • 2.2 Hadoop安装
      • 2.2.1. 准备工作
      • 2.2.2 在协调节点coordinator上进行安装hadoop
      • 2.2.3、将Hadoop安装目录分发到从节点worker
      • 2.2.4、在协调节点coordinator上启动hadoop集群
    • 2.3 MySQL安装
    • 2.4 Hive安装及基本操作
    • 2.5 openLooKeng配置Hive连接器
    • 2.6 openLooKeng操作Hive
  • 三、总结

一、摘要

本文主要介绍在openLooKeng中如何使用Hive连接器,并在Hive连接器上对表进行增删改查等操作。openLooKeng如想正常使用Hive连接器相关功能,前提是需要事先安装部署Hive,而Hive的安装依赖于Hadoop环境(如Hive使用远程模式安装则还需要依赖于MySQL,其元数据存储于MySQL中)。故,本文将先完成对Hadoop的安装和MySQL的安装,再对hive进行安装,最后在openLooKeng中配置Hive连接器即可。

二、正文

2.1 环境说明

  • 相关软件说明

    软件说明
    Hadoophadoop-2.7.7.tar.gz
    Hiveapache-hive-2.3.3-bin.tar.gz
    openLooKenghetu-server-1.10.0.tar.gz
    JDK1.8.0_401
    MySQL5.7.44
  • 拓扑结构
    在这里插入图片描述

2.2 Hadoop安装

2.2.1. 准备工作

  • 1、所有主机安装jdk
    上传jdk-8u401-linux-x64.tar.gz到/root目录下,执行如下解压安装:

    tar -zvxf jdk-8u401-linux-x64.tar.gz -C /opt
    

    配置环境变量,编辑/etc/profile文件,添加如下内容:

    # jdk
    export JAVA_HOME=/opt/jdk1.8.0_401
    export JRE_HOME=$JAVA_HOME/jre
    export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JRE_HOME/lib
    export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
    

    环境变量生效,执行:

    source /etc/profile
    

    验证Java安装正确与否:

    [root@coordinator ~]# java -version
    java version "1.8.0_401"
    Java(TM) SE Runtime Environment (build 1.8.0_401-b10)
    Java HotSpot(TM) 64-Bit Server VM (build 25.401-b10, mixed mode)
    [root@coordinator ~]#
    
  • 2、所有主机都需要关闭防火墙

    systemctl stop firewalld
    systemctl disable firewalld
    
  • 3、所有主机都需要配置主机名映射关系 :vim /etc/hosts

    192.168.56.101 coordinator coordinator.openlookeng.com
    192.168.56.102 worker worker.openlookeng.com
    
  • 4、配置免密码登录(配置两两之间的免密码登录)
    所有的机器都需要产生一对密钥:公钥和私钥,执行如下命令:

    ssh-keygen -t rsa
    

    一直回车即可。当秘钥对生成后,所有主机需要执行如下命令:

    ssh-copy-id -i ~/.ssh/id_rsa.pub root@coordinator
    ssh-copy-id -i ~/.ssh/id_rsa.pub root@worker
    

    第一次执行时,需要输入root密码。

2.2.2 在协调节点coordinator上进行安装hadoop

  • 上传hadoop安装包/root目录下,解压:

    tar -zvxf /root/hadoop-2.7.7.tar.gz -C /opt/
    
  • 配置环境变量
    注意需要同时设置:coordinator和worker两个节点

    # hadoop
    export HADOOP_HOME=/opt/hadoop-2.7.7
    export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
    
  • 创建tmp目录

    mkdir /opt/hadoop-2.7.7/tmp
    
  • 修改配置文件
    1)修改hadoop-env.sh文件

    vim /opt/hadoop-2.7.7/etc/hadoophadoop-env.sh
    

    设置JAVA_HOME的路径为本机jdk安装路径:
    export JAVA_HOME=/opt/jdk1.8.0_401
    在这里插入图片描述
    2)修改hdfs-site.xml文件

    vim /opt/hadoop-2.7.7/etc/hadoop/hdfs-site.xml
    

    添加如下信息:
    <configuration></configuration>之间添加

    <property><name>dfs.replication</name><value>1</value>
    </property>
    <property><name>dfs.permissions</name><value>false</value>
    </property>
    

    3)修改core-site.xml文件

    vim /opt/hadoop-2.7.7/etc/hadoop/core-site.xml
    

    添加如下信息:

    <property><name>fs.defaultFS</name><value>hdfs://coordinator:9000</value></property><property><name>hadoop.tmp.dir</name><value>/opt/hadoop-2.7.7/tmp</value></property><property><name>hadoop.proxyuser.root.hosts</name><value>*</value></property><property><name>hadoop.proxyuser.root.groups</name><value>*</value></property>
    

    4)修改mapper-site.xml文件

    vim /opt/hadoop-2.7.7/etc/hadoop/mapper-site.xml
    

    添加如下信息:

    <property><name>mapreduce.framework.name</name><value>yarn</value>
    </property>
    <!-- 历史服务器端地址

这篇关于【openLooKeng集成Hive连接器完整过程】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/954323

相关文章

Spring Boot集成/输出/日志级别控制/持久化开发实践

《SpringBoot集成/输出/日志级别控制/持久化开发实践》SpringBoot默认集成Logback,支持灵活日志级别配置(INFO/DEBUG等),输出包含时间戳、级别、类名等信息,并可通过... 目录一、日志概述1.1、Spring Boot日志简介1.2、日志框架与默认配置1.3、日志的核心作用

Apache Ignite 与 Spring Boot 集成详细指南

《ApacheIgnite与SpringBoot集成详细指南》ApacheIgnite官方指南详解如何通过SpringBootStarter扩展实现自动配置,支持厚/轻客户端模式,简化Ign... 目录 一、背景:为什么需要这个集成? 二、两种集成方式(对应两种客户端模型) 三、方式一:自动配置 Thick

Python实现网格交易策略的过程

《Python实现网格交易策略的过程》本文讲解Python网格交易策略,利用ccxt获取加密货币数据及backtrader回测,通过设定网格节点,低买高卖获利,适合震荡行情,下面跟我一起看看我们的第一... 网格交易是一种经典的量化交易策略,其核心思想是在价格上下预设多个“网格”,当价格触发特定网格时执行买

python设置环境变量路径实现过程

《python设置环境变量路径实现过程》本文介绍设置Python路径的多种方法:临时设置(Windows用`set`,Linux/macOS用`export`)、永久设置(系统属性或shell配置文件... 目录设置python路径的方法临时设置环境变量(适用于当前会话)永久设置环境变量(Windows系统

python运用requests模拟浏览器发送请求过程

《python运用requests模拟浏览器发送请求过程》模拟浏览器请求可选用requests处理静态内容,selenium应对动态页面,playwright支持高级自动化,设置代理和超时参数,根据需... 目录使用requests库模拟浏览器请求使用selenium自动化浏览器操作使用playwright

Python极速搭建局域网文件共享服务器完整指南

《Python极速搭建局域网文件共享服务器完整指南》在办公室或家庭局域网中快速共享文件时,许多人会选择第三方工具或云存储服务,但这些方案往往存在隐私泄露风险或需要复杂配置,下面我们就来看看如何使用Py... 目录一、android基础版:HTTP文件共享的魔法命令1. 一行代码启动HTTP服务器2. 关键参

Mysql中设计数据表的过程解析

《Mysql中设计数据表的过程解析》数据库约束通过NOTNULL、UNIQUE、DEFAULT、主键和外键等规则保障数据完整性,自动校验数据,减少人工错误,提升数据一致性和业务逻辑严谨性,本文介绍My... 目录1.引言2.NOT NULL——制定某列不可以存储NULL值2.UNIQUE——保证某一列的每一

解密SQL查询语句执行的过程

《解密SQL查询语句执行的过程》文章讲解了SQL语句的执行流程,涵盖解析、优化、执行三个核心阶段,并介绍执行计划查看方法EXPLAIN,同时提出性能优化技巧如合理使用索引、避免SELECT*、JOIN... 目录1. SQL语句的基本结构2. SQL语句的执行过程3. SQL语句的执行计划4. 常见的性能优

OpenCV在Java中的完整集成指南分享

《OpenCV在Java中的完整集成指南分享》本文详解了在Java中集成OpenCV的方法,涵盖jar包导入、dll配置、JNI路径设置及跨平台兼容性处理,提供了图像处理、特征检测、实时视频分析等应用... 目录1. OpenCV简介与应用领域1.1 OpenCV的诞生与发展1.2 OpenCV的应用领域2

linux下shell脚本启动jar包实现过程

《linux下shell脚本启动jar包实现过程》确保APP_NAME和LOG_FILE位于目录内,首次启动前需手动创建log文件夹,否则报错,此为个人经验,供参考,欢迎支持脚本之家... 目录linux下shell脚本启动jar包样例1样例2总结linux下shell脚本启动jar包样例1#!/bin