大数据-之LibrA数据库系统告警处理(ALM-37006 Coordinator进程异常)

本文主要是介绍大数据-之LibrA数据库系统告警处理(ALM-37006 Coordinator进程异常),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

告警解释

当出现如下情况时,产生该告警:

  • CN所在机器发生硬件故障(断电、硬盘损坏等)。
  • CN实例数据目录中的postgresql.conf配置文件不存在或者其中某个配置参数不正确。
  • CN实例线程无法监听IP,或者无法绑定监听端口。
  • CN实例进程没有其数据目录读写权限、或数据目录丢失。
  • 绑定CN实例的虚拟IP异常。
告警属性

告警ID

告警级别

可自动清除

37006

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称

RoleName

产生告警的角色名称

HostName

产生告警的主机名

Instance

产生告警的实例

对系统的影响

当CN实例启动失败时,集群将提示启动失败,数据库系统将无法使用DDL语句,DML可以正常使用。

一段时间后(约5分钟),系统会自动将故障CN剔除,此时用gs_om -t status --detail命令查询到故障CN节点状态为Deleted。此时可以正常使用DDL语句,和DML语句。

注意:

此时不要直接重启MPPDB服务。请按照“处理步骤”中描述操作。

可能原因
  • CN所在机器发生硬件故障(断电、硬盘损坏等)。
  • CN实例数据目录中的postgresql.conf配置文件不存在或者其中某个配置参数不对。
  • CN实例线程无法监听IP,或者无法绑定监听端口。
  • CN实例进程没有其数据目录读写权限、或数据目录丢失。
  • 绑定CN实例的虚拟IP异常。
处理步骤
  1. 告警产生后等待5分钟,查看告警是否仍然存在。
    • 是,执行2。
    • 否,处理完毕。
  1. omm用户身份登录LibrA服务器,执行source ${BIGDATA_HOME}/mppdb/.mppdbgs_profile命令启动环境变量。执行以下命令查询并确认故障节点CN状态是否为Deleted。

    gs_om -t status --detail

    • 是,执行3。
    • 否,执行9。
  2. 登录FusionInsight Manager,选择“服务管理 > MPPDB”。单击“实例”,在实例列表中选择故障节点对应的MPPDBServer。
  3. 单击“实例配置”,“参数类别”类型设置为“全部配置”,在搜索框中输入参数名称“mppdb.coo.number”进行搜索。
  4. 将“mppdb.coo.number”的值设置为0,单击“保存配置”。
  5. 在弹出窗口中,单击“确定”。界面提示“操作成功”,单击“完成”,查看操作是否成功执行。
    • 是,故障CN删除完毕,手动在界面清除CN进程异常告警。
    • 否,执行9。
  1. (可选)恢复故障节点的CN,重复步骤3~4,将“mppdb.coo.number”的值设置为1,单击“保存配置”。
  2. (可选)在弹出窗口中,单击“确定”。界面提示“操作成功”,单击“完成”,查看操作是否成功执行。
    • 是,CN增加完毕。
    • 否,执行9。
  1. 在FusionInsight Manager界面,单击“系统设置 > 日志下载”。
  2. 在“服务”下拉框中勾选“MPPDB”,单击“确定”。
  3. 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后1小时,单击“下载”。

这篇关于大数据-之LibrA数据库系统告警处理(ALM-37006 Coordinator进程异常)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/425875

相关文章

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

Java.lang.InterruptedException被中止异常的原因及解决方案

《Java.lang.InterruptedException被中止异常的原因及解决方案》Java.lang.InterruptedException是线程被中断时抛出的异常,用于协作停止执行,常见于... 目录报错问题报错原因解决方法Java.lang.InterruptedException 是 Jav

Python进行JSON和Excel文件转换处理指南

《Python进行JSON和Excel文件转换处理指南》在数据交换与系统集成中,JSON与Excel是两种极为常见的数据格式,本文将介绍如何使用Python实现将JSON转换为格式化的Excel文件,... 目录将 jsON 导入为格式化 Excel将 Excel 导出为结构化 JSON处理嵌套 JSON:

Spring Boot 中的默认异常处理机制及执行流程

《SpringBoot中的默认异常处理机制及执行流程》SpringBoot内置BasicErrorController,自动处理异常并生成HTML/JSON响应,支持自定义错误路径、配置及扩展,如... 目录Spring Boot 异常处理机制详解默认错误页面功能自动异常转换机制错误属性配置选项默认错误处理

C#监听txt文档获取新数据方式

《C#监听txt文档获取新数据方式》文章介绍通过监听txt文件获取最新数据,并实现开机自启动、禁用窗口关闭按钮、阻止Ctrl+C中断及防止程序退出等功能,代码整合于主函数中,供参考学习... 目录前言一、监听txt文档增加数据二、其他功能1. 设置开机自启动2. 禁止控制台窗口关闭按钮3. 阻止Ctrl +

java如何实现高并发场景下三级缓存的数据一致性

《java如何实现高并发场景下三级缓存的数据一致性》这篇文章主要为大家详细介绍了java如何实现高并发场景下三级缓存的数据一致性,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 下面代码是一个使用Java和Redisson实现的三级缓存服务,主要功能包括:1.缓存结构:本地缓存:使

SpringBoot 异常处理/自定义格式校验的问题实例详解

《SpringBoot异常处理/自定义格式校验的问题实例详解》文章探讨SpringBoot中自定义注解校验问题,区分参数级与类级约束触发的异常类型,建议通过@RestControllerAdvice... 目录1. 问题简要描述2. 异常触发1) 参数级别约束2) 类级别约束3. 异常处理1) 字段级别约束

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

《在MySQL中实现冷热数据分离的方法及使用场景底层原理解析》MySQL冷热数据分离通过分表/分区策略、数据归档和索引优化,将频繁访问的热数据与冷数据分开存储,提升查询效率并降低存储成本,适用于高并发... 目录实现冷热数据分离1. 分表策略2. 使用分区表3. 数据归档与迁移在mysql中实现冷热数据分

C#解析JSON数据全攻略指南

《C#解析JSON数据全攻略指南》这篇文章主要为大家详细介绍了使用C#解析JSON数据全攻略指南,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、为什么jsON是C#开发必修课?二、四步搞定网络JSON数据1. 获取数据 - HttpClient最佳实践2. 动态解析 - 快速

一文解密Python进行监控进程的黑科技

《一文解密Python进行监控进程的黑科技》在计算机系统管理和应用性能优化中,监控进程的CPU、内存和IO使用率是非常重要的任务,下面我们就来讲讲如何Python写一个简单使用的监控进程的工具吧... 目录准备工作监控CPU使用率监控内存使用率监控IO使用率小工具代码整合在计算机系统管理和应用性能优化中,监