大数据-之LibrA数据库系统告警处理(ALM-25006 Sssd服务异常)

本文主要是介绍大数据-之LibrA数据库系统告警处理(ALM-25006 Sssd服务异常),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

告警解释

系统每60秒周期性检测sssd服务的状态,如果连续4次(3分钟)查询不到sssd进程或者无法获取ldapserver中的用户时,产生该告警。

当进程恢复且可以获取ldapserver中的用户时,告警恢复。

告警属性

告警ID

告警级别

可自动清除

25006

严重

告警参数

参数名称

参数含义

ServiceName

产生告警的服务名称。

HostName

产生告警的主机节点信息。

对系统的影响

sssd服务不可用时,可能会影响该节点从LdapServer上同步数据,此时,使用id命令可能会获取不到ldap中的数据,影响上层业务。

可能原因
  • sssd服务未启动或启动错误。
  • 网络故障,无法访问ldap服务器。
  • Name Service服务异常。
  • OS执行命令慢导致无法查询用户。
处理步骤

检查sssd服务是否启动或启动错误。

  1. 在FusionInsight Manager界面,单击“告警管理”。记录该告警定位信息中的“HostName”的IP地址为IP1(若出现多个告警,则分别记录其中的IP地址为IP1、IP2、IP3等)。
  2. 联系运维人员,使用PuTTY工具登录IP1节点,在该节点执行命令ps -ef | grep sssd,查看是否有/usr/sbin/sssd进程启动。

    • 是,执行步骤 3。
    • 否,执行步骤 4。

  3. 查看步骤 2中查询的sssd进程是否有三个子进程。

    • 是,执行步骤 5。
    • 否,执行步骤 4。

  4. root用户执行service sssd restart命令重启sssd服务,执行ps -ef | grep sssd命令,查看sssd进程是否正常。

    正常状态为:存在/usr/sbin/sssd进程和三个子进程/usr/libexec/sssd/sssd_be、/usr/libexec/sssd/sssd_nss、/usr/libexec/sssd/sssd_pam。

    • 是,执行步骤 9。
    • 否,执行步骤 13。

检查网络是否故障,无法访问ldap服务器。

  1. root用户登录故障节点,在这个节点上使用ping命令检查该节点与LdapServer节点的网络是否畅通。

    • 是,执行步骤 6。
    • 否,请联系网络管理员,解决网络故障。

检查Name Service服务是否异常。

  1. root用户登录故障节点,执行命令cat /etc/nsswitch.conf,查看NameService配置中的“passwd”、“group”两项配置是否正确。

    正确配置请参照:“passwd: files sss”、“group: files sss”

    • 是,执行步骤 7。
    • 否,执行步骤 8。

  2. root用户执行/usr/sbin/sss_cache -G/usr/sbin/sss_cache -U命令,等待2分钟,执行id adminid backup/manager命令,查看是否能查询到结果。

    • 是,执行步骤 9。
    • 否,执行步骤 13。

  3. 以root用户执行vi /etc/nsswitch.conf命令,将步骤 6中的两项配置项改成正确配置,保存后执行service sssd restart命令重启sssd服务,等待2分钟,执行id adminid backup/manager命令,查看是否能查询到结果。

    • 是,执行步骤 9。
    • 否,执行步骤 13。

  4. 登录FusionInsight Manager界面,等待5分钟,然后查看“ALM-25006 Sssd服务异常”告警是否恢复。

    • 是,处理完毕。
    • 否,执行步骤 10。

检查操作系统执行命令是否卡顿。

  1. 用root用户登录故障节点,执行命令id admin,观察命令返回结果时长,观察执行命令是否缓慢(超过3s即可认为执行命令慢)。

    是,执行步骤 11。

    否,执行步骤 13。

  2. 执行命令cat /var/log/messages,查看sssd是否频繁重启或者存在Can't contact LDAP server的异常信息。

    sssd重启样例

     

    是,执行步骤 12。

    否,执行步骤 13

  3. 执行命令vi$BIGDATA_HOME/tmp/random_ldap_ip_order,修改末尾数字,若原本为奇数则改为偶数,若原本为偶数则修改为奇数;

    执行命令vi/etc/sssd/sssd.conf,将ldap_uri配置项的前两个IP进行颠倒,保存退出。

    执行命令ps -ef | grep sssd查询sssd进程id,并将其kill掉,执行/usr/sbin/sssd -D -f,重启sssd服务,等待5分钟,再次执行id admin命令。

    观察返回结果时长,观察执行命令是否缓慢。

    是,执行步骤 13。

    否,登录其他故障节点执行步骤 10至步骤 12;收集日志,并排查“/etc/sssd/sssd.conf”修改前ldap_uri中第一个ldapserver节点,

    是否故障,例如业务IP不可达、网络延时过长或者部署其他异常的软件。

收集故障信息。

  1. 在FusionInsight Manager界面,选择“系统设置 > 日志下载”。
  2. 在“服务”下拉框中勾选“LdapClient”,单击“确定”。
  3. 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后1小时,单击“下载”。

这篇关于大数据-之LibrA数据库系统告警处理(ALM-25006 Sssd服务异常)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/428666

相关文章

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

java.sql.SQLTransientConnectionException连接超时异常原因及解决方案

《java.sql.SQLTransientConnectionException连接超时异常原因及解决方案》:本文主要介绍java.sql.SQLTransientConnectionExcep... 目录一、引言二、异常信息分析三、可能的原因3.1 连接池配置不合理3.2 数据库负载过高3.3 连接泄漏

Python实现批量CSV转Excel的高性能处理方案

《Python实现批量CSV转Excel的高性能处理方案》在日常办公中,我们经常需要将CSV格式的数据转换为Excel文件,本文将介绍一个基于Python的高性能解决方案,感兴趣的小伙伴可以跟随小编一... 目录一、场景需求二、技术方案三、核心代码四、批量处理方案五、性能优化六、使用示例完整代码七、小结一、

Python中 try / except / else / finally 异常处理方法详解

《Python中try/except/else/finally异常处理方法详解》:本文主要介绍Python中try/except/else/finally异常处理方法的相关资料,涵... 目录1. 基本结构2. 各部分的作用tryexceptelsefinally3. 执行流程总结4. 常见用法(1)多个e

PHP应用中处理限流和API节流的最佳实践

《PHP应用中处理限流和API节流的最佳实践》限流和API节流对于确保Web应用程序的可靠性、安全性和可扩展性至关重要,本文将详细介绍PHP应用中处理限流和API节流的最佳实践,下面就来和小编一起学习... 目录限流的重要性在 php 中实施限流的最佳实践使用集中式存储进行状态管理(如 Redis)采用滑动

MyBatis-plus处理存储json数据过程

《MyBatis-plus处理存储json数据过程》文章介绍MyBatis-Plus3.4.21处理对象与集合的差异:对象可用内置Handler配合autoResultMap,集合需自定义处理器继承F... 目录1、如果是对象2、如果需要转换的是List集合总结对象和集合分两种情况处理,目前我用的MP的版本

Debian 13升级后网络转发等功能异常怎么办? 并非错误而是管理机制变更

《Debian13升级后网络转发等功能异常怎么办?并非错误而是管理机制变更》很多朋友反馈,更新到Debian13后网络转发等功能异常,这并非BUG而是Debian13Trixie调整... 日前 Debian 13 Trixie 发布后已经有众多网友升级到新版本,只不过升级后发现某些功能存在异常,例如网络转

GSON框架下将百度天气JSON数据转JavaBean

《GSON框架下将百度天气JSON数据转JavaBean》这篇文章主要为大家详细介绍了如何在GSON框架下实现将百度天气JSON数据转JavaBean,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下... 目录前言一、百度天气jsON1、请求参数2、返回参数3、属性映射二、GSON属性映射实战1、类对象映