该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系

本文主要是介绍该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系

这个去集群主机cm界面上看会出现这个错误
排查思路:

  1. 一般比较常见的原因可能是出问题的主机和集群主节点的时间对应不上了。
  2. 还有就是cm agent服务出现问题了

去该主机的后台进行查看

1.1 如果集群配置了ntp时间同步协议

查看问题节点的ntp服务是否正常启动

systemctl status ntpd

[root@cloudcdp02 ~]# systemctl status ntpd
● ntpd.service - Network Time Service
Loaded: loaded (/usr/lib/systemd/system/ntpd.service; enabled; vendor preset: disabled)
Active: active (running) since 一 2024-03-25 00:53:52 CST; 1 weeks 3 days ago
Process: 717 ExecStart=/usr/sbin/ntpd -u ntp:ntp $OPTIONS (code=exited, status=0/SUCCESS)
Main PID: 726 (ntpd)
CGroup: /system.slice/ntpd.service
└─726 /usr/sbin/ntpd -u ntp:ntp -g
3月 25 00:53:52 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c012 02 freq_set kernel 4.576 PPM
3月 25 00:53:52 cloudcdp02.hadoop.com systemd[1]: Started Network Time Service.
3月 25 00:53:57 cloudcdp02.hadoop.com ntpd[726]: Listen normally on 4 eth0 172.21.32.231 UDP 123
3月 25 00:53:57 cloudcdp02.hadoop.com ntpd[726]: Listen normally on 5 eth0 fe80::f87f:eaff:fe8b:1600 UDP 123
3月 25 00:53:57 cloudcdp02.hadoop.com ntpd[726]: new interface(s) found: waking up resolver
3月 25 00:58:21 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c61c 0c clock_step +0.293029 s
3月 25 00:58:21 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c614 04 freq_mode
3月 25 00:58:22 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c618 08 no_sys_peer
3月 25 01:14:01 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c612 02 freq_set kernel 4.919 PPM
3月 25 01:14:01 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c615 05 clock_sync

这种是正常已经启动好的
如果没有启动,就重启一下ntp服务

systemctl start ntpd

在查看一下ntp是否与主节点进行时间同步

ntpq -p

在这里插入图片描述
可以看到remote下面的主机前面有一个*,代表着正在与cloudcdp01进行时间同步,如果 *在local前面,就代表着与本地时间同步

如果offset下面的数字时间偏差太大的话,光靠ntp可能回不过来,这时候需要手动和主节点进行时间同步
手动同步命令

ntpdate -s 主节点ip

重启agent服务

 systemctl restart cloudera-scm-agent.service

1.2. 如果集群没有配置了ntp时间同步协议

查看主节点的时间

date

然后在回到问题节点上面,直接修改问题节点的系统时间,让其与之同步
同步时间

sudo date -s "2024-04-02 12:30:00"

重启agent服务

 systemctl restart cloudera-scm-agent.service

2.如果agent服务出现问题

查看agent服务状态

 systemctl status cloudera-scm-agent.service

如果发现agent服务停止就重新启动一下,如果发现agent服务没有了,就需要重新安装agent服务
重新安装agent服务,直接从主节点的/var/www/html里面发一份agent服务安装包,rpm安装一下就好了
服务安装好后,需要修改agent服务的配置文件,不然会出现agent服务无法识别主机的报错

修改agent服务的配置

#进入配置服务目录
cd /etc/cloudera-scm-agent
#打开配置文件
vim config.ini

修改server_host后面的地址,把localhoust改为主节点ip。

在这里插入图片描述

然后重启agent服务

 systemctl restart cloudera-scm-agent.service

这篇关于该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/875896

相关文章

SQL Server修改数据库名及物理数据文件名操作步骤

《SQLServer修改数据库名及物理数据文件名操作步骤》在SQLServer中重命名数据库是一个常见的操作,但需要确保用户具有足够的权限来执行此操作,:本文主要介绍SQLServer修改数据... 目录一、背景介绍二、操作步骤2.1 设置为单用户模式(断开连接)2.2 修改数据库名称2.3 查找逻辑文件名

SQL Server数据库死锁处理超详细攻略

《SQLServer数据库死锁处理超详细攻略》SQLServer作为主流数据库管理系统,在高并发场景下可能面临死锁问题,影响系统性能和稳定性,这篇文章主要给大家介绍了关于SQLServer数据库死... 目录一、引言二、查询 Sqlserver 中造成死锁的 SPID三、用内置函数查询执行信息1. sp_w

C++ 函数 strftime 和时间格式示例详解

《C++函数strftime和时间格式示例详解》strftime是C/C++标准库中用于格式化日期和时间的函数,定义在ctime头文件中,它将tm结构体中的时间信息转换为指定格式的字符串,是处理... 目录C++ 函数 strftipythonme 详解一、函数原型二、功能描述三、格式字符串说明四、返回值五

从基础到进阶详解Pandas时间数据处理指南

《从基础到进阶详解Pandas时间数据处理指南》Pandas构建了完整的时间数据处理生态,核心由四个基础类构成,Timestamp,DatetimeIndex,Period和Timedelta,下面我... 目录1. 时间数据类型与基础操作1.1 核心时间对象体系1.2 时间数据生成技巧2. 时间索引与数据

Linux中修改Apache HTTP Server(httpd)默认端口的完整指南

《Linux中修改ApacheHTTPServer(httpd)默认端口的完整指南》ApacheHTTPServer(简称httpd)是Linux系统中最常用的Web服务器之一,本文将详细介绍如何... 目录一、修改 httpd 默认端口的步骤1. 查找 httpd 配置文件路径2. 编辑配置文件3. 保存

Windows Server 2025 搭建NPS-Radius服务器的步骤

《WindowsServer2025搭建NPS-Radius服务器的步骤》本文主要介绍了通过微软的NPS角色实现一个Radius服务器,身份验证和证书使用微软ADCS、ADDS,具有一定的参考价... 目录简介示意图什么是 802.1X?核心作用802.1X的组成角色工作流程简述802.1X常见应用802.

利用Python实现时间序列动量策略

《利用Python实现时间序列动量策略》时间序列动量策略作为量化交易领域中最为持久且被深入研究的策略类型之一,其核心理念相对简明:对于显示上升趋势的资产建立多头头寸,对于呈现下降趋势的资产建立空头头寸... 目录引言传统策略面临的风险管理挑战波动率调整机制:实现风险标准化策略实施的技术细节波动率调整的战略价

SQL Server身份验证模式步骤和示例代码

《SQLServer身份验证模式步骤和示例代码》SQLServer是一个广泛使用的关系数据库管理系统,通常使用两种身份验证模式:Windows身份验证和SQLServer身份验证,本文将详细介绍身份... 目录身份验证方式的概念更改身份验证方式的步骤方法一:使用SQL Server Management S

Spring AI 实现 STDIO和SSE MCP Server的过程详解

《SpringAI实现STDIO和SSEMCPServer的过程详解》STDIO方式是基于进程间通信,MCPClient和MCPServer运行在同一主机,主要用于本地集成、命令行工具等场景... 目录Spring AI 实现 STDIO和SSE MCP Server1.新建Spring Boot项目2.a

SQL Server中的PIVOT与UNPIVOT用法具体示例详解

《SQLServer中的PIVOT与UNPIVOT用法具体示例详解》这篇文章主要给大家介绍了关于SQLServer中的PIVOT与UNPIVOT用法的具体示例,SQLServer中PIVOT和U... 目录引言一、PIVOT:将行转换为列核心作用语法结构实战示例二、UNPIVOT:将列编程转换为行核心作用语