ATS线上报告个别日志过大无法写入问题的解决方法

2024-03-18 15:38

本文主要是介绍ATS线上报告个别日志过大无法写入问题的解决方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

访问日志是分析CDN线上问题的重要参考依据,但是我们在实际运维中发现很多部署点日志记录出现一些小问题,会造成相应的日志条目丢失。我们发现线上一些服务器上时常会报告如下问题:

diags.log中经常报如下错误:

[Mar 31 02:39:34.185] Server {0x2b1d85563700} NOTE: <LogObject.cc:616 (log)> Skipping the current log entry for access.log because its size (9136) exceeds the maximum payload space in a log buffer
分析问题
这里已经指出了报错日志的代码位置在LogObject.cc:616,导致出错的函数位置的源码是

显然我们需要研究 _checkout_write()函数的实现,并关注返回为NULL的值,里面实际上是调用
result_code = buffer->checkout_write(write_offset, bytes_needed);
来控制多线程同步写日志,

上述日志信息所走的流程是

它是result_code的返回码LogBuffer::LB_BUFFER_TOO_SMALL,所以最终我们还得查看 LogBuffer::checkout_write()返回该状态码的地方,注意如下函数的返回值
LB_ResultCode ret_val = LB_BUSY;
返回的该代码是

上面的比较,m_size的值很关键,我们需要关注m_size的默认赋值是多少?这是写日志的一个初始缓存的长度,字符串型的,在 LogBuffer.cc

它是调用它的构造函数生成的
LogBuffer(LogObject * owner, size_t size,   size_t buf_align = LB_DEFAULT_ALIGN, size_t write_align = INK_MIN_ALIGN);

可以看出分配指定长度的缓存给m_unaligned_buffer,并将它对齐为m_buffer,动态释放内存的地方在析构函数中

建议gdb追踪来找到调用点,发现还是在LogObject.cc中有几处地方,都有如下代码
LogBuffer *b = NEW (new LogBuffer (this,  Log::config->log_buffer_size));
现在继续追踪Log的配置项,在sourceInsight中搜索 log_buffer_size得到

结果很清楚了,配置项配大点就可以了。
解决方法
在records.config中添加一项proxy.config.log.log_buffer_size,配置大些就可以了。直接热修改如下:
traffic_line -r proxy.config.log.log_buffer_size
traffic_line -s proxy.config.log.log_buffer_size -v 40960
traffic_line -x
如果还是报类似上面的错误,可以继续酌情修改这个值,总之,要根据业务的实际情况修改


更进一步修正

修改上述配置后,发现线上日志出现如下报错


经过查看,发现与另一个配置proxy.config.log.max_line_size有关,它的默认值也是9216

解决方法

在records.config中添加一条配置(可根据实际情况酌情修改)

CONFIG proxy.config.log.max_line_size INT 15000

下面是修改前后的判决图


下面是源码追踪流程,不愿深究的可以略去。

调用流程追踪

报错地方的源码是


在source insight中追踪源码中的max_line_size可以看到基本调用流程。


剩下的是配置项的读取



总结:最终一个通用的设置,在records.config中加入:

CONFIG proxy.config.log.max_line_size INT 35000
CONFIG proxy.config.log.log_buffer_size INT 262144

这篇关于ATS线上报告个别日志过大无法写入问题的解决方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/822814

相关文章

解决RocketMQ的幂等性问题

《解决RocketMQ的幂等性问题》重复消费因调用链路长、消息发送超时或消费者故障导致,通过生产者消息查询、Redis缓存及消费者唯一主键可以确保幂等性,避免重复处理,本文主要介绍了解决RocketM... 目录造成重复消费的原因解决方法生产者端消费者端代码实现造成重复消费的原因当系统的调用链路比较长的时

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

SpringBoot监控API请求耗时的6中解决解决方案

《SpringBoot监控API请求耗时的6中解决解决方案》本文介绍SpringBoot中记录API请求耗时的6种方案,包括手动埋点、AOP切面、拦截器、Filter、事件监听、Micrometer+... 目录1. 简介2.实战案例2.1 手动记录2.2 自定义AOP记录2.3 拦截器技术2.4 使用Fi

kkFileView启动报错:报错2003端口占用的问题及解决

《kkFileView启动报错:报错2003端口占用的问题及解决》kkFileView启动报错因office组件2003端口未关闭,解决:查杀占用端口的进程,终止Java进程,使用shutdown.s... 目录原因解决总结kkFileViewjavascript启动报错启动office组件失败,请检查of

Linux系统中查询JDK安装目录的几种常用方法

《Linux系统中查询JDK安装目录的几种常用方法》:本文主要介绍Linux系统中查询JDK安装目录的几种常用方法,方法分别是通过update-alternatives、Java命令、环境变量及目... 目录方法 1:通过update-alternatives查询(推荐)方法 2:检查所有已安装的 JDK方

SQL Server安装时候没有中文选项的解决方法

《SQLServer安装时候没有中文选项的解决方法》用户安装SQLServer时界面全英文,无中文选项,通过修改安装设置中的国家或地区为中文中国,重启安装程序后界面恢复中文,解决了问题,对SQLSe... 你是不是在安装SQL Server时候发现安装界面和别人不同,并且无论如何都没有中文选项?这个问题也

Java Thread中join方法使用举例详解

《JavaThread中join方法使用举例详解》JavaThread中join()方法主要是让调用改方法的thread完成run方法里面的东西后,在执行join()方法后面的代码,这篇文章主要介绍... 目录前言1.join()方法的定义和作用2.join()方法的三个重载版本3.join()方法的工作原

SpringBoot 异常处理/自定义格式校验的问题实例详解

《SpringBoot异常处理/自定义格式校验的问题实例详解》文章探讨SpringBoot中自定义注解校验问题,区分参数级与类级约束触发的异常类型,建议通过@RestControllerAdvice... 目录1. 问题简要描述2. 异常触发1) 参数级别约束2) 类级别约束3. 异常处理1) 字段级别约束

java内存泄漏排查过程及解决

《java内存泄漏排查过程及解决》公司某服务内存持续增长,疑似内存泄漏,未触发OOM,排查方法包括检查JVM配置、分析GC执行状态、导出堆内存快照并用IDEAProfiler工具定位大对象及代码... 目录内存泄漏内存问题排查1.查看JVM内存配置2.分析gc是否正常执行3.导出 dump 各种工具分析4.

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

《在MySQL中实现冷热数据分离的方法及使用场景底层原理解析》MySQL冷热数据分离通过分表/分区策略、数据归档和索引优化,将频繁访问的热数据与冷数据分开存储,提升查询效率并降低存储成本,适用于高并发... 目录实现冷热数据分离1. 分表策略2. 使用分区表3. 数据归档与迁移在mysql中实现冷热数据分