使用filebeat采集文件到es中

2024-05-16 11:38
文章标签 es 使用 采集 filebeat

本文主要是介绍使用filebeat采集文件到es中,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

继上一篇logstash采集日志

之前用logstash做日志采集,但是发现logstash很占用机器资源导致机器运行有点慢。查询资料表明logstash使用Java编写,插件是使用jruby编写,对机器的资源要求会比较高,网上有一篇关于其性能测试的报告。之前做过和filebeat的测试对比。在采集日志方面,对CPU,内存上都要比前者高很多。那么果断使用filebeat作为替代方案。走起!

1.下载安装

https://artifacts.elastic.co/downloads/beats/filebeat/filebeat-6.4.3-windows-x86_64.zip,(选择版本一定要和es一致,否则会有问题)

2.采集某个文件到es中

进入主目录,可以看到filebeat.yml 文件,我们备份一下。然后编辑filebeat.yml文件(将此文件内容清空,重新编辑)。
yml文件格式要求严格缩进

filebeat.inputs:- type: log #默认log,从日志文件读取每一行。stdin,从标准输入读取paths:- F:/test/service-thymeleaf.log # 这里也可用通配符采集多个文件如F:/test/*.logoutput.elasticsearch:hosts: ["localhost:9200"]

在主目录下命令行执行 filebeat.exe -e -c filebeat.yml,观察es的索引多了filebeat-日期格式样式的索引。
这个自动生成的索引名称看着别扭,我们自己修改。日期后缀每天新建一个索引。setup.template.name setup.template.pattern 两项的值可以随意起

filebeat.inputs:- type: log #默认log,从日志文件读取每一行。stdin,从标准输入读取paths:- F:/test/service-thymeleaf.logsetup.template.name: "my-log"
setup.template.pattern: "my-log-*"output.elasticsearch:hosts: ["localhost:9200"]index: "service-thymeleaf-%{+yyyy.MM.dd}"

采集java多行日志合并

filebeat.inputs:- type: log #默认log,从日志文件读取每一行。stdin,从标准输入读取paths:- F:/test/service-thymeleaf.logmultiline.pattern: '^\d{4}\-\d{2}\-\d{2}\s\d{2}:\d{2}:\d{2}' #匹配的正则 不是以2019-09-08 12:23:23 格式开头的将合并到上一行multiline.negate: true #多行匹配模式后配置的模式是否取反,默认falsemultiline.match: after #定义多行内容被添加到模式匹配行之后还是之前,默认无,可以被设置为after或者beforesetup.template.name: "my-log"
setup.template.pattern: "my-log-*"output.elasticsearch:hosts: ["localhost:9200"]index: "service-thymeleaf-%{+yyyy.MM.dd}"
采集多个文件到不同的索引

例如将a.log 采集到a-2019-09-09索引,b.log 采集到b-2019-09-09索引

filebeat.inputs:- type: log #默认log,从日志文件读取每一行。stdin,从标准输入读取paths:- F:/test/service-thymeleaf.logmultiline.pattern: '^\d{4}\-\d{2}\-\d{2}\s\d{2}:\d{2}:\d{2}' #匹配的正则 不是以2019-09-08 12:23:23 格式开头的将合并到上一行multiline.negate: true #多行匹配模式后配置的模式是否取反,默认falsemultiline.match: after #定义多行内容被添加到模式匹配行之后还是之前,默认无,可以被设置为after或者beforefields:index: 'service-thymeleaf'- type: log #默认log,从日志文件读取每一行。stdin,从标准输入读取paths:- F:/test/service-es.logmultiline.pattern: '^\d{4}\-\d{2}\-\d{2}\s\d{2}:\d{2}:\d{2}' #匹配的正则multiline.negate: true #多行匹配模式后配置的模式是否取反,默认falsemultiline.match: after #定义多行内容被添加到模式匹配行之后还是之前,默认无,可以被设置为after或者beforefields:index: 'service-es'   setup.template.name: "my-log"
setup.template.pattern: "my-log-*"output.elasticsearch:hosts: ["localhost:9200"]indices:- index: "service-thymeleaf-%{+yyyy.MM.dd}"when.contains:fields:index: "service-thymeleaf"- index: "service-es-%{+yyyy.MM.dd}"when.contains:fields:index: "service-es"

如果想对采集的内容进行预处理(过滤等),比如从日志中提取某些字段filebeat不像logstash那么灵活需要借助es的pipeline,而此处主要是将@timestamps时间修改日志的时间(默认是采集的时间)
(1)在es中创建一个pipeline,timestamp-pipeline-id 是唯一的

PUT _ingest/pipeline/timestamp-pipeline-id
{"description": "timestamp pipeline","processors": [{"grok": {"field": "message","patterns": ["%{TIMESTAMP_ISO8601:timestamp} "]}},{"date": {"field": "timestamp","formats": ["yyyy-MM-dd HH:mm:ss.SSS"]},"remove": {"field": "timestamp"}}],"on_failure": [{"set": {"field": "_index","value": "failed-{{ _index }}"}}]
}

创建pipeline可以在es-head中执行
在这里插入图片描述
也可以在kibana中的开发工具执行
在这里插入图片描述
2.然后filebeat.yml中添加
pipeline: “timestamp-pipeline-id”

filebeat.inputs:- type: log #默认log,从日志文件读取每一行。stdin,从标准输入读取paths:- F:/test/service-thymeleaf.logmultiline.pattern: '^\d{4}\-\d{2}\-\d{2}\s\d{2}:\d{2}:\d{2}' #匹配的正则multiline.negate: true #多行匹配模式后配置的模式是否取反,默认falsemultiline.match: after #定义多行内容被添加到模式匹配行之后还是之前,默认无,可以被设置为after或者beforefields:index: 'service-thymeleaf'- type: log #默认log,从日志文件读取每一行。stdin,从标准输入读取paths:- F:/test/service-es.logmultiline.pattern: '^\d{4}\-\d{2}\-\d{2}\s\d{2}:\d{2}:\d{2}' #匹配的正则multiline.negate: true #多行匹配模式后配置的模式是否取反,默认falsemultiline.match: after #定义多行内容被添加到模式匹配行之后还是之前,默认无,可以被设置为after或者beforefields:index: 'service-es'setup.template.name: "my-log"
setup.template.pattern: "my-log-*"output.elasticsearch:hosts: ["localhost:9200"]indices:- index: "service-thymeleaf-%{+yyyy.MM.dd}"when.contains:fields:index: "service-thymeleaf"- index: "service-es-%{+yyyy.MM.dd}"when.contains:fields:index: "service-es"pipeline: "timestamp-pipeline-id"document_type: log #该type会被添加到type字段,对于输出到ES来说,这个输入时的type字段会被存储,默认logmax_retries: 3 #ES重试次数,默认3次,超过3次后,当前事件将被丢弃

如有问题,私信一起学习交流。

这篇关于使用filebeat采集文件到es中的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/994807

相关文章

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

使用Python构建智能BAT文件生成器的完美解决方案

《使用Python构建智能BAT文件生成器的完美解决方案》这篇文章主要为大家详细介绍了如何使用wxPython构建一个智能的BAT文件生成器,它不仅能够为Python脚本生成启动脚本,还提供了完整的文... 目录引言运行效果图项目背景与需求分析核心需求技术选型核心功能实现1. 数据库设计2. 界面布局设计3

使用IDEA部署Docker应用指南分享

《使用IDEA部署Docker应用指南分享》本文介绍了使用IDEA部署Docker应用的四步流程:创建Dockerfile、配置IDEADocker连接、设置运行调试环境、构建运行镜像,并强调需准备本... 目录一、创建 dockerfile 配置文件二、配置 IDEA 的 Docker 连接三、配置 Do

Android Paging 分页加载库使用实践

《AndroidPaging分页加载库使用实践》AndroidPaging库是Jetpack组件的一部分,它提供了一套完整的解决方案来处理大型数据集的分页加载,本文将深入探讨Paging库... 目录前言一、Paging 库概述二、Paging 3 核心组件1. PagingSource2. Pager3.

python使用try函数详解

《python使用try函数详解》Pythontry语句用于异常处理,支持捕获特定/多种异常、else/final子句确保资源释放,结合with语句自动清理,可自定义异常及嵌套结构,灵活应对错误场景... 目录try 函数的基本语法捕获特定异常捕获多个异常使用 else 子句使用 finally 子句捕获所

C++11右值引用与Lambda表达式的使用

《C++11右值引用与Lambda表达式的使用》C++11引入右值引用,实现移动语义提升性能,支持资源转移与完美转发;同时引入Lambda表达式,简化匿名函数定义,通过捕获列表和参数列表灵活处理变量... 目录C++11新特性右值引用和移动语义左值 / 右值常见的左值和右值移动语义移动构造函数移动复制运算符

Python对接支付宝支付之使用AliPay实现的详细操作指南

《Python对接支付宝支付之使用AliPay实现的详细操作指南》支付宝没有提供PythonSDK,但是强大的github就有提供python-alipay-sdk,封装里很多复杂操作,使用这个我们就... 目录一、引言二、准备工作2.1 支付宝开放平台入驻与应用创建2.2 密钥生成与配置2.3 安装ali

C#中lock关键字的使用小结

《C#中lock关键字的使用小结》在C#中,lock关键字用于确保当一个线程位于给定实例的代码块中时,其他线程无法访问同一实例的该代码块,下面就来介绍一下lock关键字的使用... 目录使用方式工作原理注意事项示例代码为什么不能lock值类型在C#中,lock关键字用于确保当一个线程位于给定实例的代码块中时

MySQL 强制使用特定索引的操作

《MySQL强制使用特定索引的操作》MySQL可通过FORCEINDEX、USEINDEX等语法强制查询使用特定索引,但优化器可能不采纳,需结合EXPLAIN分析执行计划,避免性能下降,注意版本差异... 目录1. 使用FORCE INDEX语法2. 使用USE INDEX语法3. 使用IGNORE IND