java按行读取文件的工具类

2024-01-31 22:32
文章标签 java 工具 读取 按行

本文主要是介绍java按行读取文件的工具类,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

由于工作的需求,经常要用到按行去读去文件(文件数据动不动就是上亿,直接读取也是不现实的,肯定会oom),然后把读到的行进行一个特殊的处理。导致按行读取的代码 在项目中到处都是。关键用到的时候,还不知道之前的按行读怎么实现的,不用的时候,到处都是,看吐了。用的时候,死活找不到,气死了。

于是将这个对我来说常用的需求抽取成了一个工具类,使用起来非常方便。希望能帮到用到的人。大家有好点建议,也可以在下边留言。

按行读,并做特殊化业务的处理,这个工具网上我是没有看到过的,包括hutool中,也是没有的。

下边看看具体的实现。

## 工具类,按行读去的代码

 在调用的时候,需要传入一个处理逻辑的执行单元。也就是说,你在拿到一行以后具体想干什么。例如,我想拿到一样文件内容,然后转json,然后存到数据库。

package com.angus.pull.utils;import java.io.*;
import java.util.List;/*** @author angus* @date 2021/1/21 14:46*/
public class ReadFileByLineUtil {public interface TaskUnitContent {/*** 任务执行单元* @param line 从文件中读到的一行内容*/void taskContent(String line);}/*** 实现* @param taskUnitContent 执行单元,* @param filePathList 需要处理的文件的路径,文件路径存放在list里边。* @throws IOException*/public static void ReadFileByLine(TaskUnitContent taskUnitContent,  List<String> filePathList) throws IOException {Long startTime = System.currentTimeMillis();for (Object path:filePathList) {FileInputStream fis= null;try {fis = new FileInputStream(String.valueOf(path));} catch (FileNotFoundException e) {e.printStackTrace();}InputStreamReader isr= null;try {isr = new InputStreamReader(fis, "UTF-8");} catch (UnsupportedEncodingException e) {e.printStackTrace();}BufferedReader br = new BufferedReader(isr);String line = "";while ((line = br.readLine()) != null) {//读到的行,交给处理单元去处理,处理单元是由用户实现的。try {taskUnitContent.taskContent(line);}catch (Exception e){e.printStackTrace();}}System.out.println("本次按行读文件总耗时(单位秒):" + (System.currentTimeMillis() - startTime)/1000);br.close();isr.close();fis.close();}}}

 

## 如果使用这个工具类 

  不写内容了,直接看注释吧,白送了一个获取一个文件夹下包括子目录内所有的文件的工具方法。

package com.angus.pull;import ccom.angus.pull.utils.ReadFileByLineUtil;
import java.io.*;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.List;/*** @author angus* @date 2020/8/25 14:56*/
public class ReadingDemo {public static void main(String[] args) throws IOException {//想要获取文件的指定的文件夹File file = new File("C:\\Users\\iamazy\\Desktop\\demo");//定义一个文件list,传给下边的工具方法,工具方法会在这个list里边存上边指定文件夹下的符合条件的文件。List<File> fileList = new ArrayList<>();// 获取所有文件的路径List<String> filePathList = new ArrayList<>();//递归获取一个文件夹下所有的以.json为后缀的文件。func(file, fileList, filePathList);//调用工具类,按行读去文件,并使用lamda表达式,定义执行单元。ReadFileByLineUtil.ReadFileByLine(line -> {//我这里只是简单的把读到的文件的行,进行打印。大家可以在这里定义自己的处理逻辑。System.out.println(line);//下边我是直接传入了一个想要读取的文件,这里是一个list,如果大家想要读取多个文件,则可以直接添加。如果有需求获取一个文件夹下所有的文件,文件又比较多。就可以使用我上边调用的func()方法。把获取到的文件列表放到下边,使用filePathList 替换Arrays.asLis()这个方法。}, Arrays.asList("C:\\Users\\iamazy\\Desktop\\test.txt"));}/*** 这个也是一个工具类,有时候我们想要获取一个目录下,全部包含子目录内所有的指定后缀的文件*/private static void func(File file, List<File> fileList, List<String> filePathList) {File[] fs = file.listFiles();for (File f : fs) {//若是目录,则递归打印该目录下的文件if (f.isDirectory()){func(f, fileList, filePathList);}if (f.isFile()){//若是文件,直接打印,我这里是只获取.josn后缀的文件。可以自己定义。if(f.getName().contains("json")){fileList.add(f);filePathList.add(f.getPath());}}}}
}

 

ps~ 大家看了多提提意见,不胜感激。可以直接在下边留言,我每天都会看博客的。

这篇关于java按行读取文件的工具类的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/665259

相关文章

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

Apache Ignite 与 Spring Boot 集成详细指南

《ApacheIgnite与SpringBoot集成详细指南》ApacheIgnite官方指南详解如何通过SpringBootStarter扩展实现自动配置,支持厚/轻客户端模式,简化Ign... 目录 一、背景:为什么需要这个集成? 二、两种集成方式(对应两种客户端模型) 三、方式一:自动配置 Thick

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

Spring WebClient从入门到精通

《SpringWebClient从入门到精通》本文详解SpringWebClient非阻塞响应式特性及优势,涵盖核心API、实战应用与性能优化,对比RestTemplate,为微服务通信提供高效解决... 目录一、WebClient 概述1.1 为什么选择 WebClient?1.2 WebClient 与

Java.lang.InterruptedException被中止异常的原因及解决方案

《Java.lang.InterruptedException被中止异常的原因及解决方案》Java.lang.InterruptedException是线程被中断时抛出的异常,用于协作停止执行,常见于... 目录报错问题报错原因解决方法Java.lang.InterruptedException 是 Jav

深入浅出SpringBoot WebSocket构建实时应用全面指南

《深入浅出SpringBootWebSocket构建实时应用全面指南》WebSocket是一种在单个TCP连接上进行全双工通信的协议,这篇文章主要为大家详细介绍了SpringBoot如何集成WebS... 目录前言为什么需要 WebSocketWebSocket 是什么Spring Boot 如何简化 We

java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)

《java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)》:本文主要介绍java中pdf模版填充表单踩坑的相关资料,OpenPDF、iText、PDFBox是三... 目录准备Pdf模版方法1:itextpdf7填充表单(1)加入依赖(2)代码(3)遇到的问题方法2:pd

Java Stream流之GroupBy的用法及应用场景

《JavaStream流之GroupBy的用法及应用场景》本教程将详细介绍如何在Java中使用Stream流的groupby方法,包括基本用法和一些常见的实际应用场景,感兴趣的朋友一起看看吧... 目录Java Stream流之GroupBy的用法1. 前言2. 基础概念什么是 GroupBy?Stream

SpringBoot监控API请求耗时的6中解决解决方案

《SpringBoot监控API请求耗时的6中解决解决方案》本文介绍SpringBoot中记录API请求耗时的6种方案,包括手动埋点、AOP切面、拦截器、Filter、事件监听、Micrometer+... 目录1. 简介2.实战案例2.1 手动记录2.2 自定义AOP记录2.3 拦截器技术2.4 使用Fi

最新Spring Security的基于内存用户认证方式

《最新SpringSecurity的基于内存用户认证方式》本文讲解SpringSecurity内存认证配置,适用于开发、测试等场景,通过代码创建用户及权限管理,支持密码加密,虽简单但不持久化,生产环... 目录1. 前言2. 因何选择内存认证?3. 基础配置实战❶ 创建Spring Security配置文件