当miniexcel遇上adb,报表数据导出性能调优建议

2023-10-13 05:20

本文主要是介绍当miniexcel遇上adb,报表数据导出性能调优建议,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

关注“Java艺术”一起来充电吧!

报表数据导出是一个常见且令人头疼的问题,该功能主要放在管理后台,系统运营人员经常需要导出一些数据做分析。报表导出遇到的难题,一是数据量大,二是查询耗时,也是最容易导致系统OOM或者拖垮数据库的问题。

如何解决查询慢的问题

报表数据导出通常伴随着复杂的sql语句,使用很多的查询条件,因此在设计表的时候我们都会通过添加冗余的列来减少多表连接查询,如果是最近几年的项目,考虑到报表数据量增长速度快且数据量大可能会使用分表解决,不过单表的数据量依然很大,且在遇到复杂的查询语句时也需要查多个表并聚合结果,这依然是很耗时的操作。

目前关系型数据库也被化分为OLAP和OLTP数据库,阿里AnalyticDB(adb)就属于分析型的分布式数据库(OLAP),主要用于数据分析,使用列存方式提升查询效率。adb非常适合应用于报表统计查询业务。

如何降低内存的使用

poi是一个提供读写excel文件的API类库,但使用不当很容易导致系统OOM,miniexcel正是为解决这一问题而编写的,当然,笔者在编写miniexcel时也考虑到了另一个问题,那就是大批量数据一次查询出来会占用太多内存,报表数据导出通常是大批量的数据,比如几十万、上百万,因此miniexcel也提供了分页查询导出的功能。

除此之外,miniexcel还支持自定义导入导出。miniexcel是一个基于poi封装的轻量且扩展性强的报表导入导出工具,支持.xls、.xlsx、csv格式。

easyexcel是阿里开源的一款excel导入导出工具,也是基于poi封装的,因此easyexcel与miniexcel在性能上并没有太大区别。我们拿easyexcel与miniexcel做过对此测试,对比结果是miniexcel的导出耗时以及导出文件的大小都略优于easyexcel,这一部分原因与miniexcel放弃支持表格样式有关。

目前miniexcel正在洋葱集团内部推广使用,作者也会一直维护这个项目,也非常欢迎业内朋友使用,并一起改进miniexcel。

最近我们的管理后台频繁被操作系统kill掉,笔者也从运维那里拿到一份dump数据,但由于运维提供的这份dump数据是在系统正常情况下导出的,因此并未能找出原因,不过从这份数据能够看出,系统在正常使用情况下,所消费的堆内存大约是2.3g,大部分是mybatis与spring消耗的内存,其它比较耗内存的是一个数据导出操作,堆中存储了五十多万条记录,因此笔者猜测系统频繁挂掉是同时执行多个数据导出任务导致的。

虽然miniexcel提供了分页导出的功能,但我们项目中并未广泛使用这一特性,原因只有一个,使用分页导出功能虽然能降低对内存的使用,避免多人同时导出大批量数据导致系统内存消耗过高最后被操作系统kill掉,但由于查询本就耗时,分页查询会更加耗时,所以分页功能目前只用于能用上索引的分页查询数据导出功能。

如果将报表导出操作的数据查询从查mysql数据库改为查询分析型数据仓库adb,将miniexcel提供的分页导出功能与adb的高性能查询结合,就能完美的解决数据导出占用大量内存导致系统频繁挂掉的问题。这是一个报表数据导出相关业务功能的优化建议。

公众号:Java艺术

扫码关注最新动态

这篇关于当miniexcel遇上adb,报表数据导出性能调优建议的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/201025

相关文章

C#实现将XML数据自动化地写入Excel文件

《C#实现将XML数据自动化地写入Excel文件》在现代企业级应用中,数据处理与报表生成是核心环节,本文将深入探讨如何利用C#和一款优秀的库,将XML数据自动化地写入Excel文件,有需要的小伙伴可以... 目录理解XML数据结构与Excel的对应关系引入高效工具:使用Spire.XLS for .NETC

MySQL数据目录迁移的完整过程

《MySQL数据目录迁移的完整过程》文章详细介绍了将MySQL数据目录迁移到新硬盘的整个过程,包括新硬盘挂载、创建新的数据目录、迁移数据(推荐使用两遍rsync方案)、修改MySQL配置文件和重启验证... 目录1,新硬盘挂载(如果有的话)2,创建新的 mysql 数据目录3,迁移 MySQL 数据(推荐两

Python数据验证神器Pydantic库的使用和实践中的避坑指南

《Python数据验证神器Pydantic库的使用和实践中的避坑指南》Pydantic是一个用于数据验证和设置的库,可以显著简化API接口开发,文章通过一个实际案例,展示了Pydantic如何在生产环... 目录1️⃣ 崩溃时刻:当你的API接口又双叒崩了!2️⃣ 神兵天降:3行代码解决验证难题3️⃣ 深度

MySQL快速复制一张表的四种核心方法(包括表结构和数据)

《MySQL快速复制一张表的四种核心方法(包括表结构和数据)》本文详细介绍了四种复制MySQL表(结构+数据)的方法,并对每种方法进行了对比分析,适用于不同场景和数据量的复制需求,特别是针对超大表(1... 目录一、mysql 复制表(结构+数据)的 4 种核心方法(面试结构化回答)方法 1:CREATE

详解C++ 存储二进制数据容器的几种方法

《详解C++存储二进制数据容器的几种方法》本文主要介绍了详解C++存储二进制数据容器,包括std::vector、std::array、std::string、std::bitset和std::ve... 目录1.std::vector<uint8_t>(最常用)特点:适用场景:示例:2.std::arra

C++,C#,Rust,Go,Java,Python,JavaScript的性能对比全面讲解

《C++,C#,Rust,Go,Java,Python,JavaScript的性能对比全面讲解》:本文主要介绍C++,C#,Rust,Go,Java,Python,JavaScript性能对比全面... 目录编程语言性能对比、核心优势与最佳使用场景性能对比表格C++C#RustGoJavapythonjav

MySQL中的DELETE删除数据及注意事项

《MySQL中的DELETE删除数据及注意事项》MySQL的DELETE语句是数据库操作中不可或缺的一部分,通过合理使用索引、批量删除、避免全表删除、使用TRUNCATE、使用ORDERBY和LIMI... 目录1. 基本语法单表删除2. 高级用法使用子查询删除删除多表3. 性能优化策略使用索引批量删除避免

MySQL 数据库进阶之SQL 数据操作与子查询操作大全

《MySQL数据库进阶之SQL数据操作与子查询操作大全》本文详细介绍了SQL中的子查询、数据添加(INSERT)、数据修改(UPDATE)和数据删除(DELETE、TRUNCATE、DROP)操作... 目录一、子查询:嵌套在查询中的查询1.1 子查询的基本语法1.2 子查询的实战示例二、数据添加:INSE

Linux服务器数据盘移除并重新挂载的全过程

《Linux服务器数据盘移除并重新挂载的全过程》:本文主要介绍在Linux服务器上移除并重新挂载数据盘的整个过程,分为三大步:卸载文件系统、分离磁盘和重新挂载,每一步都有详细的步骤和注意事项,确保... 目录引言第一步:卸载文件系统第二步:分离磁盘第三步:重新挂载引言在 linux 服务器上移除并重新挂p

使用MyBatis TypeHandler实现数据加密与解密的具体方案

《使用MyBatisTypeHandler实现数据加密与解密的具体方案》在我们日常的开发工作中,经常会遇到一些敏感数据需要存储,比如用户的手机号、身份证号、银行卡号等,为了保障数据安全,我们通常会对... 目录1. 核心概念:什么是 TypeHandler?2. 实战场景3. 代码实现步骤步骤 1:定义 E