由MapTile引发的ResultSet的思考及实践

2024-06-03 10:28

本文主要是介绍由MapTile引发的ResultSet的思考及实践,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

其实这篇文章应该是上周末来写的,但是苦逼啊。别人都抱怨工作996,我特么直接9117了,连轴转12天,完全没有个人时间,苦逼啊!

本来周末计划看完龙珠Z(日语)布欧篇 呢,给自己一个过儿童节的仪式感,结果也只看了一点,时间太紧张了。

要写的代码、要总结的东西太多了。至于ResultSet这个,从梳理思路、验证逻辑、查阅资料、理解原理、总结记录,又花了我小一天时间,搞到半夜。

一、背景

我五一的时候,写脚本通过代理爬取osm的栅格瓦片数据(即PNG图片),来将我之前写的wkt在线绘制展示_EPSG4326_致敬开源实现瓦片本地化。

对于瓦片数据来说,整个世界都是正方形的,如下图。

瓦片数据按层级划分如下

zoom leveledge lengthnumber of tiles
011*1
122*2
244*4
388*8
41616*16
53232*32
66464*64
7128128*128
8256256*256
9512512*512
1010241024*1024
1120482048*2048
1240964096*4096
1381928192*8192
141638416384*16384
153276832768*32768
166553665536*65536
17131072131072*131072
18262144262144*262144
19524288524288*524288

想要爬取所有层级的栅格瓦片,数据量还是很大的。我从0层级一直爬取到19层级,需要存储14_3165_5765个瓦片,我存入了PostgreSQL。数据库肯定要有对应的可视化工具才好使呀,对于咱们这种面向SQL编程的码农来说,最常见的数据库可视化工具就两种

  • dbeaver:开源免费
  • navicat:闭源付费

在结合这两个工具进行操作时,偶然发现,navicat和dbeaver中执行相同的SQL语句 select * from tiles 时,navicat会出现卡死无响应的情况,而dbeaver不仅不会卡、还会快速的查出前200条数据来。

怎么会出现这种情况呢,按理来说,navicat是闭源付费的,应该做的比dbeaver更好才对啊。

针对这个问题,我从原生的JDBC展开了探索。

二、ResultSet查询调优

以下调优只针对于PostgreSQL数据库。并不适用其他数据库。

通过自己手撕原生的JDBC查询ResultSet、以及查阅pgJDBC官方文档发现有两种查询方式。

  • 默认参数结果集,驱动程序会一次性收集查询的所有结果行,通俗说是多量少次。这也是我们最常使用的方式了,但是数据量大时,会卡爆程序内存和网络带宽。
  • 参数调优结果集,需要关闭查询时的事务,通俗说是少量多次。对于pg来说,查询时的事务也是默认开启的。这个方式对程序来说是性能最优之选。

pgJDBC文档描述如下图

下面就直接进行实战,源码地址为meethigher/result-set-test: this is a postgresql result-set demo

/*** 方案一:* 使用select * from table where order by 进行查询,但是使用默认方式*/
private void plan1(String startTime, String endTime) {StringBuilder queryBuilder = new StringBuilder("select * from ").append(jdbcUtils.getTableName()).append(" where ").append(jdbcUtils.getFieldArray()[2]).append(" >= ? and ").append(jdbcUtils.getFieldArray()[2]).append(" <= ? order by ").append(jdbcUtils.getFieldArray()[2]).append(" asc");long start = System.currentTimeMillis();long startUsedMemory = memoryMonitor.getUsedMemory();try (Connection connection = jdbcUtils.getJdbcTemplate().getDataSource().getConnection()) {PreparedStatement ps = connection.prepareStatement(queryBuilder.toString());ps.setObject(1, startTime);ps.setObject(2, endTime);ResultSet rs = ps.executeQuery();log.info("plan1 consumed {}, {}", TimeUtils.humanizedFormat(System.currentTimeMillis(), start),memoryMonitor.convertBytes(memoryMonitor.getUsedMemory() - startUsedMemory));} catch (Exception ignore) {}
}/*** 方案二:* 使用select * from table where order by 进行查询,但是使用参数调优*/
private void plan2(String startTime, String endTime) {StringBuilder queryBuilder = new StringBuilder("select * from ").append(jdbcUtils.getTableName()).append(" where ").append(jdbcUtils.getFieldArray()[2]).append(" >= ? and ").append(jdbcUtils.getFieldArray()[2]).append(" <= ? order by ").append(jdbcUtils.getFieldArray()[2]).append(" asc");long start = System.currentTimeMillis();long startUsedMemory = memoryMonitor.getUsedMemory();try (Connection connection = jdbcUtils.getJdbcTemplate().getDataSource().getConnection()) {//对于postgresql,只有关闭事务,setFetchSize才会生效connection.setAutoCommit(false);//对于postgresql,后面的两个参数其实也就是默认值时使用的PreparedStatement ps = connection.prepareStatement(queryBuilder.toString(), ResultSet.TYPE_FORWARD_ONLY, ResultSet.CONCUR_READ_ONLY);ps.setFetchSize(1000);ps.setFetchDirection(ResultSet.FETCH_FORWARD);ps.setObject(1, startTime);ps.setObject(2, endTime);ResultSet rs = ps.executeQuery();log.info("plan2 consumed {}, {}", TimeUtils.humanizedFormat(System.currentTimeMillis(), start),memoryMonitor.convertBytes(memoryMonitor.getUsedMemory() - startUsedMemory));} catch (Exception ignore) {}
}

运行结果如下图

综上可知,其实对于这种大数据量来说少量多次的查询远比多量少次的查询要好的多,至少对程序和数据库来说,都是上上只选。这应该也就是navicat会卡死、而dbeaver不仅不会卡死而且查得还很快的原因了吧!

三、参考致谢

How to calculate number of tiles in a bounding box for OpenStreetMaps | by Abhi | Medium

Tiles à la Google Maps: Coordinates, Tile Bounds and Projection | No code | MapTiler

Issuing a Query and Processing the Result | pgJDBC

PostgreSQL: Documentation: 7.4: Issuing a Query and Processing the Result

这篇关于由MapTile引发的ResultSet的思考及实践的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1026725

相关文章

Spring Boot集成/输出/日志级别控制/持久化开发实践

《SpringBoot集成/输出/日志级别控制/持久化开发实践》SpringBoot默认集成Logback,支持灵活日志级别配置(INFO/DEBUG等),输出包含时间戳、级别、类名等信息,并可通过... 目录一、日志概述1.1、Spring Boot日志简介1.2、日志框架与默认配置1.3、日志的核心作用

破茧 JDBC:MyBatis 在 Spring Boot 中的轻量实践指南

《破茧JDBC:MyBatis在SpringBoot中的轻量实践指南》MyBatis是持久层框架,简化JDBC开发,通过接口+XML/注解实现数据访问,动态代理生成实现类,支持增删改查及参数... 目录一、什么是 MyBATis二、 MyBatis 入门2.1、创建项目2.2、配置数据库连接字符串2.3、入

Android Paging 分页加载库使用实践

《AndroidPaging分页加载库使用实践》AndroidPaging库是Jetpack组件的一部分,它提供了一套完整的解决方案来处理大型数据集的分页加载,本文将深入探讨Paging库... 目录前言一、Paging 库概述二、Paging 3 核心组件1. PagingSource2. Pager3.

在Java中使用OpenCV实践

《在Java中使用OpenCV实践》用户分享了在Java项目中集成OpenCV4.10.0的实践经验,涵盖库简介、Windows安装、依赖配置及灰度图测试,强调其在图像处理领域的多功能性,并计划后续探... 目录前言一 、OpenCV1.简介2.下载与安装3.目录说明二、在Java项目中使用三 、测试1.测

MyBatis-Plus 自动赋值实体字段最佳实践指南

《MyBatis-Plus自动赋值实体字段最佳实践指南》MyBatis-Plus通过@TableField注解与填充策略,实现时间戳、用户信息、逻辑删除等字段的自动填充,减少手动赋值,提升开发效率与... 目录1. MyBATis-Plus 自动赋值概述1.1 适用场景1.2 自动填充的原理1.3 填充策略

Olingo分析和实践之EDM 辅助序列化器详解(最佳实践)

《Olingo分析和实践之EDM辅助序列化器详解(最佳实践)》EDM辅助序列化器是ApacheOlingoOData框架中无需完整EDM模型的智能序列化工具,通过运行时类型推断实现灵活数据转换,适用... 目录概念与定义什么是 EDM 辅助序列化器?核心概念设计目标核心特点1. EDM 信息可选2. 智能类

Olingo分析和实践之OData框架核心组件初始化(关键步骤)

《Olingo分析和实践之OData框架核心组件初始化(关键步骤)》ODataSpringBootService通过初始化OData实例和服务元数据,构建框架核心能力与数据模型结构,实现序列化、URI... 目录概述第一步:OData实例创建1.1 OData.newInstance() 详细分析1.1.1

Olingo分析和实践之ODataImpl详细分析(重要方法详解)

《Olingo分析和实践之ODataImpl详细分析(重要方法详解)》ODataImpl.java是ApacheOlingoOData框架的核心工厂类,负责创建序列化器、反序列化器和处理器等组件,... 目录概述主要职责类结构与继承关系核心功能分析1. 序列化器管理2. 反序列化器管理3. 处理器管理重要方

虚拟机Centos7安装MySQL数据库实践

《虚拟机Centos7安装MySQL数据库实践》用户分享在虚拟机安装MySQL的全过程及常见问题解决方案,包括处理GPG密钥、修改密码策略、配置远程访问权限及防火墙设置,最终通过关闭防火墙和停止Net... 目录安装mysql数据库下载wget命令下载MySQL安装包安装MySQL安装MySQL服务安装完成

SpringBoot整合(ES)ElasticSearch7.8实践

《SpringBoot整合(ES)ElasticSearch7.8实践》本文详细介绍了SpringBoot整合ElasticSearch7.8的教程,涵盖依赖添加、客户端初始化、索引创建与获取、批量插... 目录SpringBoot整合ElasticSearch7.8添加依赖初始化创建SpringBoot项