协助报表开发之 MongoDB join 交叉汇总 位数比较

2024-03-25 11:08

本文主要是介绍协助报表开发之 MongoDB join 交叉汇总 位数比较,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

其他mongodb计算的文章

http://c.raqsoft.com.cn/article/1568626730687?r=CGQ

协助 mongodb 计算之数位比较:http://c.raqsoft.com.cn/article/1568597259340?r=CGQ

协助 MongoDB 计算之交叉汇总

http://c.raqsoft.com.cn/article/1568594893453?r=CGQ

 

 

 

 

 

处理多样性数据源是报表开发中的常见问题,而常见的 JasperReport 等报表工具本身却难以应付,比如展现两个 MongoDB 集合连接的结果。虽然 JasperReport 有 virtual data source 或 table join,但这些功能只在商业版或高端版本出现,在免费版中实现的难度很大。而且这些功能只支持两个数据源的连接,要实现多连接则麻烦得多。另外,这些功能只能基于图形化界面操作,对连接后的数据无法进行类似 SQL 的结构化计算。

       集算器 SPL 语言具有面向结构化处理的强计算引擎,支持多样性数据源,集成简单,可以协助不同报表工具方便地实现此类需求,下面用例子说明。

       Sales和 emp 是 MongoDB 中的两个集合,sales 中的字段 SellerId 逻辑上相当于外键,指向 emp 的 EId 字段,现在需要按时间段查询出 sales 中的订单,并和 emp 进行左连接,最后在报表中展现。部分源数据如下:

   集合sales

OrderIDClientSellerIdAmountOrderDate
26TAS12142.42009-08-05
27HP13538.62010-08-06
28DY11307.22010-08-07
29WVF194202010-08-08
30UFS181200.82009-08-09
31SWFR151488.82010-08-12
32JFS34682009-08-13

集合emp

EIdStateDeptNameGenderSalaryBirthday
2New YorkFinanceAshleyF110011980-07-19
3New MexicoSalesRachelF90001970-12-17
4TexasHREmilyF70001985-03-07
5TexasR&DAshleyF160001975-05-13
6CaliforniaSalesMatthewM110001984-07-07
7IllinoisSalesAlexisF90001972-08-16

使用集算器SPL的代码如下:

 A
1=mongo_open("mongodb://localhost:27017/test?user=root&password=sa")
2=mongo_shell(A1,"sales.find({$and:[{OrderDate:{$gte:'"+string(begin)+"'}},{  OrderDate:{ $lte:'"+string(end)+"'}} ] },{_id:0} )").fetch()
3=mongo_shell(A1,"emp.find(,,"{_id:0}").fetch()
4>mongo_close(A1)
5=join@1(A2:sales,SellerId;A3:emp,EId)
6=A5.new(sales.OrderID:OrderID,sales.Client:Client,sales.Amount:Amount,sales.OrderDate:OrderDate,emp.Name:Name,emp.Dept:Dept,emp.Gender:Gender)
7result   A6

A1: 连接 MongoDB,连接字格式为 mongo://ip:port/db?arg=value&…

A2: 使用 find 函数从集合 sales 中查询出某时间段的记录,取出 _id 之外的所有字段。其中查询条件中的 begin 和 end 是来自报表的外部参数,分别表示 OrderDate 的起始时间和终止时间。

函数 find 返回的是游标,并不会把数据直接读入内存,因此能够很好地支持大数据量。类似的,还可以用 skip、sort、conj 等函数继续操作游标,直到遇到函数 fetch、groups,或语句 for 时才会真正取数。本例直接用函数 fetch() 将数据读入内存,假如时间段是 2009-01-01 到 2009-12-31,则 A2 的计算结果如下:

a_100png

A3: 使用 find 函数从集合 carInfo 中取数,形成游标。过滤条件是空,取出 _id 之外的所有字段,结果如下:

a_101png

A4: 关闭 MongoDB。

A5: 将 A2 和 A3 进行左连接,连接字段是 A2 的 SellerId 和 A3 的 Eld,直观起见,连接后的两部分数据分别命名为 sales 和 emp。函数 join 执行连接计算,选项 @1 表示左连接,计算结果如下图左侧:

a_102png

可以看到,由于是左连接,因此 sales 中部分 SellerId 无法在 emp 中找到对应的记录。如果想进行全连接,可以使用选项 @f,无选项则表示内连接。

A6: 执行连接操作,从连接的结果中取出需要的字段,并用函数 new 组成二维表。比如sales.OrderID:OrderID表示从 A5 取出 sales.OrderID 字段,重命名为 OrderID(报表工具无法识别 sales.OrderID 这样的字段名)。计算结果如下:

a_103png

到此为止,报表需要的数据就全部计算出来了。
A7: 将 A6 中的二维表返回报表工具。
集算器对外提供 JDBC 接口,报表工具会将集算器识别为普通数据库,集成方案请参考相关文档。

接下来以 JasperReport 为例设计报表,表样如下:

a_104png

 需要定义两个报表参数 Pbegin、Pend,分别对应集算器中的两个参数。预览后可以看到报表结果:

a_105png

       报表调用集算器的方法和调用存储过程一样,此例中可以将本脚本保存为 mongodbJoin.dfx,在 JasperReport 的 SQL 设计器中可以用mongodbJoin $P{pbegin},$P{pend}来调用。

       简言之,SPL 从 MongoDB 获取多个集合数据后,将它们通过 join 函数进行连接计算,再通过函数 new 按需求将数据生成序表,供其它的报表工具展示。通过 SPL 对多个集合进行 join 关联,大大简化了对 MongoDB 数据的操作,有利于与其它报表工具的方便集成。

这篇关于协助报表开发之 MongoDB join 交叉汇总 位数比较的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/844792

相关文章

基于 Cursor 开发 Spring Boot 项目详细攻略

《基于Cursor开发SpringBoot项目详细攻略》Cursor是集成GPT4、Claude3.5等LLM的VSCode类AI编程工具,支持SpringBoot项目开发全流程,涵盖环境配... 目录cursor是什么?基于 Cursor 开发 Spring Boot 项目完整指南1. 环境准备2. 创建

SpringBoot 多环境开发实战(从配置、管理与控制)

《SpringBoot多环境开发实战(从配置、管理与控制)》本文详解SpringBoot多环境配置,涵盖单文件YAML、多文件模式、MavenProfile分组及激活策略,通过优先级控制灵活切换环境... 目录一、多环境开发基础(单文件 YAML 版)(一)配置原理与优势(二)实操示例二、多环境开发多文件版

使用docker搭建嵌入式Linux开发环境

《使用docker搭建嵌入式Linux开发环境》本文主要介绍了使用docker搭建嵌入式Linux开发环境,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录1、前言2、安装docker3、编写容器管理脚本4、创建容器1、前言在日常开发全志、rk等不同

JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法

《JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法》:本文主要介绍JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法,每种方法结合实例代码给大家介绍的非常... 目录引言:为什么"相等"判断如此重要?方法1:使用some()+includes()(适合小数组)方法2

Python实战之SEO优化自动化工具开发指南

《Python实战之SEO优化自动化工具开发指南》在数字化营销时代,搜索引擎优化(SEO)已成为网站获取流量的重要手段,本文将带您使用Python开发一套完整的SEO自动化工具,需要的可以了解下... 目录前言项目概述技术栈选择核心模块实现1. 关键词研究模块2. 网站技术seo检测模块3. 内容优化分析模

基于Java开发一个极简版敏感词检测工具

《基于Java开发一个极简版敏感词检测工具》这篇文章主要为大家详细介绍了如何基于Java开发一个极简版敏感词检测工具,文中的示例代码简洁易懂,感兴趣的小伙伴可以跟随小编一起学习一下... 目录你是否还在为敏感词检测头疼一、极简版Java敏感词检测工具的3大核心优势1.1 优势1:DFA算法驱动,效率提升10

Python如何实现高效的文件/目录比较

《Python如何实现高效的文件/目录比较》在系统维护、数据同步或版本控制场景中,我们经常需要比较两个目录的差异,本文将分享一下如何用Python实现高效的文件/目录比较,并灵活处理排除规则,希望对大... 目录案例一:基础目录比较与排除实现案例二:高性能大文件比较案例三:跨平台路径处理案例四:可视化差异报

Python开发简易网络服务器的示例详解(新手入门)

《Python开发简易网络服务器的示例详解(新手入门)》网络服务器是互联网基础设施的核心组件,它本质上是一个持续运行的程序,负责监听特定端口,本文将使用Python开发一个简单的网络服务器,感兴趣的小... 目录网络服务器基础概念python内置服务器模块1. HTTP服务器模块2. Socket服务器模块

Java 与 LibreOffice 集成开发指南(环境搭建及代码示例)

《Java与LibreOffice集成开发指南(环境搭建及代码示例)》本文介绍Java与LibreOffice的集成方法,涵盖环境配置、API调用、文档转换、UNO桥接及REST接口等技术,提供... 目录1. 引言2. 环境搭建2.1 安装 LibreOffice2.2 配置 Java 开发环境2.3 配

Python按照24个实用大方向精选的上千种工具库汇总整理

《Python按照24个实用大方向精选的上千种工具库汇总整理》本文整理了Python生态中近千个库,涵盖数据处理、图像处理、网络开发、Web框架、人工智能、科学计算、GUI工具、测试框架、环境管理等多... 目录1、数据处理文本处理特殊文本处理html/XML 解析文件处理配置文件处理文档相关日志管理日期和