ITTC数据挖掘平台介绍(五) 数据导入导出向导和报告生成

本文主要是介绍ITTC数据挖掘平台介绍(五) 数据导入导出向导和报告生成,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一. 前言

    经过了一个多月的努力,软件系统又添加了不少新功能。这些功能包括非常实用的数据导入导出,对触摸进行优化的画布和画笔工具,以及对一些智能分析的报告生成模块等。进一步加强了平台系统级的功能。

    马上要进入研三了,这套系统和我本人一样,前途未卜。一方面,实验室要求重新以JAVA开发一套数据挖掘框架而放弃当前的.NET版本,我的思路是两边一起发展,优势互补,可惜后继无人。另一方面,马上毕业的我,未来做不做数据挖掘工作都是两说,在多方面的压力下,开发软件目前近似于奢侈的选择。但是,就算是为了自己心里的那个“爽”字,少打一会游戏,做这个事情还是值得的。

   下一步,我会做一个针对实习和招聘的微博数据分析工具,整合分析所有相关信息,为我近几个月的找工作事业提供帮助。看看能不能做到WEB端。

    革命尚未成功,同志仍需努力!

我的插件式桌面软件框架类库(一)XFrmWork简介

ITTC数据挖掘平台介绍(综述)——平台简介

ITTC数据挖掘平台介绍(二) 微博数据挖掘和分析

ITTC数据挖掘平台介绍(三) 微博社团和传播分析

ITTC数据挖掘平台介绍(四) 框架改进和新功能

ITTC数据挖掘平台介绍(五) 数据导入导出向导和报告生成

ITTC数据挖掘系统(六)批量任务,数据查看器和自由文档

ITTC数据挖掘平台介绍(七)强化的数据库, 虚拟化,脚本编辑器

二.数据导入和导出

    对于一般用户而言,数据通常都不保存在数据库,而是文件的形式,常用的txt, Excel或者XML都是可用的选择。同样,用户也需要随时将分析的结果,采集到的数据导出到文件中。因此,数据导入导出必不可少。

    考虑需要用户选择的参数,在导入方面,需要知道数据的类型(微博,微博用户,还是新闻等),数据格式(JSON,XML还是EXCEL),还要知道导入哪些字段; 在导出方面,要知道导出的数据源名称,数据格式和导出的位置。因此,我们选择了向导作为导入导出的基本设置UI。

    image

  在数据管理器中,点击“数据导入导出”按钮。

   image

  骚气的海绵宝宝。

 image

   可选择导入还是导出。

image

  因为要对数据进行反序列化操作,因此必须知道导入的数据类型。所有在系统中实现了IComputable基类接口的数据,在此都能被选择。

  image

  选择文件类型格式,目前支持了以上五种常用格式,但未能直接支持EXCEL. 所谓CompressJson,是Json数据通过ZIP压缩获取的数据。

  image 

  选取导入/导出的字段,这是整个系统的精髓,首先不是所有字段都能导出,比如List列表,而且也不是所有字段都需要导出。因此用户可通过多选选择字段。

  所有向导完成后,即可将数据以所需的格式导出到文件之中,方便进一步的分析。

  当然,缺点在于,所有数据的表头字段必须和系统内定义的属性名称一致。例如,Name必须是Name, 这也是无可奈何的事情,难不成用户还需要设置像ORM一样的映射关系?这一点,还是需要我们从SPSS和EXCEL这些系统中学习。

  三. 触摸优化

   大规模可视化画布,在大型触摸屏的效果可谓可圈可点。这非常便于客户展示和交互。因此,我对触摸功能做了大幅度的增强,用户可方便的通过单指拖拽,双指放缩/旋转,以及在画布上手写注释等功能。

   为了提升操作体验,还加入了个惯性效果,移动,旋转和放缩都有一定的惯性。操作更为流畅。

image

   笔触方面,可以选择不同大小的笔触,可实现压力感应(根据硬件有关),选择不同的画笔颜色,如下图所示。

imageimage

经过优化后,系统在大型触摸板上的体验效果非常好。但不可避免的是,在点数量较多(超过1000以上),动态惯性效果就有明显的卡顿。

  四. 报告生成系统

    绝大多数应用场合,用户直接面对的不是软件,而是生成的报告和文档。因此在这一次迭代更新上,开发了报告生成系统,利用开源的DocX组件,可以非常方便的生成Word文档,可被EXCEL 2007和2010版本打开。

   使用起来也非常简单,以“微博传播分析”为例,勾选“生成Word文档”选项,即可生成文档。

image

生成的报告如下图所示:

   image

  当然,缺点也很明显, DocX对Chart的控制能力并不好,样式和颜色等都不能很好的设定。只能满足基本的功能,但用户还是可以在图表中点击右键自行修改,远比简单的贴图好得多。

  另外,文档生成速度也很快,几十页的图文并茂的文档,包括表格和图片,也仅仅需要一两秒钟,性能优异。

  五. 总结

     千里之行始于足下,任何功能都是人一个一个写出来的。这些功能都是算法和数据无关的,可重用能力很强,各类数据可以无缝的使用这些新功能。

     未来将加入更多有用的新功能,打造不需要写代码的简单易用的数据分析和挖掘引擎!


作者:热情的沙漠
出处:http://www.cnblogs.com/buptzym/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。


 本文转自FerventDesert博客园博客,原文链接:http://www.cnblogs.com/buptzym/p/3236546.html,如需转载请自行联系原作者

这篇关于ITTC数据挖掘平台介绍(五) 数据导入导出向导和报告生成的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/174437

相关文章

SpringBoot+EasyExcel实现自定义复杂样式导入导出

《SpringBoot+EasyExcel实现自定义复杂样式导入导出》这篇文章主要为大家详细介绍了SpringBoot如何结果EasyExcel实现自定义复杂样式导入导出功能,文中的示例代码讲解详细,... 目录安装处理自定义导出复杂场景1、列不固定,动态列2、动态下拉3、自定义锁定行/列,添加密码4、合并

zookeeper端口说明及介绍

《zookeeper端口说明及介绍》:本文主要介绍zookeeper端口说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、zookeeper有三个端口(可以修改)aVNMqvZ二、3个端口的作用三、部署时注意总China编程结一、zookeeper有三个端口(可以

SQL中如何添加数据(常见方法及示例)

《SQL中如何添加数据(常见方法及示例)》SQL全称为StructuredQueryLanguage,是一种用于管理关系数据库的标准编程语言,下面给大家介绍SQL中如何添加数据,感兴趣的朋友一起看看吧... 目录在mysql中,有多种方法可以添加数据。以下是一些常见的方法及其示例。1. 使用INSERT I

Python使用vllm处理多模态数据的预处理技巧

《Python使用vllm处理多模态数据的预处理技巧》本文深入探讨了在Python环境下使用vLLM处理多模态数据的预处理技巧,我们将从基础概念出发,详细讲解文本、图像、音频等多模态数据的预处理方法,... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

MySQL 删除数据详解(最新整理)

《MySQL删除数据详解(最新整理)》:本文主要介绍MySQL删除数据的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、前言二、mysql 中的三种删除方式1.DELETE语句✅ 基本语法: 示例:2.TRUNCATE语句✅ 基本语

Python中win32包的安装及常见用途介绍

《Python中win32包的安装及常见用途介绍》在Windows环境下,PythonWin32模块通常随Python安装包一起安装,:本文主要介绍Python中win32包的安装及常见用途的相关... 目录前言主要组件安装方法常见用途1. 操作Windows注册表2. 操作Windows服务3. 窗口操作

Java easyExcel实现导入多sheet的Excel

《JavaeasyExcel实现导入多sheet的Excel》这篇文章主要为大家详细介绍了如何使用JavaeasyExcel实现导入多sheet的Excel,文中的示例代码讲解详细,感兴趣的小伙伴可... 目录1.官网2.Excel样式3.代码1.官网easyExcel官网2.Excel样式3.代码

MyBatisPlus如何优化千万级数据的CRUD

《MyBatisPlus如何优化千万级数据的CRUD》最近负责的一个项目,数据库表量级破千万,每次执行CRUD都像走钢丝,稍有不慎就引起数据库报警,本文就结合这个项目的实战经验,聊聊MyBatisPl... 目录背景一、MyBATis Plus 简介二、千万级数据的挑战三、优化 CRUD 的关键策略1. 查

python实现对数据公钥加密与私钥解密

《python实现对数据公钥加密与私钥解密》这篇文章主要为大家详细介绍了如何使用python实现对数据公钥加密与私钥解密,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录公钥私钥的生成使用公钥加密使用私钥解密公钥私钥的生成这一部分,使用python生成公钥与私钥,然后保存在两个文

mysql中的数据目录用法及说明

《mysql中的数据目录用法及说明》:本文主要介绍mysql中的数据目录用法及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、版本3、数据目录4、总结1、背景安装mysql之后,在安装目录下会有一个data目录,我们创建的数据库、创建的表、插入的