TDengine 在水电厂畸变波形分析及故障预判系统中的应用

2024-03-17 22:58

本文主要是介绍TDengine 在水电厂畸变波形分析及故障预判系统中的应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

作者:深圳双合电机监测和故障预测产品研发团队

小 T 导读:深圳双合电气股份有限公司成立于 1993 年,是国家级高新技术企业和广东省专精特新企业。公司致力于电力及工企业系统应用解决方案及相关智能监测设备的研究、开发、生产与实施,拥有面向电力系统、发电、石化、冶金、钢铁等行业的故障诊断及预警系统系列解决方案。

https://github.com/taosdata/TDengine

 

一、项目背景

水电厂对重要主机设备已配备基于生产运行控制的计算机监控系统和机组稳定性监测分析系统,主要从振动、气隙等状态量对主机设备的运行状态进行监测和评估;同时水电厂对水轮发电机组装设了故障录波器,用于记录机组异常和故障时的波形及动作情况,但这些监测手段仅从部分角度对机组状态进行评估,未能从多维综合的角度评估机组的安全运行情况。此外,对故障录波器记录的大量机组的电气及保护开关动作信息,未能挖掘数据的深入价值。

基于现有系统的不足,用户提出了本项目建设需求,并基于深圳双合丰富的系统方案解决能力,将本项目交给我司建设。

二、主要挑战

本项目中,用户提出的最基本,也最核心的需求是将全厂的电力系统各元件纳入系统的监测,并存储高采样率的原始信号数据。有了原始数据,就可以进行各种高级应用分析。

在这个需求中,信号采样率是 10K,即每秒钟产生 1 万个浮点数据。全厂电力系统元件,初步估算有 500 个信号通道。这样 1 天即可产生 1.7T 字节数据量(10000 * 4 byte * 500 * 24 * 60 * 60)。

巨量的数据,给我们造成两个难题:一是从监测装置到系统服务器的数据传输问题;另一个就是数据存储问题。

第一个难题,基于深圳双合丰富的设备研发能力,直接通过硬件发送链路数据很快就解决了。

第二个难题,解决方案就两个:选择数据库存储或文件存储。对于数据库存储方案,如此巨量的数据,根据经验可以知道,常见的主流数据库很难支撑。而文件存储是电力系统这种类型数据通常的存储方案,于是我们将此方案报给了用户,不过他们并没有选择。一方面是连续、巨量的原始采样数据存储成文件,确实会对后续的数据应用产生诸多不便;一方面是希望系统有一定的创新性。

三、数据库选型和验证

用户反对文件存储方案,逼我们又回到数据库存储方案上。我们就把目光转向了新兴的数据库。

经过反复对比,涛思数据开发的 TDengine 时序数据库优异的性能指标吸引了我们。我们对数据库有三个最关心的核心性能指标(写入能力、查询效率、存储能力)。在正式引入 TDengine 之前,我们对这三个指标进行了测试验证。

我们建了 10 个数据表,每个表 50 个数据列,数据库采用单机模式。然后编写模拟程序每张表每秒产生 1 万行记录插入到这 10 张表中,并通过 SQL 语句

select count(*) from tablename where ts>now -1s

来验证当前(1 秒以内)产生的数据是否及时被写入了数据库。

如果数据来不及写入数据库,数据就会慢慢堆积起来。这样最新的数据也就无法在数据库中查到。为了检查是否存在堆积现象,我们也测试了程序运行多天之后执行该 SQL,结果是当前最新 1 秒内的数据也能在数据库里查到,这说明堆积的数据不超过 1 秒。也就表明,数据库及时写入了数据,没有任何延迟。

后来我们又将产生的数据量翻倍,测试结果一样,说明 TDengine 数据库的写入能力非常强悍。

而查询效率的验证则相对简单。我们在已经有了几十亿条记录的表中随意查询几十万条记录,查询时间均没超过 1 秒,说明 TDengine 数据库查询效率也极其强悍。

再就是对数据库存储能力的验证。根据推算,我们 1 天产生 1.7T 的数据。而我们用 du –sh * 命令去查看 TDengine 数据库的数据目录,24 小时之后再去查看,发现数据增量约是 1.7T 的 30%左右。这说明 TDengine 的压缩能力也是比较优异的。

基于上述三个性能指标的优异表现,我们很快决定将 TDengine 数据库正式引入项目。

四、TDengine 使用体验

正式使用 TDengine 数据库后,我们发现 TDengine 的 C++和 Java 接口都简单清晰,SQL 语法与标准 SQL 基本一样,学习成本几乎为 0,使用 TDengine 数据库没有给项目带来额外的工作量和难度。

最终,TDengine 数据库在该项目中顺利投入使用,在现场运行环境的表现,如同我们的验证测试一样,拥有优异的写入能力和快速的查询能力,可以有力地支撑系统对原始信号数据进行进一步的分析与应用。

在该项目中,我们只把高采样的连续采样数据存入 TDengine 数据库中,其它离散型时序数据没有存到 TDengine 数据库,还是放在 MySQL 这样的传统数据库中。这种离散型的时序数据,虽然它的时间间隔很大(比如 3 分钟才产生一个数据),但是由于工业领域数据的特殊性,使得传统的行式数据库特别不适应工业数据,数据库模型特别难设计。

比如工业生产系统中,有的设备产生电压、频率数据;有的产生电流、功率数据;有的产生压力、温度数据。这些数据类型各占一列放在同一张表中,必定造成每一行都有大量的空列,对数据库的性能影响很大。

另一个方案就是各个数据独立占一行,我们实际系统中就是这么设计的,每一行只有两个有效核心列:时间、值。这种设计会造成大量重复的时间数据,数据行数成百、成千倍的增加,同样对数据库的性能影响也很大,它唯一给系统带来的好处是扩展灵活。

因此,传统行式数据库在工业领域是很难设计出完美方案的。

而像 TDengine 数据库这样的列式数据库则可以完美解决工业领域里面的这些问题。我们可以使用宽表把所有的数据放入同一个表中,由于是列式数据库,行中的空列对数据库性能没有丝毫影响。也可以把不同的分类数据放在同一个模型中(但实际表可能有多个),然后用 BigTable 技术将多个表的数据汇聚到一个大表中,提升查询效率。

五、未来规划

TDengine 数据库是为时序数据而生的,因此,未来我们的系统,离散的时序数据也将逐步放入 TDengine 数据库。我们准备利用 TDengine 的技术特性,重新设计数据库模型,使这部分数据的写入和查询效率产生翻天覆地的变化。


点击查看活动详情,iPhone 13 Pro 等你带回家!

 

这篇关于TDengine 在水电厂畸变波形分析及故障预判系统中的应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/820448

相关文章

Nginx分布式部署流程分析

《Nginx分布式部署流程分析》文章介绍Nginx在分布式部署中的反向代理和负载均衡作用,用于分发请求、减轻服务器压力及解决session共享问题,涵盖配置方法、策略及Java项目应用,并提及分布式事... 目录分布式部署NginxJava中的代理代理分为正向代理和反向代理正向代理反向代理Nginx应用场景

Redis中的有序集合zset从使用到原理分析

《Redis中的有序集合zset从使用到原理分析》Redis有序集合(zset)是字符串与分值的有序映射,通过跳跃表和哈希表结合实现高效有序性管理,适用于排行榜、延迟队列等场景,其时间复杂度低,内存占... 目录开篇:排行榜背后的秘密一、zset的基本使用1.1 常用命令1.2 Java客户端示例二、zse

Redis中的AOF原理及分析

《Redis中的AOF原理及分析》Redis的AOF通过记录所有写操作命令实现持久化,支持always/everysec/no三种同步策略,重写机制优化文件体积,与RDB结合可平衡数据安全与恢复效率... 目录开篇:从日记本到AOF一、AOF的基本执行流程1. 命令执行与记录2. AOF重写机制二、AOF的

linux系统中java的cacerts的优先级详解

《linux系统中java的cacerts的优先级详解》文章讲解了Java信任库(cacerts)的优先级与管理方式,指出JDK自带的cacerts默认优先级更高,系统级cacerts需手动同步或显式... 目录Java 默认使用哪个?如何检查当前使用的信任库?简要了解Java的信任库总结了解 Java 信

利用Python操作Word文档页码的实际应用

《利用Python操作Word文档页码的实际应用》在撰写长篇文档时,经常需要将文档分成多个节,每个节都需要单独的页码,下面:本文主要介绍利用Python操作Word文档页码的相关资料,文中通过代码... 目录需求:文档详情:要求:该程序的功能是:总结需求:一次性处理24个文档的页码。文档详情:1、每个

MyBatis Plus大数据量查询慢原因分析及解决

《MyBatisPlus大数据量查询慢原因分析及解决》大数据量查询慢常因全表扫描、分页不当、索引缺失、内存占用高及ORM开销,优化措施包括分页查询、流式读取、SQL优化、批处理、多数据源、结果集二次... 目录大数据量查询慢的常见原因优化方案高级方案配置调优监控与诊断总结大数据量查询慢的常见原因MyBAT

分析 Java Stream 的 peek使用实践与副作用处理方案

《分析JavaStream的peek使用实践与副作用处理方案》StreamAPI的peek操作是中间操作,用于观察元素但不终止流,其副作用风险包括线程安全、顺序混乱及性能问题,合理使用场景有限... 目录一、peek 操作的本质:有状态的中间操作二、副作用的定义与风险场景1. 并行流下的线程安全问题2. 顺

MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决

《MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决》MyBatis默认开启一级缓存,同一事务中循环调用查询方法时会重复使用缓存数据,导致获取的序列主键值均为1,... 目录问题原因解决办法如果是存储过程总结问题myBATis有如下代码获取序列作为主键IdMappe

Java中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例解析

《Java中的分布式系统开发基于Zookeeper与Dubbo的应用案例解析》本文将通过实际案例,带你走进基于Zookeeper与Dubbo的分布式系统开发,本文通过实例代码给大家介绍的非常详... 目录Java 中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例一、分布式系统中的挑战二

Java 缓存框架 Caffeine 应用场景解析

《Java缓存框架Caffeine应用场景解析》文章介绍Caffeine作为高性能Java本地缓存框架,基于W-TinyLFU算法,支持异步加载、灵活过期策略、内存安全机制及统计监控,重点解析其... 目录一、Caffeine 简介1. 框架概述1.1 Caffeine的核心优势二、Caffeine 基础2