在数睿数据nextionBI线上发布会上,传统企业展示了对数据分析的深度理解

本文主要是介绍在数睿数据nextionBI线上发布会上,传统企业展示了对数据分析的深度理解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2022年2月25日,数睿数据正式发布下一代专注知识的BI产品——nextionBI,启动了自己“无代码+BI”的双产品战略布局。数睿数据总裁刘超总结,当前的BI产品过于依赖专业人员,但从根本上看是由于对于机器、知识和环境的依赖。表面上是BI产品需要专业的人去治理机器产生的脏数据,去梳理专业领域的知识,去完成知识在系统间的迁移。但本质是BI产品要求机器需要产出标准统一、质量上乘的基础数据,要求有大量可以直接录系统的行业知识,要求有一个统一的外部环境供知识在系统间自由分享。过渡的依赖外部环境,反而限制的BI产品自身的发展。下一代BI应该专注于从内部出发,主动去解决这些依赖,发展知识积累能力,主动优化融合现有数据资产,发展知识发现能力,能够快速总结归纳行业知识,发展知识传播能力,能够便捷打包成果对外输出。

而早在之前,传统行业也发现了现有的BI产品只能帮助他们看清现在,但无法看到未来,没有办法对发现的异常,从根本上给出措施建议开始探索通过新的视角重新审视业务痼疾,寻求解决之道。

nextionBI也在发布会上分享了和一些传统企业共谋数字化解决方案的真实故事,这些企业试图解决所在行业的共性问题,基于传统手段已经很难取得显著的突破。而通过与数睿数据这样的数字科技企业的合作,探索问题的另一种解法,将逐渐成为所在行业技术创新的主流。

发布会上首先分享的是一家纸材料生产制造企业,主要生产白卡纸。白卡纸属于工业用纸,采用100%漂白化学制浆抄制,具有坚挺厚实、平滑度高的特点,一般定量在210g-400g/㎡。白卡纸的产品类型主要分为纸盒、卡纸、纸袋,分别占比60%、20%、10%;下游主要应用于各类精细产品包装,如烟酒、化妆品、日用品、药品、食品、3C等日常消费产品包装。白卡纸的下游应用以必需消费品包装为主,终端需求持续稳定增长。

从中国造纸协会发布的《中国造纸工业2020年度报告》中数据来看,2020 年包装用纸生产量 705 万吨,较上年增长 1.44%;消费量 718 万吨,较上年增长 2.72%,是2020年纸产品中少数消费增长高于产量增长的品类。

白卡纸当前已呈现寡头垄断格局,以金光纸业、博汇纸业、晨鸣纸业、万国太阳为代表的寡头合计产能占比高达79%。金光、博汇和晨鸣的白卡纸年产能均达到200万吨以上,其中,金光纸业旗下的白卡纸生产企业包括亚洲浆纸业(150万吨/年)、广西金桂(100万吨/年)、宁波中华(62万吨/年),分布在浙江、广西等地;博汇纸业的白卡纸生产规模仅次于金光,产能主要分布在山东和江苏,合计年产能215万吨/年;晨鸣的产能主要分布在广东、山东、江西等地,合计年产能200万吨/年。

会上分享的企业作为现有的寡头之一,希望在良好的市场环境下,保持现有的竞争优势,除了营销工作之外,产品质量的稳定性是一个重要的基础。对于白卡纸来说,纸张的克重是衡量产品质量的重要指标。每个批次的纸张克重偏差越小,产品的质量稳定度也就越高。

但该企业的研发部门统计数据之后发现,目前白卡纸产品存在克重偏差较大的质量稳定性问题。由于克重不稳定,为了保证整体良品率,就不得不增加每个批次生产过程中的原料使用,从而保证即使偏差较大,但多数产品仍能够满足质量要求。但这样做显然会提高企业的生产成本,且整体的产品质量参差不齐,极大的损害了产品口碑,优化生产过程刻不容缓。

在接触nextionBI之前,该企业也早就开始针对这一问题探索解决方案,但是遇到几个现实的困难。首先,造纸过程相关的数据量极大,种类繁多。有的来自于自动化设备,有的来自于软件系统,有的靠人员手工记录,还有部分非结构化数据。这其中还包含大量的脏数据,存在诸如标准不统一、空值比例高、数据乱码等问题。在数据分析之前需要先完成复杂的数据清洗、数据标准化、数据关联等工作。企业研发部的人员虽然了解纸张生产数据的正确格式、知道不同字段的标准度量、能够将编码代号翻译成文本,但是他们大多不懂SQL语句,无法完成批量的数据加工处理工作。其次,经过材料研发人员对于大量历史数据的整理,生产制造过程中影响纸张克重的因素超过140种。但是具体是哪个因素对于克重有影响,是正相关还是负相关,这都需要一一测试。按照控制变量法的理论要求,至少要测试140次,每次都需要设计实验,调整参数,统计结果,这显然不具备可操作性。最后,难以定位影响因素对最终质量的影响值,不知道如何进行优化,针对某个因素具体优化值是多少?明确相关性只是第一步,下一步需要明确是线性相关还是指数相关,要有具体的相关函数才能形成量化可落地的操作建议。

对于数字化生产,企业认为不能简单的只是通过大屏展示生产结果数据现状,然后靠老师傅的经验决定优化方式,再通过一段时间的数据反馈判断优化效果,这种模式周期长,风险高。合理的方式应该是基于生产过程的数据分析,给出精准的操作建议,再通过生产测试进行验证,敲定生产优化措施。这就需要用到nextionBI的数据融合能力与增强分析中的主因子分析和根因定位能力。

针对第一个痛点,nextionBI对接生产数据,通过强大的数据交换机能力,完成复杂的数据处理流程,实现接入数据的清洗加工,排除异常数据对于分析结果的影响。这个过程不用写任何技术代码,一个纸材料的研发人员经过简单的培训,自己就可以通过拖拽数据加工算子的方式,配置加工流程,完成大量原始数据的加工处理。如上图所示是将三个来自不同系统的数据表经过加工处理,最终融合形成了一个数据资产。整个过程清晰可见,每个步骤对应的模块都可以动态调整,大大提升了数据处理过程的灵活度。这样就解决了数据分析基础素材的问题,为后续的分析打好了基础。

针对第二个痛点,利用nextionBI增强分析中的主因子分析能力,帮助客户从140多个影响因子中,快速定位影响纸张克重的主要影响因子,并提供主因子对结果的影响分析,并提供每个因子的影响值分析。如上图所示,影响因子的影响值排名从高到低分别显示的是2号浆液流量、车速、1号浆液流量、冲浆流量这四个因子,并且给出了具体的影响值,这就为下一步的分析工作提供了量化的参考依据。

 针对第三个痛点,采用根因分析,通过根因定位分析能力,对影响纸张克重的可能进行根因组合,列出组合排名。提取主因子,将每种组合的具体值列出,提供系数调整优化值建议,直接提供量化的指导。

 

如上图中所示,为不同因子分配不同的参数选择,形成多种组合。针对不同的组合分析其可能性的占比。比如图中的组合三就代表了2号纸浆流量小于等于14.25,1号纸浆流量小于等于32.05,车速小于 33.156这种参数组合形式,但是这种组合方式相较于组合一的可能性占比是偏低的,为了达到优化目标,最终应该选择组合一对应的参数设计。基于这些分析,进行了多次实验,研发部门给出了具体操作建议,帮助生产部门快速改善生产过程,稳定生产质量。

企业按照准备数据,确定方向,量化措施的过程,一步一步有条不紊的完成之前一直困扰他们的产品质量稳定性问题。nextionBI作为新发布的下一代BI的代表,其强大的数据融合处理能力、增强分析能力都很好地帮助企业完成了这次优化生产过程的目标。下一代BI的新能力,给企业提供了解决问题的新手段和方向。

这篇关于在数睿数据nextionBI线上发布会上,传统企业展示了对数据分析的深度理解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/657453

相关文章

详解如何使用Python构建从数据到文档的自动化工作流

《详解如何使用Python构建从数据到文档的自动化工作流》这篇文章将通过真实工作场景拆解,为大家展示如何用Python构建自动化工作流,让工具代替人力完成这些数字苦力活,感兴趣的小伙伴可以跟随小编一起... 目录一、Excel处理:从数据搬运工到智能分析师二、PDF处理:文档工厂的智能生产线三、邮件自动化:

Python中文件读取操作漏洞深度解析与防护指南

《Python中文件读取操作漏洞深度解析与防护指南》在Web应用开发中,文件操作是最基础也最危险的功能之一,这篇文章将全面剖析Python环境中常见的文件读取漏洞类型,成因及防护方案,感兴趣的小伙伴可... 目录引言一、静态资源处理中的路径穿越漏洞1.1 典型漏洞场景1.2 os.path.join()的陷

Python数据分析与可视化的全面指南(从数据清洗到图表呈现)

《Python数据分析与可视化的全面指南(从数据清洗到图表呈现)》Python是数据分析与可视化领域中最受欢迎的编程语言之一,凭借其丰富的库和工具,Python能够帮助我们快速处理、分析数据并生成高质... 目录一、数据采集与初步探索二、数据清洗的七种武器1. 缺失值处理策略2. 异常值检测与修正3. 数据

pandas实现数据concat拼接的示例代码

《pandas实现数据concat拼接的示例代码》pandas.concat用于合并DataFrame或Series,本文主要介绍了pandas实现数据concat拼接的示例代码,具有一定的参考价值,... 目录语法示例:使用pandas.concat合并数据默认的concat:参数axis=0,join=

C#代码实现解析WTGPS和BD数据

《C#代码实现解析WTGPS和BD数据》在现代的导航与定位应用中,准确解析GPS和北斗(BD)等卫星定位数据至关重要,本文将使用C#语言实现解析WTGPS和BD数据,需要的可以了解下... 目录一、代码结构概览1. 核心解析方法2. 位置信息解析3. 经纬度转换方法4. 日期和时间戳解析5. 辅助方法二、L

使用Python和Matplotlib实现可视化字体轮廓(从路径数据到矢量图形)

《使用Python和Matplotlib实现可视化字体轮廓(从路径数据到矢量图形)》字体设计和矢量图形处理是编程中一个有趣且实用的领域,通过Python的matplotlib库,我们可以轻松将字体轮廓... 目录背景知识字体轮廓的表示实现步骤1. 安装依赖库2. 准备数据3. 解析路径指令4. 绘制图形关键

解决mysql插入数据锁等待超时报错:Lock wait timeout exceeded;try restarting transaction

《解决mysql插入数据锁等待超时报错:Lockwaittimeoutexceeded;tryrestartingtransaction》:本文主要介绍解决mysql插入数据锁等待超时报... 目录报错信息解决办法1、数据库中执行如下sql2、再到 INNODB_TRX 事务表中查看总结报错信息Lock

使用C#删除Excel表格中的重复行数据的代码详解

《使用C#删除Excel表格中的重复行数据的代码详解》重复行是指在Excel表格中完全相同的多行数据,删除这些重复行至关重要,因为它们不仅会干扰数据分析,还可能导致错误的决策和结论,所以本文给大家介绍... 目录简介使用工具C# 删除Excel工作表中的重复行语法工作原理实现代码C# 删除指定Excel单元

Linux lvm实例之如何创建一个专用于MySQL数据存储的LVM卷组

《Linuxlvm实例之如何创建一个专用于MySQL数据存储的LVM卷组》:本文主要介绍使用Linux创建一个专用于MySQL数据存储的LVM卷组的实例,具有很好的参考价值,希望对大家有所帮助,... 目录在Centos 7上创建卷China编程组并配置mysql数据目录1. 检查现有磁盘2. 创建物理卷3. 创

Nacos日志与Raft的数据清理指南

《Nacos日志与Raft的数据清理指南》随着运行时间的增长,Nacos的日志文件(logs/)和Raft持久化数据(data/protocol/raft/)可能会占用大量磁盘空间,影响系统稳定性,本... 目录引言1. Nacos 日志文件(logs/ 目录)清理1.1 日志文件的作用1.2 是否可以删除