张书源:大数据能力助力我实现化工智能制造 | 提升之路系列(十)

本文主要是介绍张书源:大数据能力助力我实现化工智能制造 | 提升之路系列(十),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

27a2befcbd00e48be7cec6cd356c5469.png

导读

 

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

至今,已有来自全校45个院系的3055名同学参加大数据能力提升项目,其中556位同学通过课程学习和实践获得由清华大学研究生院颁发的“清华大学大数据能力提升项目证书”。

谈起最大的收获,同学们表示无论是自身的数据思维还是本专业与大数据技术相结合的科研能力以及实践经验等方面均得到了很大的提升。清华的数据科学人才培养究竟有什么特别之处?让我们一起通过他们的故事,揭秘各院系清华学子的大数据提升之路吧!

85bd64cb4d30fc7d085d8bfc3a836a26.png

张书源 化工系

2018 年,我进入了清华大学化学工程系系统工程课题组攻读博士学位。进入研究生阶段,我努力学习专业课程,了解研究领域的相关知识。我的研究方向是系统工程,具体主要包括对过程工程的建模、分析、优化、监控和控制等。在工业 4.0 和中国制造 2025 的背景下,制造业处在向数字化智能化转型升级的过程当中。在入学阶段,得知清华大数据研究中心设立了大数据能力提升项目之后,我便报了名,希望通过这一项目提升我的数据应用能力,并找到自己的研究方向。

在选择大数据能力提升项目课程时,我和自己的导师进行了交流。我的导师非常支持我的想法,并选择了大数据分析、算法、系统和实践作为我的课程。这些课程让我了解了大数据的特点、大数据的应用价值和算法。在课程实践项目中,我和小组的同学一起参与了北京艾漫数据科技股份有限公司的娱乐知识图谱构建的项目。我们爬取了部分网站上关于电影方面的语料并进行了清洗、标注,然后搭建并训练了基于 BiLSTM-CRF 的实体识别和关系抽取模型,最后用得到的实体和实体间的关系建立了知识图谱并进行可视化展示,取得了不错的效果。虽然这只是一个相对简单的样例,远没到工业应用的程度,但让我从爬取数据、数据清洗、模型训练和模型应用等方面,了解到了大数据从获取到产生价值的整个过程。

 21b7cbc9f71533e1c3abd41b9bf82d0d.png

在完成了项目的课程学习后,我开始思考将学到的方法应用在自己的研究领域上。过程监控是维持过程稳定运行、实现安全生产、提高产品合格率、提升工厂效益的重要一环。在分布式控制系统应用逐渐变广、工业数据获取越来越容易的现在,我开始思考怎样通过数据驱动的过程监控算法来代替传统的多元统计的方法和基于过程模型的方法。受到实践中学习到的循环神经网络启发,我尝试使用基于神经网络的过程故障诊断模型,这一模型利用滑动窗口处理数据,提升了故障诊断的正确率并提前了故障诊断的时间,有助于利用过程数据提升过程的平稳度。利用这一成果,我参加了 2019 年的全国过程工程年会并做了报告,取得了良好的反响。

23a62669c96419e135c532f3173452f4.png

除了对过程平稳运行的监控,我也尝试了神经网络算法构建产品质量预测的模型并利用这一模型寻找最佳的过程运行操作,实现制造过程的最大效益。乙烯裂解过程是石油化工的龙头,其产量标志着一个国家的石油化工水平。乙烯裂解的各种烯烃产品也是很多国民生活日用品的原料。乙烯裂解过程收到很多操作条件和原料组成的影响,常用的机理模型基于微分方程的求解,耗时较长,故过程操作优化难以实现。利用图神经网络模型和乙烯的裂解反应网络,我建立了数据驱动的乙烯裂解产品预测模型。这一模型能在很短时间内完成产品组成的预测,提高操作条件的优化速度,该成果已发表到 SCI 期刊上。

除了与工业结合,我探究了一些计算机视觉方法在先进制造中的应用。我与化工系微化工课题组合作,利用 MaskRCNN 和 ResNet 等计算机视觉方法实现了微流体中关键参数的自动推理,为微化工领域研究提供了一个省时省力的分析工具,加速微化工制造技术的开发和优化,提升了大约 1000 倍的分析效率。除了图片的自动分析,我也尝试了神经网络视频分析的技术,实现了微流体过程的动态特征分析,这在该领域以往的研究看来,是非常困难的。这一视频分析方法还有在线应用的可能。我的这些成果不仅发表了论文,还申请了专利并编写成了软件供相关研究人员使用。

e20da38ad91048fdf00151e8e4b478e5.png

很庆幸在我入学阶段就参与了项目的学习,这对于像我一样处在交叉学科领域的学生有很好的能力提升作用,不仅打下了良好的计算机技能基础,还可以通过实践了解到当前这些数据分析算法的最新进展。学习到的知识还可以启发自己的研究方向,在一些交叉学科的研究领域取得突破。这样的学科交叉、工业结合我认为是未来一段时间内很好的科学研究方向,也希望继续在此方向上继续努力,进行更加深入的研究。

编辑:文婧

校对:林亦霖

87034e5d1cb8e065067611fb78d7c5d8.png

这篇关于张书源:大数据能力助力我实现化工智能制造 | 提升之路系列(十)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/900988

相关文章

HTML5 getUserMedia API网页录音实现指南示例小结

《HTML5getUserMediaAPI网页录音实现指南示例小结》本教程将指导你如何利用这一API,结合WebAudioAPI,实现网页录音功能,从获取音频流到处理和保存录音,整个过程将逐步... 目录1. html5 getUserMedia API简介1.1 API概念与历史1.2 功能与优势1.3

Java实现删除文件中的指定内容

《Java实现删除文件中的指定内容》在日常开发中,经常需要对文本文件进行批量处理,其中,删除文件中指定内容是最常见的需求之一,下面我们就来看看如何使用java实现删除文件中的指定内容吧... 目录1. 项目背景详细介绍2. 项目需求详细介绍2.1 功能需求2.2 非功能需求3. 相关技术详细介绍3.1 Ja

使用Python和OpenCV库实现实时颜色识别系统

《使用Python和OpenCV库实现实时颜色识别系统》:本文主要介绍使用Python和OpenCV库实现的实时颜色识别系统,这个系统能够通过摄像头捕捉视频流,并在视频中指定区域内识别主要颜色(红... 目录一、引言二、系统概述三、代码解析1. 导入库2. 颜色识别函数3. 主程序循环四、HSV色彩空间详解

PostgreSQL中MVCC 机制的实现

《PostgreSQL中MVCC机制的实现》本文主要介绍了PostgreSQL中MVCC机制的实现,通过多版本数据存储、快照隔离和事务ID管理实现高并发读写,具有一定的参考价值,感兴趣的可以了解一下... 目录一 MVCC 基本原理python1.1 MVCC 核心概念1.2 与传统锁机制对比二 Postg

SpringBoot整合Flowable实现工作流的详细流程

《SpringBoot整合Flowable实现工作流的详细流程》Flowable是一个使用Java编写的轻量级业务流程引擎,Flowable流程引擎可用于部署BPMN2.0流程定义,创建这些流程定义的... 目录1、流程引擎介绍2、创建项目3、画流程图4、开发接口4.1 Java 类梳理4.2 查看流程图4

SQL Server修改数据库名及物理数据文件名操作步骤

《SQLServer修改数据库名及物理数据文件名操作步骤》在SQLServer中重命名数据库是一个常见的操作,但需要确保用户具有足够的权限来执行此操作,:本文主要介绍SQLServer修改数据... 目录一、背景介绍二、操作步骤2.1 设置为单用户模式(断开连接)2.2 修改数据库名称2.3 查找逻辑文件名

C++中零拷贝的多种实现方式

《C++中零拷贝的多种实现方式》本文主要介绍了C++中零拷贝的实现示例,旨在在减少数据在内存中的不必要复制,从而提高程序性能、降低内存使用并减少CPU消耗,零拷贝技术通过多种方式实现,下面就来了解一下... 目录一、C++中零拷贝技术的核心概念二、std::string_view 简介三、std::stri

C++高效内存池实现减少动态分配开销的解决方案

《C++高效内存池实现减少动态分配开销的解决方案》C++动态内存分配存在系统调用开销、碎片化和锁竞争等性能问题,内存池通过预分配、分块管理和缓存复用解决这些问题,下面就来了解一下... 目录一、C++内存分配的性能挑战二、内存池技术的核心原理三、主流内存池实现:TCMalloc与Jemalloc1. TCM

OpenCV实现实时颜色检测的示例

《OpenCV实现实时颜色检测的示例》本文主要介绍了OpenCV实现实时颜色检测的示例,通过HSV色彩空间转换和色调范围判断实现红黄绿蓝颜色检测,包含视频捕捉、区域标记、颜色分析等功能,具有一定的参考... 目录一、引言二、系统概述三、代码解析1. 导入库2. 颜色识别函数3. 主程序循环四、HSV色彩空间

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取