​李明轩:提升大数据素养,辅助电力系统实时决策研究 | 提升之路系列(八)...

本文主要是介绍​李明轩:提升大数据素养,辅助电力系统实时决策研究 | 提升之路系列(八)...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

16f37f6b4e844795f9068042996ed082.png

导读

 

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

至今,已有来自全校45个院系的3055名同学参加大数据能力提升项目,其中556位同学通过课程学习和实践获得由清华大学研究生院颁发的“清华大学大数据能力提升项目证书”。

谈起最大的收获,同学们表示无论是自身的数据思维还是本专业与大数据技术相结合的科研能力以及实践经验等方面均得到了很大的提升。清华的数据科学人才培养究竟有什么特别之处?让我们一起通过他们的故事,揭秘各院系清华学子的大数据提升之路吧!

618c24b7b70c266571451a735035e038.png

李明轩 电机系

我是电机系二年级博士生李明轩,从本科期间便对人工智能技术感兴趣,自学了很多人工智能相关知识,而研究生阶段的大数据项目对我的知识储备、编程技能、行业认知等方面都带来了极为显著的提升,也为了今后的科研及人生选择打开了一扇新的大门。

课程知识方面,除去实践课以外,我选修了大数据分析(B)、数据可视化、深度学习等三门课程,这几门课程相辅相成,为我的人工智能知识和编程技能带来了质的飞越。大数据分析(B)是我上的第一门项目课,该课程内容广泛,涵盖了统计学知识、机器学习及深度学习算法、人工智能技术的前沿进展和落地等多方面内容。其中崔鹏老师讲述的推荐系统、图与网络等知识更是引人入胜,让我了解到深度学习算法在如今的社会中具有着巨大的价值,包括但不限于电商、搜索引擎、智慧城市、智慧医疗等领域,使我了解了许多大数据技术的前沿内容。此外,该课程的大作业是参与一次具有一定含金量的竞赛,这次竞赛显著地提高了我的 debug 能力和对人工智能算法的实际认知。我有幸与软院的同学组队,并从他们的讨论中收获良多,这使得我不再仅仅是一名调包侠。在与他们的探讨中,我意识到要仔细探索数据的分布,构造合适的数据集以保证模型的性能。最终,我所使用的采样方法也显著提高了预测效果,使得我们的排名成功杀入前 20,可以说是一次颇有价值的经历。

2502b05c3bdbeacbb34091dd13be2fe5.png

大数据竞赛成果

我选修的第二门课是数据可视化,该课程直接让我从 0 到 1 了解了前端的内容。该课程手把手地交我们使用 D3.js 可视化库,并且在实践的过程中令我充分学习了javascript,css,html 的知识,并在大作业中掌握了 bootstrap,jquery 等库,为我后面实践课的前端开发打下了基础。

08986cd642a0c1f48019a40f09426840.png

数据可视化课程展示

我选修的第三门课是龙明盛老师的深度学习。难能可贵的是,龙老师用许多生动形象的方法详细讲解了各个深度学习方法的基本原理,这个方法为什么要设计成这个样子,其背后蕴含着怎样的数学原理,这些对我的深度学习的认知以及今后的科研都带来了显著的收获。

而大数据项目中最为我带来收获的是大数据实践课。得益于项目导师的悉心指导,我们从零开始有效地掌握了以下内容:Hadoop、Spark 等大数据平台的基本原理及使用,网络异常行为分析方法,基于 Javascript 的前端开发及基于 Flask 的后端开发,系统架构设计及产品研发、优化思路等,让我们学到了如何从 0 到 1 打磨出一款产品。令我印象深刻的就是其中的系统架构设计与产品优化部分,这些对我以后的思维和工作必然会产生重要影响。此外,我也有幸结识了许多优秀的同伴,他们从产品界面的设计、机器学习算法的思考、项目分工与合作等多方面给我带来了巨大的启发。而经由大家的共同努力,我们小组最终当选了优秀小组。

eac031098dc3084760282906192f46d2.png

大数据实践课成果展示

b37e5912f631d3b7605afa6a10433f65.png

实践课优秀团队奖

此外,在与项目导师的交流中也产生了一些对择业的思考。本次项目我们是在赋乐科技完成的,这是一家初创企业。我们曾好奇为何项目导师选择了这样一家尚未上市的企业,他说在创业公司能够更好地把握行业前沿, 承担更重要的工作,产生更开阔的视野。这些话都给我们带来了一定的启发。

除去课内学习和实践以外,大数据项目也给我的科研带来了一定的帮助。我的本科毕业设计即为深度学习算法在电力系统中的应用。而在博士一年级期间,借由导师的耐心指导和大数据课程知识的帮助,我成功地完成了第一篇学术论文。该论文将深度学习方法与混合整数规划相结合,有效地提高了电力系统中机组组合问题的在线决策效率。该文目前已发表于 IEEE Transactions on Sustainable Energy 期刊。此外,我目前也基于深度学习方法完成了一些负荷缺失值填充、负荷预测等工作。我的博士课题也考虑围绕人工智能方法在电力系统优化决策问题中的应用而展开。而在今后的科研工作中,我也会经常翻出来大数据项目的课程资料, 巩固自己的相关知识。

整体而言,大数据项目对我的知识储备、编程技能、学术研究、行业认知、就业方向等各方面都带来了显著的帮助。非常感谢大数据项目能为我带来如此显著的收获,也希望大数据项目能够越办越好。

编辑:于腾凯

校对:林亦霖

7a0900998dbec32ad1ae086f01734075.png

这篇关于​李明轩:提升大数据素养,辅助电力系统实时决策研究 | 提升之路系列(八)...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/900986

相关文章

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

MyBatis-plus处理存储json数据过程

《MyBatis-plus处理存储json数据过程》文章介绍MyBatis-Plus3.4.21处理对象与集合的差异:对象可用内置Handler配合autoResultMap,集合需自定义处理器继承F... 目录1、如果是对象2、如果需要转换的是List集合总结对象和集合分两种情况处理,目前我用的MP的版本