电力知识图谱:电力行业知识资源建设及场景化应用

2023-11-06 08:50

本文主要是介绍电力知识图谱:电力行业知识资源建设及场景化应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

导读 电力大数据时代的来临,使得基于人工智能、云计算、物联网的技术在电力行业之中得到了广泛的应用。而对于各个行业的创新与发展而言,知识图谱技术成为全新动力,针对电力领域知识图谱方面的研究却很少。本文聚焦在电力行业,以整合行业内知识资源为目标构建知识图谱,提供了场景化专业知识搜索、精准知识推送、决策支持等形态的知识应用,服务于该行业内的从业人员、企业机构及行业决策者。本文将分享知识图谱在电力行业应用上的一些探索和实践。

今天的分享围绕下面四部分展开:

1. 电力知识体系构建

2. 电力知识图谱构建

3. 应用场景

4. 落地应用及感受


分享嘉宾|张涛 英大传媒投资集团有限公司编审

编辑整理|侯红梅

出品社区|DataFun


01/电力知识体系构建

在做知识图谱的构建过程中,我们首先要做的就是知识建模。

1. 电力知识数据

电力行业数据与电力知识数据不同。电力行业数据包括电力运行数据、营销数据和管理数据,是由电力生产产生的数据;电力知识数据以服务电力行业生产为目标,在电力生产中形成的科学、系统、公开、可确权的数据。为什么要说可确权呢?因为从出版的角度,我们做的是知识的生产和传播,因此我们要将所传播的知识进行分享,就必须要确定知识的版权归属,后期才能更好地进行知识运营

2.多维知识体系构建

在知识图谱的构建过程中,我们首先要确定知识图谱的用途。因此,我们确定了三大目标:

  • 第一,利用不同的电力行业的知识资源。把人物与机构相关联,实现对机构和人物的成果画像和评价。
  • 第二,结合业务场景来推送专业的知识内容。我们采用的是直接推送内容的方式,这样可以提高知识的搜索效率。这里的直接推送指的是一个片段的知识内容,即碎片化了的知识,这样就避免了知识的二次搜索。
  • 第三,充分利用我们在电力行业70年的深耕所形成的专业知识内容,建立基础的知识体系和知识库,之后可以形成知识服务的产品,实现知识共享和定制化服务。

在知识图谱构建过程中,主要涉及到三方面的人员:

  • 一线业务专家,前期确定场景和需求,后期对成果进行确认,当然,在中间过程中也需要提供咨询服务。
  • 专业人员,起到桥梁作用和整体把控,主要将需求转化为知识图谱构建人员能够理解的思路、方法,最终确定方案以实现我们的目标。
  • 计算机技术人员,负责知识的建模、融合和存储,使其最终使用电力行业的知识资源将人物与机构相关联,实现人物和机构的成果画像。

电力知识建模采用的是自顶向下的方法,首先为知识图谱定义数据模式,数据模式从最顶层概念构建,逐步向下细化。在构建过程中采用的是人工+计算机+专家审核的方式。

  • 人工建立基本的体系框架,同时结合各种场景化的应用,使该体系更加完善。
  • 专家审核并确认人工建立的体系框架。
  • 计算机自动提取,利用计算机进行自动提取使其对确定的体系框架进行深层次的挖掘。

没有完全用计算机的自动提取是因为计算机的自动提取受限于它所学的资源和内容,这样形成的体系有一定的局限性。

3. 多维电力知识体系构建:五个维度

在知识建模初期,采用人工结合场景化的应用和各个企业情况,最终基于两大原则构建了5大体系。

基于学科原则:

  • 电力专业:依托《中国电力百科全书》,形成了9卷、92个分支、6200个条目的完整电力学科类体系。

基于场景原则(4个体系,1100个知识模块):

  • 电力生产:电力生产发输变配用的维度,涉及到的各领域知识。
  • 岗位培训:结合岗位培训的维度,涉及各岗位应知应会的相关内容。
  • 基建:从电力建设的维度,从勘测、设计、施工到最后的验收。
  • 设备:交直流设备以及用电防侧的一些设备。

针对基于场景的知识体系,我们通过人工+计算机的方式最终形成了规模为20多万个实体,30万个相互间的关系的知识模块。

02/电力知识图谱构建

1.知识来源

在具体的知识图谱的构建过程中,我们首先确定了构建的原则——保证专业性、权威性以及可确权。

数据来源,我们使用的是公开的数据:

  • 文献、成果、专利、图书和标准,用来作为人物、机构画像。
  • 知识内容碎片化,从图书和标准中选取内容,主要做专业知识的精准推送。
  • 多源异构知识资源,包括音视频、图书中照片、新闻中的图片等,用来丰富专业知识库。

2. 知识结构化

  • 原则:基于电子化图书,即XML电子文件格式,大大提升了知识获取和知识融合的效率和准确率。

为了知识获取能够碎片化和保证知识的准确性,我们的质量保证措施如下:

  • 制定加工规范:依据新闻出版总署对于电子书基本的标准,制定了加工规范。对科技图书最多的图表公式、符号等,均细化要求,并且我们对表中的数据也进行了解析和拆解,进行不同深度的加工,保证获取最细碎片化的内容。
  • 质量检查:采用人工+计算机的方式进行质量检查,保证加工质量的规范性、完整性、准确性和有效性。

3. 电力知识数据解析和关联

在知识融合的过程中,我们要做数据的解析和关联。我们对内容进行了解析和拆解,同时,对于不同的图书,我们也确定了不同的加工深度,保证获取到合理的最细碎片化的内容。

数据解析:根据前面制定的加工规则,知识图谱技术人员对数据进行正确地解析。

关于知识层次的关联,我们做了两方面:

  • 体系间的关联,通过实体来进行关联。
  • 体系自身的知识关联,将上下级和同级的知识点提取出来,形成同级推荐和上下级推荐。

  • 知识属性关联:针对电力设备确定了11类属性,包括定义、组成、分类、特点等,这样在内容解析的时候,对不同的相关内容打上属性、标签,从而形成对某类设备的全方位的属性关联。

03/应用场景

1.个人成果汇总

第一个应用是个人成果汇总,应用场景如下:

  • 个人职称申报材料收集:个人职称申报过程中需汇总很多资料,通过我们这个系统,可以方便地将所涉及的成果进行一键导出。
  • 筛选推荐领域专家:可以筛选和推荐相关领域的专家。
  • 查找相近领域专家:输入两个专家的名字或通过进一步的探索,能够找到和这个专家相关联的其他专家。

2. 专业知识学习

第二个应用是可以进行专业知识学习,通过应用场景确定相应知识体系,从而定位最精准的知识内容、也通过知识推荐结果的返回提升了用户的交互体验。

  • 用户输入检索的关键词,通过确定具体应用场景,用户可以选择不同知识体系(如电力生产、岗位培训、基建等)的相关内容,可以快速地定位到最精准的知识内容。

  • 知识推荐:可获取与其关联的同级、上下级的知识内容,很方便地实现了知识相互、上下和溯源的探索。这样我们可以拓展知识的广度和深度。

在知识学习过程中,我们可以充分利用知识图谱的直观性、趣味性的特点,形成知识图谱和知识点之间的互动。

  • 在可视化知识图谱中,我们以树状层次结构及网状关联关系展示,因此你可以看到你搜索的某一点在整个知识体系中的位置和关系,帮助理清知识脉络,同时也可以进入到相应的内容页。
  • 在知识内容详情页中,我们也可以直接链接到知识图谱。

3. 岗位培训

第三个应用是岗位培训:

  • 在搜索框输入所在岗位和级别就可以快速地查阅你需要掌握的知识内容。该应用有两方面的助力:首先是为员工自学提供便利,助力员工技能等级提升;同时,有利于跨岗位、跨专业学习。

4. 通用专业知识服务

第四个应用是通用专业知识服务:

  • 作为基础知识图谱库,我们提供底层的知识体系和知识内容。
  • 在该服务的基础上,可以快速搭建并形成自己的知识库和知识体系,也可以以不同形式打印和下载关注的知识内容,也可作为知识传播的产品,来为各个企业提供服务。

5. 电力生产决策支持

第五个应用是做电力生产的辅助决策支持:

  • 在电力生产答疑或缺陷故障处理过程中,能快速地提供准确的电力知识数据。
  • 利用电力的标准,为他们的标准编写和宣贯提供支持。
  • 将年鉴、年报、内部已有文件等各类电力数据提取出来,快速形成数据知识产品,以提供更专业的知识服务,这样也可以挖掘内部自有数据,快速形成统计及情报分析文档,提升企业数据资产的价值。

04/落地应用及感受

1.落地应用-中国电力百科网

落地应用一是外网部署的中国电力百科网,主要有以下三个模块:

  • 知识图谱模块,实现了专家、机构的成果画像。
  • 知识地图模块,主要实现了专业知识学习、岗位培训和专业知识库输出等功能,该模块将于今年推出。
  • 电力标准术语查询。

2.落地应用-国网甘肃电力、国网山东电力

落地应用二是内网部署的国网甘肃电力和国网山东电力,主要服务于他们内部系统基础知识的查询和搜索工作。

3.感受

做某垂直领域的知识图谱的工作时,有三个关键点:

  • 高质量的专业数据资源,这样可以保证知识获取和搜索的准确性。
  • 结合实际应用场景来构建相关知识图谱,并持续优化和完善知识图谱,这样我们后期图谱技术才能不断进步,对行业生产有更好的助力作用。技术一定要和业务数据捆绑,这样才能产生更多的价值。
  • 专注的行业团队,对后期成果的运行和持续使用非常关注,这样才能使产品更符合实际需求。

这里有一点建议,在做某垂直领域的知识图谱或构建自己的信息库时,建议与专业的出版机构合作,因为他们有专业、权威、可靠的海量数据资源,同时他们了解相关领域,也更关注后期产品的运营。




电力行业知识资源建设及场景化应用 - 知乎

中国电力百科网

电力知识图谱

这篇关于电力知识图谱:电力行业知识资源建设及场景化应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/355639

相关文章

利用Python操作Word文档页码的实际应用

《利用Python操作Word文档页码的实际应用》在撰写长篇文档时,经常需要将文档分成多个节,每个节都需要单独的页码,下面:本文主要介绍利用Python操作Word文档页码的相关资料,文中通过代码... 目录需求:文档详情:要求:该程序的功能是:总结需求:一次性处理24个文档的页码。文档详情:1、每个

vue监听属性watch的用法及使用场景详解

《vue监听属性watch的用法及使用场景详解》watch是vue中常用的监听器,它主要用于侦听数据的变化,在数据发生变化的时候执行一些操作,:本文主要介绍vue监听属性watch的用法及使用场景... 目录1. 监听属性 watch2. 常规用法3. 监听对象和route变化4. 使用场景附Watch 的

Java中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例解析

《Java中的分布式系统开发基于Zookeeper与Dubbo的应用案例解析》本文将通过实际案例,带你走进基于Zookeeper与Dubbo的分布式系统开发,本文通过实例代码给大家介绍的非常详... 目录Java 中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例一、分布式系统中的挑战二

Java 缓存框架 Caffeine 应用场景解析

《Java缓存框架Caffeine应用场景解析》文章介绍Caffeine作为高性能Java本地缓存框架,基于W-TinyLFU算法,支持异步加载、灵活过期策略、内存安全机制及统计监控,重点解析其... 目录一、Caffeine 简介1. 框架概述1.1 Caffeine的核心优势二、Caffeine 基础2

使用Node.js和PostgreSQL构建数据库应用

《使用Node.js和PostgreSQL构建数据库应用》PostgreSQL是一个功能强大的开源关系型数据库,而Node.js是构建高效网络应用的理想平台,结合这两个技术,我们可以创建出色的数据驱动... 目录初始化项目与安装依赖建立数据库连接执行CRUD操作查询数据插入数据更新数据删除数据完整示例与最佳

防止Linux rm命令误操作的多场景防护方案与实践

《防止Linuxrm命令误操作的多场景防护方案与实践》在Linux系统中,rm命令是删除文件和目录的高效工具,但一旦误操作,如执行rm-rf/或rm-rf/*,极易导致系统数据灾难,本文针对不同场景... 目录引言理解 rm 命令及误操作风险rm 命令基础常见误操作案例防护方案使用 rm编程 别名及安全删除

PHP应用中处理限流和API节流的最佳实践

《PHP应用中处理限流和API节流的最佳实践》限流和API节流对于确保Web应用程序的可靠性、安全性和可扩展性至关重要,本文将详细介绍PHP应用中处理限流和API节流的最佳实践,下面就来和小编一起学习... 目录限流的重要性在 php 中实施限流的最佳实践使用集中式存储进行状态管理(如 Redis)采用滑动

深入浅出Spring中的@Autowired自动注入的工作原理及实践应用

《深入浅出Spring中的@Autowired自动注入的工作原理及实践应用》在Spring框架的学习旅程中,@Autowired无疑是一个高频出现却又让初学者头疼的注解,它看似简单,却蕴含着Sprin... 目录深入浅出Spring中的@Autowired:自动注入的奥秘什么是依赖注入?@Autowired

PostgreSQL简介及实战应用

《PostgreSQL简介及实战应用》PostgreSQL是一种功能强大的开源关系型数据库管理系统,以其稳定性、高性能、扩展性和复杂查询能力在众多项目中得到广泛应用,本文将从基础概念讲起,逐步深入到高... 目录前言1. PostgreSQL基础1.1 PostgreSQL简介1.2 基础语法1.3 数据库

Unity新手入门学习殿堂级知识详细讲解(图文)

《Unity新手入门学习殿堂级知识详细讲解(图文)》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程