【数据应用案例】知识图谱技术与应用指南

2024-09-06 04:18

本文主要是介绍【数据应用案例】知识图谱技术与应用指南,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

案例来源:@机器之心
案例地址: https://mp.weixin.qq.com/s/fuI9U7aZpuk-WX6GQNtOuA

1. 知识图谱
1)包含实体与实体间关系
2)实体与关系可以有属性
3)学界常采用RDF三元组存储(如Jena),缺点是难以表达实体的属性;业界常用图存储数据库(如Neo4j、OrientDB、JanusGraph),可以表达实体和关系的属性,同时利于检索
4)知识抽取过程
a. 命名实体识别
b. 实体间关系识别
c. 实体统一
d. 指代消解(如他她它)

2. 金融知识图谱搭建:业务理解与知识图谱的设计非常重要
1)定义具体业务问题:如金融领域的欺诈。注意如果要使用知识图谱而不是传统数据库,要考虑几个问题:
a. 有强烈的可视化需求
b. 经常涉及深度的关系搜索
c. 对关系查询有实时性要求
2)数据收集与预处理:内部信息源与外部数据,外部一般需要做实体识别和关系识别等处理
3)知识图谱设计
a. 业务原则:图谱能反映业务逻辑
b. 分析原则:
c. 效率原则:知识图谱尽量轻化,一些关系不大、分析时使用较少的属性可以放在传统数据库中。可以把知识图谱和传统数据库的关系看成内存与硬盘的关系
d. 冗余原则
4)上层应用开发:主要有两类,一类是基于规则的,一类是基于概率的
a. 基于规则的方法论
i1. 不一致性检查:找出潜在矛盾点,如两个人的公司电话是相同的,但是公司却不同
i2. 基于规则的特征提取:如“申请人的二度实体里有多少进了黑名单”
i3. 基于模式的判断:通过一些模式找出可能存在风险的子图(如团伙欺诈)。可以根据共享的实体数量定义团伙,也可以定义强连通子图为团伙
b. 基于概率的方法论:如社区挖掘、标签传播、聚类
c. 基于动态网络的分析:知识图谱网络在T到T+1时刻发生了显著变化,可能蕴含着风险信息

3. 知识图谱在其它领域的应用
1)教育领域:根据学习路径构建知识网络,帮助学生制定个性化培养方案
2)证券领域:我们经常关心“A事件发生会影响哪些公司的股价”,可以用知识图谱回答哪些公司会受到影响

这篇关于【数据应用案例】知识图谱技术与应用指南的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1140978

相关文章

JDK21对虚拟线程的几种用法实践指南

《JDK21对虚拟线程的几种用法实践指南》虚拟线程是Java中的一种轻量级线程,由JVM管理,特别适合于I/O密集型任务,:本文主要介绍JDK21对虚拟线程的几种用法,文中通过代码介绍的非常详细,... 目录一、参考官方文档二、什么是虚拟线程三、几种用法1、Thread.ofVirtual().start(

从基础到高级详解Go语言中错误处理的实践指南

《从基础到高级详解Go语言中错误处理的实践指南》Go语言采用了一种独特而明确的错误处理哲学,与其他主流编程语言形成鲜明对比,本文将为大家详细介绍Go语言中错误处理详细方法,希望对大家有所帮助... 目录1 Go 错误处理哲学与核心机制1.1 错误接口设计1.2 错误与异常的区别2 错误创建与检查2.1 基础

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

使用Java填充Word模板的操作指南

《使用Java填充Word模板的操作指南》本文介绍了Java填充Word模板的实现方法,包括文本、列表和复选框的填充,首先通过Word域功能设置模板变量,然后使用poi-tl、aspose-words... 目录前言一、设置word模板普通字段列表字段复选框二、代码1. 引入POM2. 模板放入项目3.代码

利用Python操作Word文档页码的实际应用

《利用Python操作Word文档页码的实际应用》在撰写长篇文档时,经常需要将文档分成多个节,每个节都需要单独的页码,下面:本文主要介绍利用Python操作Word文档页码的相关资料,文中通过代码... 目录需求:文档详情:要求:该程序的功能是:总结需求:一次性处理24个文档的页码。文档详情:1、每个

Java中的Schema校验技术与实践示例详解

《Java中的Schema校验技术与实践示例详解》本主题详细介绍了在Java环境下进行XMLSchema和JSONSchema校验的方法,包括使用JAXP、JAXB以及专门的JSON校验库等技术,本文... 目录1. XML和jsON的Schema校验概念1.1 XML和JSON校验的必要性1.2 Sche

macOS彻底卸载Python的超完整指南(推荐!)

《macOS彻底卸载Python的超完整指南(推荐!)》随着python解释器的不断更新升级和项目开发需要,有时候会需要升级或者降级系统中的python的版本,系统中留存的Pytho版本如果没有卸载干... 目录MACOS 彻底卸载 python 的完整指南重要警告卸载前检查卸载方法(按安装方式)1. 卸载

Java中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例解析

《Java中的分布式系统开发基于Zookeeper与Dubbo的应用案例解析》本文将通过实际案例,带你走进基于Zookeeper与Dubbo的分布式系统开发,本文通过实例代码给大家介绍的非常详... 目录Java 中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例一、分布式系统中的挑战二

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda