【数据应用案例】知识图谱技术与应用指南

2024-09-06 04:18

本文主要是介绍【数据应用案例】知识图谱技术与应用指南,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

案例来源:@机器之心
案例地址: https://mp.weixin.qq.com/s/fuI9U7aZpuk-WX6GQNtOuA

1. 知识图谱
1)包含实体与实体间关系
2)实体与关系可以有属性
3)学界常采用RDF三元组存储(如Jena),缺点是难以表达实体的属性;业界常用图存储数据库(如Neo4j、OrientDB、JanusGraph),可以表达实体和关系的属性,同时利于检索
4)知识抽取过程
a. 命名实体识别
b. 实体间关系识别
c. 实体统一
d. 指代消解(如他她它)

2. 金融知识图谱搭建:业务理解与知识图谱的设计非常重要
1)定义具体业务问题:如金融领域的欺诈。注意如果要使用知识图谱而不是传统数据库,要考虑几个问题:
a. 有强烈的可视化需求
b. 经常涉及深度的关系搜索
c. 对关系查询有实时性要求
2)数据收集与预处理:内部信息源与外部数据,外部一般需要做实体识别和关系识别等处理
3)知识图谱设计
a. 业务原则:图谱能反映业务逻辑
b. 分析原则:
c. 效率原则:知识图谱尽量轻化,一些关系不大、分析时使用较少的属性可以放在传统数据库中。可以把知识图谱和传统数据库的关系看成内存与硬盘的关系
d. 冗余原则
4)上层应用开发:主要有两类,一类是基于规则的,一类是基于概率的
a. 基于规则的方法论
i1. 不一致性检查:找出潜在矛盾点,如两个人的公司电话是相同的,但是公司却不同
i2. 基于规则的特征提取:如“申请人的二度实体里有多少进了黑名单”
i3. 基于模式的判断:通过一些模式找出可能存在风险的子图(如团伙欺诈)。可以根据共享的实体数量定义团伙,也可以定义强连通子图为团伙
b. 基于概率的方法论:如社区挖掘、标签传播、聚类
c. 基于动态网络的分析:知识图谱网络在T到T+1时刻发生了显著变化,可能蕴含着风险信息

3. 知识图谱在其它领域的应用
1)教育领域:根据学习路径构建知识网络,帮助学生制定个性化培养方案
2)证券领域:我们经常关心“A事件发生会影响哪些公司的股价”,可以用知识图谱回答哪些公司会受到影响

这篇关于【数据应用案例】知识图谱技术与应用指南的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1140978

相关文章

批量导入txt数据到的redis过程

《批量导入txt数据到的redis过程》用户通过将Redis命令逐行写入txt文件,利用管道模式运行客户端,成功执行批量删除以Product*匹配的Key操作,提高了数据清理效率... 目录批量导入txt数据到Redisjs把redis命令按一条 一行写到txt中管道命令运行redis客户端成功了批量删除k

分布式锁在Spring Boot应用中的实现过程

《分布式锁在SpringBoot应用中的实现过程》文章介绍在SpringBoot中通过自定义Lock注解、LockAspect切面和RedisLockUtils工具类实现分布式锁,确保多实例并发操作... 目录Lock注解LockASPect切面RedisLockUtils工具类总结在现代微服务架构中,分布

破茧 JDBC:MyBatis 在 Spring Boot 中的轻量实践指南

《破茧JDBC:MyBatis在SpringBoot中的轻量实践指南》MyBatis是持久层框架,简化JDBC开发,通过接口+XML/注解实现数据访问,动态代理生成实现类,支持增删改查及参数... 目录一、什么是 MyBATis二、 MyBatis 入门2.1、创建项目2.2、配置数据库连接字符串2.3、入

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

Apache Ignite 与 Spring Boot 集成详细指南

《ApacheIgnite与SpringBoot集成详细指南》ApacheIgnite官方指南详解如何通过SpringBootStarter扩展实现自动配置,支持厚/轻客户端模式,简化Ign... 目录 一、背景:为什么需要这个集成? 二、两种集成方式(对应两种客户端模型) 三、方式一:自动配置 Thick

Python标准库之数据压缩和存档的应用详解

《Python标准库之数据压缩和存档的应用详解》在数据处理与存储领域,压缩和存档是提升效率的关键技术,Python标准库提供了一套完整的工具链,下面小编就来和大家简单介绍一下吧... 目录一、核心模块架构与设计哲学二、关键模块深度解析1.tarfile:专业级归档工具2.zipfile:跨平台归档首选3.

SQL Server跟踪自动统计信息更新实战指南

《SQLServer跟踪自动统计信息更新实战指南》本文详解SQLServer自动统计信息更新的跟踪方法,推荐使用扩展事件实时捕获更新操作及详细信息,同时结合系统视图快速检查统计信息状态,重点强调修... 目录SQL Server 如何跟踪自动统计信息更新:深入解析与实战指南 核心跟踪方法1️⃣ 利用系统目录

使用IDEA部署Docker应用指南分享

《使用IDEA部署Docker应用指南分享》本文介绍了使用IDEA部署Docker应用的四步流程:创建Dockerfile、配置IDEADocker连接、设置运行调试环境、构建运行镜像,并强调需准备本... 目录一、创建 dockerfile 配置文件二、配置 IDEA 的 Docker 连接三、配置 Do

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

Python进行JSON和Excel文件转换处理指南

《Python进行JSON和Excel文件转换处理指南》在数据交换与系统集成中,JSON与Excel是两种极为常见的数据格式,本文将介绍如何使用Python实现将JSON转换为格式化的Excel文件,... 目录将 jsON 导入为格式化 Excel将 Excel 导出为结构化 JSON处理嵌套 JSON: