RDF Refine(Open Refine + RDF Refine)使用笔记

2023-10-08 16:38

文章标签 使用笔记 open refine rdf

本文主要是介绍RDF Refine(Open Refine + RDF Refine)使用笔记，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

RDF Refine(Open Refine + RDF Refine)使用示例

Open Refine（原名 Google Refine）是一个用来管理杂乱数据，进行整理与扩展的工具。如今的最新版是2.5，beta版为2.6 beta。

本文使用Open Refine同时借助RDF Refine扩展，对一个图书管理csv文件进行整理与扩展操作。最后导出为RDF格式的语义数据。

Open Refine(used name: Gooele Refine)安装

官方网址：

https://github.com/OpenRefine/OpenRefine/wiki/Installation-Instructions#linux

1、下载对应平台的安装包

2、解压

3、运行（Linux下直接运行./refine）

4、输入127.0.0.1:3333即可访问Google Refine的网址

5、如果需要接收任何ip地址发出的请求，需要在命令行运行时输入./refine -i0.0.0.0

安装RDF Refine

在http://refine.deri.ie/下载RDF Refine的extension包，放在Google Refine的webapp/extensions里面。重启Google Refine

在Project管理页面右上角看到下图所示RDF选项，说明加载成功。

增加reconciliation service

点击右上角RDF，选择Add reconciliationservice，在选择based on SPARQL

按照下图所示填写详细信息

注意Endpoint Type选择Virtuoso

在reconciliation结果的优化中可以对Label properties进行选择，可以选择other，然后手动键入URI

进行Reconciliation过程

如下图所示的上传内存中，我们点击name那里的下拉按钮，选择startreconciliation

然后选择DBpedia，经过一番计算与处理之后，中央的一个列表给出了一系列类型候选项。选择一项我们认为最为认可的type。

在持续了8分钟（具体耗时根据网络状况而定）的信息抽取与处理之后，pre-reconciliation终于给了我们一个列表：

我们选择dbo:Book这个类型，然后为了简便起见，直接点击StartReconciliation

这个提示框告诉我们reconciliation过程的进度

如下图所示，我们已经部分完成了reconciliation的过程

左侧边栏：

在name一栏有匹配到book name与未匹配到任何信息两类数据，exclude为删除对应的条目。

而下方的柱状图表可以用来拖拽，显示不同候选分值的条目用来显示。同时，点击change，我们可以对分值进行修改与自定义计算。

人工优化reconciliation结果

这里的两个勾选可以对user认为正确的条目进行确认。

在下面这个条目中有很多候选选项，本身的名字非常具有歧义性，所以需要用户进行更为细致的确认。

点击其中的候选项，查看详细信息。通过作者的匹配，基本上确认这本书在DBpedia中的具体条目。

同样对作者一栏进行reconciliation

结果中只有一个条目没有得到对应的匹配结果，我们选择新建这个条目

定义Schema信息

接下来定义schema信息

修改Base URI

添加主语属性：

添加类型信息：

点击这里的property修改谓语属性URI，先点击其中一个输入dc:title，点击确定加载，然后再相同操作输入一遍即可选择对应的谓语URI

修改后如下：

点击preview即可进行预览：

这里可以修改每一个宾语的类型信息。

添加一个property：

对添加的谓语所对应的宾语进行设置：

preview/edit对话框中，输入cell.recon.match.id

此时在预览框我们看到了和DBpedia中URI的对应关系：

添加另外一个属性：foaf:maker，同时选中Used As a URI

在预览框中我们可以看到新添加的内容：

我们点击OK，结束RDF Skeleton过程。

导出RDF文件

最后点击Export，选择RDF/XML，导出为RDF XML文件。

这篇关于RDF Refine(Open Refine + RDF Refine)使用笔记的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/166613。 23002807@qq.com

相关文章

Java中流式并行操作parallelStream的原理和使用方法

Java中流式并行操作parallelStream的原理和使用方法

《Java中流式并行操作parallelStream的原理和使用方法》本文详细介绍了Java中的并行流（parallelStream）的原理、正确使用方法以及在实际业务中的应用案例,并指出在使用并行流... 目录Java中流式并行操作parallelStream0. 问题的产生1. 什么是parallelS

阅读更多...

Linux join命令的使用及说明

Linux join命令的使用及说明

《Linuxjoin命令的使用及说明》`join`命令用于在Linux中按字段将两个文件进行连接,类似于SQL的JOIN,它需要两个文件按用于匹配的字段排序,并且第一个文件的换行符必须是LF,`jo... 目录一. 基本语法二. 数据准备三. 指定文件的连接key四.-a输出指定文件的所有行五.-o指定输出

阅读更多...

Linux jq命令的使用解读

Linux jq命令的使用解读

《Linuxjq命令的使用解读》jq是一个强大的命令行工具,用于处理JSON数据,它可以用来查看、过滤、修改、格式化JSON数据,通过使用各种选项和过滤器,可以实现复杂的JSON处理任务... 目录一. 简介二. 选项2.1.2.2-c2.3-r2.4-R三. 字段提取3.1 普通字段3.2 数组字段四.

阅读更多...

Linux kill正在执行的后台任务 kill进程组使用详解

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本，并kill2.1 进程查看2.2 遇到的

阅读更多...

详解SpringBoot+Ehcache使用示例

详解SpringBoot+Ehcache使用示例

《详解SpringBoot+Ehcache使用示例》本文介绍了SpringBoot中配置Ehcache、自定义get/set方式,并实际使用缓存的过程,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录摘要概念内存与磁盘持久化存储：配置灵活性：编码示例引入依赖：配置ehcache.XML文件：配置

阅读更多...

Java 虚拟线程的创建与使用深度解析

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程？1.2 为什么需要虚拟线程？二、虚拟线程与平台线程对比代码对比示例：三

阅读更多...

k8s按需创建PV和使用PVC详解

k8s按需创建PV和使用PVC详解

《k8s按需创建PV和使用PVC详解》Kubernetes中,PV和PVC用于管理持久存储,StorageClass实现动态PV分配,PVC声明存储需求并绑定PV,通过kubectl验证状态,注意回收... 目录1.按需创建 PV（使用 StorageClass）创建 StorageClass2.创建 PV

阅读更多...

Redis 基本数据类型和使用详解

Redis 基本数据类型和使用详解

《Redis基本数据类型和使用详解》String是Redis最基本的数据类型,一个键对应一个值,它的功能十分强大,可以存储字符串、整数、浮点数等多种数据格式,本文给大家介绍Redis基本数据类型和... 目录一、Redis 入门介绍二、Redis 的五大基本数据类型2.1 String 类型2.2 Hash

阅读更多...

Redis中Hash从使用过程到原理说明

Redis中Hash从使用过程到原理说明

《Redis中Hash从使用过程到原理说明》RedisHash结构用于存储字段-值对,适合对象数据,支持HSET、HGET等命令,采用ziplist或hashtable编码,通过渐进式rehash优化... 目录一、开篇：Hash就像超市的货架二、Hash的基本使用1. 常用命令示例2. Java操作示例三

阅读更多...

Linux创建服务使用systemctl管理详解

Linux创建服务使用systemctl管理详解

《Linux创建服务使用systemctl管理详解》文章指导在Linux中创建systemd服务,设置文件权限为所有者读写、其他只读,重新加载配置,启动服务并检查状态,确保服务正常运行,关键步骤包括权... 目录创建服务 /usr/lib/systemd/system/设置服务文件权限：所有者读写js，其他

阅读更多...