Football数据集可视化处理——gephi可视化处理数据

2023-10-06 21:59

本文主要是介绍Football数据集可视化处理——gephi可视化处理数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

#1 football数据集的文件格式
根据如图所示football数据集和的文件格式如下所示:
下图表示football数据集节点部分信息
这里写图片描述
下图表示football数据集边的部分信息
这里写图片描述
根据上述两个图中的格式对football数据集的格式介绍可以介绍为如下所示:

Creator "Mark Newman on Sat Jul 22 05:32:16 2006"
graph
[node[id **value **label ****]...node[id **value **label ****]edge[id **value **label ****]...edge[id ***value **label ****]
]

#2 football数据集文件格式的转化
根据上述的football文件,我们将数据文件转化成两个文件,这两个文件分别用来存储football数据集的边信息和节点信息,对football数据集文件的处理如下。
##2.1 football数据集节点信息文件
根据gephi通过csv导入信息的需要,我们将数据信息处理成如下的数据集节点文件格式:

Id Label Value
1  Tom   3
2  Bob   4

在football数据集中将football.gml文件处理得到的结果如下所示:
这里写图片描述
其中:

Id:用于标识唯一的一个点
Label:标识节点的标签或者是名称
Value:标识节点的所属的社区。

##2.2 football数据集边信息文件
根据gephi通过csv导入数据的格式,我们分为有向图和无向图两种数据格式,对于有向图的导入数据格式如下所示:

Source Target Weight
1 3 2
2 4 1
根据上述公式:
Source:表示源节点
Target:表示目的结点
Weight:表示对应的边的权重

在无向图的导入中需要加入Type类型得出的数据格式如下所示:

Source Target Weigth Type
1 3 2 Undirected
2 4 1 Undirected

如下图所示为football数据集的数据个格式,football数据集是无权图因此没有有weight。
这里写图片描述

在football数据集的616条边中有三条边是重复出现的分别为

28 18
85 4
100 15

在通过gephi对这些边进行模块化社区划分运算的时候需要将这些边删除,否则无法运行。
##2.3 对football.gml处理代码

#include <iostream>
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
using namespace std;int main()
{FILE* inputfile = NULL;FILE* nodefile = NULL;FILE* edgefile = NULL;inputfile = fopen("football.gml","r");nodefile = fopen("nodefile.txt","w");edgefile = fopen("edgefile.txt","w");fprintf(nodefile, "Id Label Value\n");fprintf(edgefile,"Source Target Type\n");char strLine[1024];int i = 0;int node = 0;int edge = 0;//char nodeinfo[100];char edgeinfo[100];while(!feof(inputfile)){fgets(strLine,1024, inputfile);if(strncmp(strLine+4,"id",2)==0 ){char id[5];char label[50];char value[5];memset(label,0,50);int idint = 0, valueint = 0;int copylen = 0;copylen = strlen(strLine) - 8;strncpy(id,strLine+7,copylen);idint = atoi(id)+1;fgets(strLine,1024, inputfile);copylen = strlen(strLine) - 13;strncpy(label,strLine+11,copylen);fgets(strLine,1024, inputfile);copylen = strlen(strLine) - 10;strncpy(value,strLine+10,copylen);valueint = atoi(value)+1;//cout << valueint << endl;fprintf(nodefile,"%d %s %d\n",idint,label,valueint);}if(strncmp(strLine+4,"source",6)==0){char target[5];char source[5];int sourceint = 0,targetint = 0;memset(target,0,5);memset(source,0,5);int copylen = 0;copylen = strlen(strLine)-12;strncpy(source,strLine+11,copylen);sourceint = atoi(source)+1;fgets(strLine,1024, inputfile);copylen = strlen(strLine)-12;strncpy(target,strLine+11,copylen);targetint = atoi(target)+1;fprintf(edgefile,"%d %d undirected\n",sourceint,targetint);}}fclose(nodefile);fclose(edgefile);return 0;
}

#3 gephi点表和边表的导入并生成football图像
(1)点击文件->Import spreadsheet如下图所示:
这里写图片描述

(2)选择需要导入的文件进行数据导入
这里写图片描述
注意选择导入的是边表格还是点表格

(3)点击模块化
这里写图片描述

(4)设置参数为0.4
这里写图片描述

(5)选择节点的渲染方式为Modularity Class
这里写图片描述
(6)得到football的社区划分和真实社区对比

football数据集通过gephi进行社区划分的结果(不带有边的图)
这里写图片描述
football数据集真实社区的结果(不带有边的图)
这里写图片描述
football数据集通过gephi进行社区划分的结果(带有边的图)
这里写图片描述
football数据集真实社区的结果(带有边的图)
这里写图片描述

根据上述的结果我们可以对比得到gephi生成的社区和真实社区的差别,并且最终得到如下所示的两张对比图片。

gephi基于模块度生成社区划分的图片
这里写图片描述
football给出的标签的真实社区图片
这里写图片描述
football数据集以及相关数据集下载地址
CSDN下载链接

这篇关于Football数据集可视化处理——gephi可视化处理数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/154135

相关文章

一文带你搞懂Redis Stream的6种消息处理模式

《一文带你搞懂RedisStream的6种消息处理模式》Redis5.0版本引入的Stream数据类型,为Redis生态带来了强大而灵活的消息队列功能,本文将为大家详细介绍RedisStream的6... 目录1. 简单消费模式(Simple Consumption)基本概念核心命令实现示例使用场景优缺点2

Git可视化管理工具(SourceTree)使用操作大全经典

《Git可视化管理工具(SourceTree)使用操作大全经典》本文详细介绍了SourceTree作为Git可视化管理工具的常用操作,包括连接远程仓库、添加SSH密钥、克隆仓库、设置默认项目目录、代码... 目录前言:连接Gitee or github,获取代码:在SourceTree中添加SSH密钥:Cl

Java注解之超越Javadoc的元数据利器详解

《Java注解之超越Javadoc的元数据利器详解》本文将深入探讨Java注解的定义、类型、内置注解、自定义注解、保留策略、实际应用场景及最佳实践,无论是初学者还是资深开发者,都能通过本文了解如何利用... 目录什么是注解?注解的类型内置注编程解自定义注解注解的保留策略实际用例最佳实践总结在 Java 编程

Pandas中统计汇总可视化函数plot()的使用

《Pandas中统计汇总可视化函数plot()的使用》Pandas提供了许多强大的数据处理和分析功能,其中plot()函数就是其可视化功能的一个重要组成部分,本文主要介绍了Pandas中统计汇总可视化... 目录一、plot()函数简介二、plot()函数的基本用法三、plot()函数的参数详解四、使用pl

一文教你Python如何快速精准抓取网页数据

《一文教你Python如何快速精准抓取网页数据》这篇文章主要为大家详细介绍了如何利用Python实现快速精准抓取网页数据,文中的示例代码简洁易懂,具有一定的借鉴价值,有需要的小伙伴可以了解下... 目录1. 准备工作2. 基础爬虫实现3. 高级功能扩展3.1 抓取文章详情3.2 保存数据到文件4. 完整示例

使用Java将各种数据写入Excel表格的操作示例

《使用Java将各种数据写入Excel表格的操作示例》在数据处理与管理领域,Excel凭借其强大的功能和广泛的应用,成为了数据存储与展示的重要工具,在Java开发过程中,常常需要将不同类型的数据,本文... 目录前言安装免费Java库1. 写入文本、或数值到 Excel单元格2. 写入数组到 Excel表格

Java 中的 @SneakyThrows 注解使用方法(简化异常处理的利与弊)

《Java中的@SneakyThrows注解使用方法(简化异常处理的利与弊)》为了简化异常处理,Lombok提供了一个强大的注解@SneakyThrows,本文将详细介绍@SneakyThro... 目录1. @SneakyThrows 简介 1.1 什么是 Lombok?2. @SneakyThrows

在 Spring Boot 中实现异常处理最佳实践

《在SpringBoot中实现异常处理最佳实践》本文介绍如何在SpringBoot中实现异常处理,涵盖核心概念、实现方法、与先前查询的集成、性能分析、常见问题和最佳实践,感兴趣的朋友一起看看吧... 目录一、Spring Boot 异常处理的背景与核心概念1.1 为什么需要异常处理?1.2 Spring B

python处理带有时区的日期和时间数据

《python处理带有时区的日期和时间数据》这篇文章主要为大家详细介绍了如何在Python中使用pytz库处理时区信息,包括获取当前UTC时间,转换为特定时区等,有需要的小伙伴可以参考一下... 目录时区基本信息python datetime使用timezonepandas处理时区数据知识延展时区基本信息

Qt实现网络数据解析的方法总结

《Qt实现网络数据解析的方法总结》在Qt中解析网络数据通常涉及接收原始字节流,并将其转换为有意义的应用层数据,这篇文章为大家介绍了详细步骤和示例,感兴趣的小伙伴可以了解下... 目录1. 网络数据接收2. 缓冲区管理(处理粘包/拆包)3. 常见数据格式解析3.1 jsON解析3.2 XML解析3.3 自定义