Spark GraphX实现Bron–Kerbosch算法-极大团问题

2024-02-28 11:40

本文主要是介绍Spark GraphX实现Bron–Kerbosch算法-极大团问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

首先,说明两个概念:团、极大团。

  • clique)是一个无向图(undirected graph )的子图,该子图中任意两个顶点之间均存在一条边。又叫做完全子图。
  • 极大团(maximal clique)是一个团,该团不能被更大的团所包含,换句话说,再也不存在一个点与该团中的任意顶点之间存在一条边。

研究极大团的问题对社区发现等场景有较高的理论价值和现实意义。求一个无向图中的极大团问题是一个经典的NP完全问题,1973年曾提出了一个Bron-Kerbosch算法用来解决该问题,其伪代码如下:

 BronKerbosch(R, P, X):if P and X are both empty:report R as a maximal cliquefor each vertex v in P:BronKerbosch(R ⋃ {v}, P ⋂ N(v), X ⋂ N(v))P := P \ {v}X := X ⋃ {v}

该算法中有四个集合:R,P,X,N(v),其中:

R:目前已经在团中的顶点的集合

P:可能在团中的顶点的集合

X:不被考虑的顶点的集合

N(v):顶点v的所有直接邻居


以一个6个顶点的图为例:


用Spark GraphX实现Bron Kerbosch算法,搜索该图的极大团,代码如下:

import org.apache.spark.graphx.{Edge, EdgeDirection, Graph, VertexId}
import org.apache.spark.{SparkConf, SparkContext}import scala.collection.mutable
import scala.collection.mutable.Setobject FindMaximalCliques {def main(args: Array[String]): Unit = {val conf = new SparkConf().setAppName("findMaximalCliques").setMaster("local")val sc: SparkContext = new SparkContext(conf)//定义顶点val vertexArray = Array((1L,null),(2L,null),(3L,null),(4L,null),(5L,null),(6L,null))//定义边val edgeArray = Array(Edge(6L, 4L,null),Edge(4L, 3L,null),Edge(4L, 5L,null),Edge(5L, 2L,null),Edge(3L, 2L,null),Edge(5L, 1L,null),Edge(2L, 1L,null))//顶点和边转化为RDDval vertexRDD = sc.parallelize(vertexArray)val edgeRDD  = sc.parallelize(edgeArray)//根据顶点和边创建图val graph= Graph(vertexRDD,edgeRDD)//创建一个Map集合。key是图中的所有顶点;value是一个Set集合,保存了该key的所有邻居顶点val map: Map[VertexId, Set[VertexId]] = graph.collectNeighborIds(EdgeDirection.Either).collect().map(t => {var set: mutable.Set[VertexId] = Set[VertexId]()t._2.foreach(t=>{set+=t})(t._1, set)}).toMap//R集合,初始值为空var R = Set[VertexId]()//P集合,初始值为所有的顶点var P = Set[VertexId]()//将所有的顶点添加到P集合中vertexRDD.collect().foreach(t=>{P+=t._1})//X集合,初始值为空var X = Set[VertexId]()//搜索极大团bronKerboschl(R,P,X,map)}/*** 搜索极大团的方法* @param R 目前已经在团中的顶点的集合* @param P 可能在团中的顶点的集合* @param X 不被考虑的顶点的集合* @param map Map集合,通过顶点获取该顶点的所有邻居顶点集合*/def bronKerboschl(R:Set[VertexId],P:Set[VertexId],X:Set[VertexId],map:Map[VertexId, Set[VertexId]]): Unit ={if(P.toList.length ==0 && X.toList.length ==0){println("find a maximal cilique:"+R)}else {for (v <- P) {var Nv: Set[VertexId] = map.get(v).getbronKerboschl(R+v, P.intersect(Nv), X.intersect(Nv), map)X += vP -= v}}}}

结果为:

find a maximal cilique:Set(1, 5, 2)
find a maximal cilique:Set(5, 4)
find a maximal cilique:Set(2, 3)
find a maximal cilique:Set(6, 4)
find a maximal cilique:Set(3, 4)


这篇关于Spark GraphX实现Bron–Kerbosch算法-极大团问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/755401

相关文章

C++中unordered_set哈希集合的实现

《C++中unordered_set哈希集合的实现》std::unordered_set是C++标准库中的无序关联容器,基于哈希表实现,具有元素唯一性和无序性特点,本文就来详细的介绍一下unorder... 目录一、概述二、头文件与命名空间三、常用方法与示例1. 构造与析构2. 迭代器与遍历3. 容量相关4

C++中悬垂引用(Dangling Reference) 的实现

《C++中悬垂引用(DanglingReference)的实现》C++中的悬垂引用指引用绑定的对象被销毁后引用仍存在的情况,会导致访问无效内存,下面就来详细的介绍一下产生的原因以及如何避免,感兴趣... 目录悬垂引用的产生原因1. 引用绑定到局部变量,变量超出作用域后销毁2. 引用绑定到动态分配的对象,对象

SpringBoot基于注解实现数据库字段回填的完整方案

《SpringBoot基于注解实现数据库字段回填的完整方案》这篇文章主要为大家详细介绍了SpringBoot如何基于注解实现数据库字段回填的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解... 目录数据库表pom.XMLRelationFieldRelationFieldMapping基础的一些代

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java AOP面向切面编程的概念和实现方式

《JavaAOP面向切面编程的概念和实现方式》AOP是面向切面编程,通过动态代理将横切关注点(如日志、事务)与核心业务逻辑分离,提升代码复用性和可维护性,本文给大家介绍JavaAOP面向切面编程的概... 目录一、AOP 是什么?二、AOP 的核心概念与实现方式核心概念实现方式三、Spring AOP 的关

IDEA和GIT关于文件中LF和CRLF问题及解决

《IDEA和GIT关于文件中LF和CRLF问题及解决》文章总结:因IDEA默认使用CRLF换行符导致Shell脚本在Linux运行报错,需在编辑器和Git中统一为LF,通过调整Git的core.aut... 目录问题描述问题思考解决过程总结问题描述项目软件安装shell脚本上git仓库管理,但拉取后,上l

Python实现字典转字符串的五种方法

《Python实现字典转字符串的五种方法》本文介绍了在Python中如何将字典数据结构转换为字符串格式的多种方法,首先可以通过内置的str()函数进行简单转换;其次利用ison.dumps()函数能够... 目录1、使用json模块的dumps方法:2、使用str方法:3、使用循环和字符串拼接:4、使用字符

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么?二、Online DDL 的三种主要算法2.1COPY(复制法)

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

Linux挂载linux/Windows共享目录实现方式

《Linux挂载linux/Windows共享目录实现方式》:本文主要介绍Linux挂载linux/Windows共享目录实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录文件共享协议linux环境作为服务端(NFS)在服务器端安装 NFS创建要共享的目录修改 NFS 配