【过程发现算法1】-Inductive Miner(归纳式挖掘)

2024-01-27 20:30

本文主要是介绍【过程发现算法1】-Inductive Miner(归纳式挖掘),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Inductive Miner(归纳式挖掘)是目前已有的过程发现算法中最先进的一种算法,在2013年由sander提出,他是一种基于过程树的算法,并在上面衍生了各种变体算法,比如Inductive Miner-Infrequency, Inductive Miner-Lifecycle等,接下来,我们就详细地介绍这个基本的Inductive Miner算法。


1.背景介绍

已有过程发现算法比较
发现算法代表性算法可重新发现性fitnesssoundness其他
基于活动顺序关系

α算法及其变体

相对小的日志的同构重发现

X

X

基于语义的技术the language-based region minerthe state-based region minerILP miner

X

X

X

基于频率的技术

           Heuristics miner

-

X

X

基于抽象的技术

Fuzzy Miner

X

X

X

Genetic process discovery algorithms

--

V

不能保证在有限的时间内运行

        现有的挖掘算法不能保证在有限的时间内(没有死锁和其他异常)模型是fitting(表示所有的行为)soundness(合理的)

       不合理的模型可以通过模拟退火来修复,使其变得健全,尽管不保留对给定日志的拟合性。不拟合的模型可以通过添加子过程来修复,使其变得拟合,尽管不能保证其可靠性。

       因此,需一个更综合的方法保证合理性和拟合度,并且在有限的时间内得到块结构(block-structured)模型。IM算法应用而生。

2.思想概述 

该框架采用分而治之的方法, 将发现一个日志 L 的过程模型的问题分解为发现通过拆分 L 得到的n 个子日志的 n 个子过程 .
本文共用了四种基本运算符:
X:    排他运算符;  -> :   顺序运算符;  Q :  循环运算符;  ^ :    并发运算符

 上图中的每个小圆圈代表每个子过程,四种运算符的详细规则如下:

排他运算符的规则为一个子过程A与另一个子过程B两个之间没有任何关联,一个子过程A中的活动的后继活动不能在另一个子过程B中,一个子过程B中的活动的后继活动不能在另一个子过程A中,两者互不关联

顺序运算符的规则为从一个子过程A到另一个子过程B有出边,但是无入边,两者总体上只有一方到另一方

并发运算符的规则为一个子过程A既有到另一个子过程的出边,也有另一个子过程B到这个子过程A的入边。两者彼此交叉,并行存在

循环运算符的规则为一个活动从子过程A出发,到达另一个子过程B中,再由B重现回到A。总结为起于此终于此

3. 举例说明

假设存在事件日志 L = {< a, b, c >, < a, c, b >, < a, d, e >, < a, d, e, f, d, e >}.

(1).将事件日志转化为直接跟随活动图(DFG)

(2).使用四种切分运算符对上述的DFG进行拆分,拆分过程如下: 

其中图中a ,b ,c ,d依次进行的切分操作为顺序切分,排他切分,并发切分,循环切分

 用过程语言可表示为:

L = {<a, b, c >, < a, c, b >, < a, d, e >, <a, d, e, f, d, e >},依次进行的操作如下:

1.SEQUENCESPLIT(L,({a},{b, c, d, e, f})) =[L1={< a >},L2={<b, c >, <c, b >, <d, e >, <d, e, f, d, e >}]

2.EXCLUSIVECHOICESPLIT(L2,({b, c},{d, e, f})) = {L3=<b, c>, < c, b >},{L4=< d, e >, <d, e, f, d, e >}]

3.PARALLELSPLIT(L3,({b},{c})) ={<b >},{<c >}

4.LOOPSPLIT(L4,({d, e},{f})) = {<d, e >},{< f >}

(3).根据上述过程转化为过程树语言如下:

 发现模型: M= →(a, X(∧(b, c), Q (→ (d,e),f)))

 (4).过程树转化为Petri网

四种基本形式的对应转化:

按照以上四种基本规则,最终得到的Petri网结果如下:

4.工具插件

(1)使用prom6运行的插件svn下载地址:prom - Revision 46111: /Packages/InductiveMinerDeprecated/Trunk (tue.nl)

运行插件界面图:

 

 (2)使用pm4py调用Inductive Miner算法的链接地址:

PM4Py - Process Mining for Python (fraunhofer.de)

 4.总结

由Inductive Miner得到的过程模型能够完全拟合事件日志中的行为,但还存在以下不足:

(1)没有考虑事件日志中直接跟随活动关系的频次;

(2)在过程树转化为Petri网的过程中,无声变迁(上图中的黑色方块)数量增多,导致过程模型的精度降低。


参考文献:LEEMANS S J J, FAHLAND D, VAN DER AALST W M P. Discovering block-structured process models from event logs-a constructive approach[C]//International conference on applications and theory of Petri nets and concurrency. Berlin, Germany: Springer-Verlag, 2013: 311-329.

 下一讲将针对Inductive Miner存在的不足,介绍其算法的变体-Inductive Miner-infrequent。

如需进行相关的了解或者交流,欢迎私信或者加入QQ群:

这篇关于【过程发现算法1】-Inductive Miner(归纳式挖掘)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/651401

相关文章

openCV中KNN算法的实现

《openCV中KNN算法的实现》KNN算法是一种简单且常用的分类算法,本文主要介绍了openCV中KNN算法的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录KNN算法流程使用OpenCV实现KNNOpenCV 是一个开源的跨平台计算机视觉库,它提供了各

PyInstaller打包selenium-wire过程中常见问题和解决指南

《PyInstaller打包selenium-wire过程中常见问题和解决指南》常用的打包工具PyInstaller能将Python项目打包成单个可执行文件,但也会因为兼容性问题和路径管理而出现各种运... 目录前言1. 背景2. 可能遇到的问题概述3. PyInstaller 打包步骤及参数配置4. 依赖

springboot+dubbo实现时间轮算法

《springboot+dubbo实现时间轮算法》时间轮是一种高效利用线程资源进行批量化调度的算法,本文主要介绍了springboot+dubbo实现时间轮算法,文中通过示例代码介绍的非常详细,对大家... 目录前言一、参数说明二、具体实现1、HashedwheelTimer2、createWheel3、n

将Mybatis升级为Mybatis-Plus的详细过程

《将Mybatis升级为Mybatis-Plus的详细过程》本文详细介绍了在若依管理系统(v3.8.8)中将MyBatis升级为MyBatis-Plus的过程,旨在提升开发效率,通过本文,开发者可实现... 目录说明流程增加依赖修改配置文件注释掉MyBATisConfig里面的Bean代码生成使用IDEA生

C# WinForms存储过程操作数据库的实例讲解

《C#WinForms存储过程操作数据库的实例讲解》:本文主要介绍C#WinForms存储过程操作数据库的实例,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、存储过程基础二、C# 调用流程1. 数据库连接配置2. 执行存储过程(增删改)3. 查询数据三、事务处

JSON Web Token在登陆中的使用过程

《JSONWebToken在登陆中的使用过程》:本文主要介绍JSONWebToken在登陆中的使用过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录JWT 介绍微服务架构中的 JWT 使用结合微服务网关的 JWT 验证1. 用户登录,生成 JWT2. 自定义过滤

java中使用POI生成Excel并导出过程

《java中使用POI生成Excel并导出过程》:本文主要介绍java中使用POI生成Excel并导出过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录需求说明及实现方式需求完成通用代码版本1版本2结果展示type参数为atype参数为b总结注:本文章中代码均为

SpringBoot实现MD5加盐算法的示例代码

《SpringBoot实现MD5加盐算法的示例代码》加盐算法是一种用于增强密码安全性的技术,本文主要介绍了SpringBoot实现MD5加盐算法的示例代码,文中通过示例代码介绍的非常详细,对大家的学习... 目录一、什么是加盐算法二、如何实现加盐算法2.1 加盐算法代码实现2.2 注册页面中进行密码加盐2.

Java时间轮调度算法的代码实现

《Java时间轮调度算法的代码实现》时间轮是一种高效的定时调度算法,主要用于管理延时任务或周期性任务,它通过一个环形数组(时间轮)和指针来实现,将大量定时任务分摊到固定的时间槽中,极大地降低了时间复杂... 目录1、简述2、时间轮的原理3. 时间轮的实现步骤3.1 定义时间槽3.2 定义时间轮3.3 使用时

SpringCloud之consul服务注册与发现、配置管理、配置持久化方式

《SpringCloud之consul服务注册与发现、配置管理、配置持久化方式》:本文主要介绍SpringCloud之consul服务注册与发现、配置管理、配置持久化方式,具有很好的参考价值,希望... 目录前言一、consul是什么?二、安装运行consul三、使用1、服务发现2、配置管理四、数据持久化总