datawhale12月学习——算法的应用:Percolation

2023-10-24 23:50

本文主要是介绍datawhale12月学习——算法的应用:Percolation,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

  • 1 题目
    • 1.1 问题概述
    • 1.2 实现要求描述
  • 2 程序实现
    • 2.1 Percolation
    • 2.2 PercolationStats
  • 3 测试结果
    • 3.1 本地测试
    • 3.2 线上测试

1 题目

1.1 问题概述

详见AlgorithmRunning - Percolation

背景问题

Percolation: 渗透问题

  • 给定一个由随机分布的绝缘材料和金属材料组成的复合系统:需要多大比例的材料是金属才能使复合系统成为电导体?
  • 给定一个表面有水(或下面有油)的多孔景观,在什么条件下水能够流到底部(或油涌到地表)。

抽象问题为

使用 n×n 网格对渗透系统进行建模。每个格子要么是打开的,也叫做开放的格子,要么是被阻止的。如果一个方格,可以通过一系列相邻(左、右、上、下)开放格子连接到顶行中的开放格子。如果底行中有一个完整的格子,我们说系统会渗透。换句话说:从第一行到最后一行存在一条通路,这条通路上所有的格子都是打开的,这个模型我们叫做渗透。
在这里插入图片描述
而科学家关心的是是否存在一个概率值 p ∗ p^* p,当格子开启的概率 p p p小于 p ∗ p^* p时,这个系统一定是非渗透的,否则一定是渗透的

这个问题可以通过蒙特卡洛模拟实验来实现,即进行T次实验,每次实验中

对一个初始化的 n×n 网格来说,每次随机选择一个未打开的格子并打开,直到网格系统联通,记录此时的打开格子数m
则该实验的 p ∗ = m / ( n × n ) p^* = m/(n×n) p=m/(n×n)

T次重复实验后可以得到 p ∗ p^* p的期望和95%置信区间。

1.2 实现要求描述

需要实现下面的两个接口:

  • 如何判断系统是否是渗透的:Percolation

    • 初始化系统nxn,默认全部是0,表示关闭
    • 随机选择一个没打开的格子并打开它,1表示打开
    • 判断系统是否渗透
    • 输出渗透系统,并给出一个可能的渗透路径
  • 设计模拟一个蒙特卡洛实验:PercolationStats

    • 初始模拟实验,对nxn的系统运行T次
    • 进行T次实验并记录每一次实验的实验结果
    • 计算均值、扰动值、置信区间的值
    • 输出T次实验的渗透阈值和置信区间

2 程序实现

2.1 Percolation

关键功能为:

  1. 判断系统是否渗透

目标是判断一个系统是不是渗透,即是否存在第一层到最后一层的连通路径。每一个都有n个格子,这里面存在一个多对多的关系。需要依次判断第一层的每一个格子和最后一层的每一个格子是否能够渗透。其实我们并不关注是谁能进行渗透,只要存在即可,因此可以设置两个虚拟的点,start和end点,start和第一层每个打开的格子都是连通的,end和最后一层的每个打开的格子都是连通的,我们只要判断start和end是否渗透,即表示当前系统是不是渗透。
在这里插入图片描述

在本次实现中,由于判断在每次新开启一个格子时进行,因此,我们只需要对每一个新开启点,判断其是否同时与<start,end>联通即可。
判断过程如下:

  • 对随机打开的(i,j),判断周围联通的四个格子[(i-1,j), (i+1, j), (i, j-1), (i, j+1)]是否打开,并将其中打开的格子作为新的查找集
  • 对查找集进行广度优先搜索,对查找集中的每一格子都进行上一步的判断,形成新的查找集,直到某一个格子与<start,end>其中一个联通
  • 与<start,end>都联通,或查找集为空时,停止查找
  • 在查找过程中需要去除查找集中已查找过的点
  1. 输出渗透系统,给出从上至下的可能渗透路径

当我们的系统是渗透状态的时候,系统是由0-1组成的二维网格,此时存在一条可以从最上层向下渗透的系统化,我们的目的是可视化这条能渗透的路径,为了简单,我们可以将这条可以渗透的路径全部赋值成2,此时的系统是有0-1-2组成的,其中0表示未被打开,1表示被打开,但是不能被渗透到;2表示一个可以渗透路径上的格子。
在这里插入图片描述
注:第一层所有打开的格子都是可渗透的。

则只需要从第一层开始往下查找联通格子即可。若想得到上述矩阵,只需要将联通矩阵与打开矩阵相加。

则实现代码如下:

class Percolation(object):"""PercolationArgs:n(int): 构造矩阵的大小,构造成 (n, n);0表示关闭,1表示打开"""def __init__(self, n):self.n = nself.data = np.zeros((n,n))self.max_try = n*n# 判断系统中放个(row, col)是否是打开状态def is_open(self, row, col):return self.data[row,col] == 1# 打开(row, col)这个格子,状态从0变成1  def open(self, row, col):self.data[row,col] = 1self.lastpt = (row,col)# 返回打开的格子数def number_of_open_sites(self):return self.data.sum()# 返回当前系统的状态,是nxn的矩阵def get_current_status(self):return self.data# 可视化系统,将满足从上到下系统的格子,进行显示,# 你需要将满足从第一行就连通的格子的状态,从1变成2def show_percolates(self):show = np.zeros((self.n,self.n))# 第一层所有打开的格子可渗透show[0,:] = self.data[0,:]cu = np.where(show[0,:]==1)[0].tolist()lis = [(0,each) for each in cu]totlis = []totlis = self._sub_show_percolates(lis,totlis)for (i,j) in totlis:show[i,j] = 1return show + self.datadef _sub_show_percolates(self,lis,totlis):if len(lis) == 0:return totlisnlis = []for (i,j) in lis:newlis = [(max(i-1,0),j), (min(i+1,self.n-1), j), (i, max(j-1,0)), (i, min(j+1,self.n-1))]newlis = list(set(newlis))newlis = [each for each in newlis if self.data[each[0],each[1]]==1]nlis.extend(newlis)nlis = list(set(nlis)-set(totlis))totlis.extend(nlis)#print(nlis)totlis = self._sub_show_percolates(nlis,totlis)return totlis# 返回true or false,表示当前系统是否是渗透的# 以新添加点为起点进行检索def percolates(self):start = Falseend = Falsetry:lis = [self.lastpt]except:return Falsetotlis = lis.copy()start,end = self._sub_percolates(lis,start,end,totlis)return start and enddef _sub_percolates(self,lis,start,end,totlis):if len(lis) == 0:return start,endnlis = []for (i,j) in lis:newlis = [(max(i-1,0),j), (min(i+1,self.n-1), j), (i, max(j-1,0)), (i, min(j+1,self.n-1))]newlis = list(set(newlis))newlis = [each for each in newlis if self.data[each[0],each[1]]==1]for each in newlis:if each[0] == 0:start = Truenewlis.remove(each)if each[0] == self.n-1:end = Truenewlis.remove(each)nlis.extend(newlis)if start and end:return start,endnlis = list(set(nlis)-set(totlis))totlis.extend(nlis)start,end = self._sub_percolates(nlis,start,end,totlis)return start,end# 运行模拟实验,每次打开一个格子,直到系统联通; 返回打开的格子个数def run(self):i = 0while i < self.max_try:[row,col] = np.random.randint(self.n,size = 2)if not self.is_open(row,col):self.open(row,col)i += 1if self.percolates():breakreturn i/self.max_try

2.2 PercolationStats

这一部分没有什么特别的,只需要反复实例化Percolation,并执行蒙特卡洛实验(Percolation.run()),然后记录实验结果。最后进行统计计算即可。

代码实现如下:

class PercolationStats(object):def __init__(self, n, t):self.n = n self.t = tself.record = np.zeros(t)# sample mean of percolation threshold# 渗透系统的阈值def mean(self):self.meanV = self.record.mean()return self.meanV# sample standard deviation of percolation threshold# T次实验渗透系统阈值对应的标准差def stddev(self):self.std = self.record.std()return self.std# low endpoint of 95% confidence interval# 95置信区间的下届def confidenceLow(self):self.lowcon = self.meanV - 1.96*self.std/(self.t**0.5)return self.lowcon# high endpoint of 95% confidence interval# 95置信区间的上届def confidenceHigh(self):self.highcon = self.meanV + 1.96*self.std/(self.t**0.5)return self.highcon# 系统会默认调用这个函数进行评测,这个函数必须实现# 进行t次模拟实验,需要返回5元组# <mean(渗透阈值), std(方差), low_conf(置信区间下界), high_conf(置信区间上界), precolation_status(T次实验中随机一个可视化的状态,需要将能够从上到下渗透的格子从1标记成2)>def run(self):for i in range(self.t):rand = Percolation(self.n)self.record[i] = rand.run()return (self.mean(), self.stddev(), self.confidenceLow(), self.confidenceHigh(), rand)

3 测试结果

3.1 本地测试

N = 15,T=20
则阈值、方差、置信下界、置信上界分别为

0.5866666666666667,
0.058626248703435205,
0.5609725803027954,
0.6123607530305379,

某次实验的可视化结果如下:
在这里插入图片描述
附可视化代码

fig,ax = plt.subplots(figsize=(15,15),dpi = 100)
sns.heatmap(t, cmap=sns.diverging_palette(20, 220, n=200), linewidths = 3,annot=True,cbar = False)
plt.show()

3.2 线上测试

线上测试地址

提交名字为:solo一下_tong

测试效果如图
在这里插入图片描述

这篇关于datawhale12月学习——算法的应用:Percolation的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/278590

相关文章

PyTorch核心方法之state_dict()、parameters()参数打印与应用案例

《PyTorch核心方法之state_dict()、parameters()参数打印与应用案例》PyTorch是一个流行的开源深度学习框架,提供了灵活且高效的方式来训练和部署神经网络,这篇文章主要介绍... 目录前言模型案例A. state_dict()方法验证B. parameters()C. 模型结构冻

线程池ThreadPoolExecutor应用过程

《线程池ThreadPoolExecutor应用过程》:本文主要介绍如何使用ThreadPoolExecutor创建线程池,包括其构造方法、常用方法、参数校验以及如何选择合适的拒绝策略,文章还讨论... 目录ThreadPoolExecutor构造说明及常用方法为什么强制要求使用ThreadPoolExec

mysql_mcp_server部署及应用实践案例

《mysql_mcp_server部署及应用实践案例》文章介绍了在CentOS7.5环境下部署MySQL_mcp_server的步骤,包括服务安装、配置和启动,还提供了一个基于Dify工作流的应用案例... 目录mysql_mcp_server部署及应用案例1. 服务安装1.1. 下载源码1.2. 创建独立

Nginx内置变量应用场景分析

《Nginx内置变量应用场景分析》Nginx内置变量速查表,涵盖请求URI、客户端信息、服务器信息、文件路径、响应与性能等类别,这篇文章给大家介绍Nginx内置变量应用场景分析,感兴趣的朋友跟随小编一... 目录1. Nginx 内置变量速查表2. 核心变量详解与应用场景3. 实际应用举例4. 注意事项Ng

Java中的随机数生成案例从范围字符串到动态区间应用

《Java中的随机数生成案例从范围字符串到动态区间应用》本文介绍了在Java中生成随机数的多种方法,并通过两个案例解析如何根据业务需求生成特定范围的随机数,本文通过两个实际案例详细介绍如何在java中... 目录Java中的随机数生成:从范围字符串到动态区间应用引言目录1. Java中的随机数生成基础基本随

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么?二、Online DDL 的三种主要算法2.1COPY(复制法)

利用Python操作Word文档页码的实际应用

《利用Python操作Word文档页码的实际应用》在撰写长篇文档时,经常需要将文档分成多个节,每个节都需要单独的页码,下面:本文主要介绍利用Python操作Word文档页码的相关资料,文中通过代码... 目录需求:文档详情:要求:该程序的功能是:总结需求:一次性处理24个文档的页码。文档详情:1、每个

Java中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例解析

《Java中的分布式系统开发基于Zookeeper与Dubbo的应用案例解析》本文将通过实际案例,带你走进基于Zookeeper与Dubbo的分布式系统开发,本文通过实例代码给大家介绍的非常详... 目录Java 中的分布式系统开发基于 Zookeeper 与 Dubbo 的应用案例一、分布式系统中的挑战二

Java 缓存框架 Caffeine 应用场景解析

《Java缓存框架Caffeine应用场景解析》文章介绍Caffeine作为高性能Java本地缓存框架,基于W-TinyLFU算法,支持异步加载、灵活过期策略、内存安全机制及统计监控,重点解析其... 目录一、Caffeine 简介1. 框架概述1.1 Caffeine的核心优势二、Caffeine 基础2

使用Node.js和PostgreSQL构建数据库应用

《使用Node.js和PostgreSQL构建数据库应用》PostgreSQL是一个功能强大的开源关系型数据库,而Node.js是构建高效网络应用的理想平台,结合这两个技术,我们可以创建出色的数据驱动... 目录初始化项目与安装依赖建立数据库连接执行CRUD操作查询数据插入数据更新数据删除数据完整示例与最佳