博弈论详解 1(基本理论定义 和 Nim 游戏)

2024-08-26 18:20

本文主要是介绍博弈论详解 1(基本理论定义 和 Nim 游戏),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

公平博弈游戏

  1. 一般是两个玩家,轮流操作。
  2. 是否能够必胜只和当前局面相关,不与现在是轮到哪个玩家相关(说白了就是不分黑白棋子,格点也不分黑白,都一样)。
  3. 固定了开始状态后,可能的局面数是有限的。
  4. 游戏一定会在有限步内结束

怎么才能赢?

必胜局面与必败局面

我们定义当前的局面对于先手(指的是要对当前局面进行操作的人,下面对先手的定义也相同)是必胜的为 N N N 局面,必败为 P P P 局面。根据必胜与必败的定义,可知:

  1. 如果当前是 N N N 局面,那么操作者一定能够通过做某一种操作使得局面变成 P P P 局面,使对方(要对 P P P 局面操作的人)必败,自己也就必胜。简单说就是从 N N N 能走到 P P P
  2. 如果当前是 P P P 局面,那么操作者无论如何操作,总是会输,也就是说只能到达 N N N 局面,使对方必胜,自己必败(如果 P P P 能到 P P P,那么意味着操作者可以反败为胜,此局面是 N N N 局面,矛盾)。简单来说就是从 P P P 只能走到 N N N

什么样的局面是必胜的?

假设满足条件 C C C,局面就必胜,否则必败。根据上面的分析,容易发现:

  1. 满足 C C C 的局面一定能走到不满足 C C C 的局面。
  2. 不满足 C C C 的局面只能走到满足 C C C 的局面。

由于游戏结束时的局面是必败的(已经输了),所以再加上一条: 最终局面不满足 C C C
那么该怎么找到条件 C C C 呢?这很困难,一般都是引用先辈的结论。我们举一个简单的例子:Nim 游戏。

Nim游戏

游戏规则

n n n 堆石子,第 i i i 堆石子有 a i a_i ai 个,每次操作可以取走一堆石子中的任意数量的石子。如果轮到一方取石子的时候没有石子了,Ta 就输了。

必胜条件 C

C : a 1 ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n ≠ 0 C:a_1\oplus a_2\oplus a_3\oplus...\oplus a_n\ne0 C:a1a2a3...an=0 a 1 ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n a_1\oplus a_2\oplus a_3\oplus...\oplus a_n a1a2a3...an 也称为 Nim 和)
B u t But But W h y ? Why? Why?
首先,当 a 1 = a 2 = a 3 = . . . = a n = 0 a_1=a_2=a_3=...=a_n=0 a1=a2=a3=...=an=0 的时候,是最终局面,上述等式不成立,所以 C C C 要满足的第三个条件已经得证。
对异或的性质不是很了解的可以看一下本人之前写的一篇文章,主要结论:交换律,结合律和 x ⊕ y = z x\oplus y=z xy=z x ⊕ z = y x\oplus z=y xz=y

第一个条件:假设操作之后的石子数量变成 a 1 ′ , a 2 , a 3 . . . a n a_1',a_2,a_3...a_n a1,a2,a3...an,是 P 局面,则需满足 a 1 ′ ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n = 0 a_1'\oplus a_2\oplus a_3\oplus...\oplus a_n=0 a1a2a3...an=0,要证明 a 1 > a 1 ′ a_1>a_1' a1>a1
A = a 2 ⊕ a 3 ⊕ . . . ⊕ a n A=a_2\oplus a_3\oplus...\oplus a_n A=a2a3...an B = a 1 ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n B=a_1\oplus a_2\oplus a_3\oplus...\oplus a_n B=a1a2a3...an。因为 a 1 ′ ⊕ A = 0 a_1'\oplus A=0 a1A=0,所以 a 1 ′ = A a_1'=A a1=A;因为 a 1 ⊕ A = B a_1\oplus A=B a1A=B,所以 a 1 ′ = A = B ⊕ a 1 a_1'=A=B\oplus a_1 a1=A=Ba1
B B B 的二进制中最高的为 1 1 1 的位置是第 k k k 位(从低位到高位,最低位是第 0 0 0 位),不妨设 a 1 a_1 a1 的二进制中包含 2 k 2^k 2k(这 n n n 个数里必然有一个数包含 2 k 2^k 2k,否则 B B B 的第 k k k 位是 0 0 0)。因为两者的第 k k k 位都是 1 1 1,所以 B ⊕ a 1 B\oplus a_1 Ba1 的第 k k k 位是 0 0 0。但是 B B B 的更高位上没有 1 1 1 了,所以 B ⊕ a 1 < a 1 B\oplus a_1<a_1 Ba1<a1,即 a 1 ′ < a 1 a_1'<a_1 a1<a1,可以通过从 a 1 a_1 a1 中拿走一些石子实现转移。
你竟然看懂了第一个条件的证明!太厉害了,第二个条件会简单很多!

第二个条件:由于此时 Nim 和等于 0 0 0,假设你从第 i i i 堆拿走了 j j j 个石子,此时 Nim 和变为 ( a 1 ⊕ a 2 ⊕ . . . ⊕ a n ) ⊕ a i ⊕ ( a i − j ) (a_1\oplus a_2\oplus...\oplus a_n)\oplus a_i\oplus (a_i-j) (a1a2...an)ai(aij)(就是先把原本的 a i a_i ai 从 Nim 和中去掉,再异或上新的 a i a_i ai)。由于 j > 0 j>0 j>0,所以 a i − j ≠ a i a_i-j\ne a_i aij=ai a i ⊕ ( a i − j ) ≠ 0 a_i\oplus (a_i-j)\ne 0 ai(aij)=0,新的 Nim 和不等于 0 0 0,转移到 N 局面。

必胜操作

必胜操作也已经在第一个条件的证明中提到了,如果你必胜,那么就在 a 1 a_1 a1 中拿走 a 1 − ( a 1 ⊕ Nim和 ) a_1-(a_1\oplus \text{Nim和}) a1(a1Nim) 个石子( a 1 a_1 a1 是一堆石子,满足 a 1 a_1 a1 包含 Nim 和最高位的 1 1 1 所代表的值 2 k 2^k 2k

想继续学习请看后续:博弈论详解 2(SG函数——对于一切公平博弈游戏通用的必胜条件)

题外话

此结论和证明都过于神奇且抽象,如果没看懂可以多研究一下,本人写文章的时候也差点绕进去了。

这篇关于博弈论详解 1(基本理论定义 和 Nim 游戏)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1109329

相关文章

Conda与Python venv虚拟环境的区别与使用方法详解

《Conda与Pythonvenv虚拟环境的区别与使用方法详解》随着Python社区的成长,虚拟环境的概念和技术也在不断发展,:本文主要介绍Conda与Pythonvenv虚拟环境的区别与使用... 目录前言一、Conda 与 python venv 的核心区别1. Conda 的特点2. Python v

Spring Boot中WebSocket常用使用方法详解

《SpringBoot中WebSocket常用使用方法详解》本文从WebSocket的基础概念出发,详细介绍了SpringBoot集成WebSocket的步骤,并重点讲解了常用的使用方法,包括简单消... 目录一、WebSocket基础概念1.1 什么是WebSocket1.2 WebSocket与HTTP

java中反射Reflection的4个作用详解

《java中反射Reflection的4个作用详解》反射Reflection是Java等编程语言中的一个重要特性,它允许程序在运行时进行自我检查和对内部成员(如字段、方法、类等)的操作,本文将详细介绍... 目录作用1、在运行时判断任意一个对象所属的类作用2、在运行时构造任意一个类的对象作用3、在运行时判断

MySQL 中的 CAST 函数详解及常见用法

《MySQL中的CAST函数详解及常见用法》CAST函数是MySQL中用于数据类型转换的重要函数,它允许你将一个值从一种数据类型转换为另一种数据类型,本文给大家介绍MySQL中的CAST... 目录mysql 中的 CAST 函数详解一、基本语法二、支持的数据类型三、常见用法示例1. 字符串转数字2. 数字

SpringBoot中SM2公钥加密、私钥解密的实现示例详解

《SpringBoot中SM2公钥加密、私钥解密的实现示例详解》本文介绍了如何在SpringBoot项目中实现SM2公钥加密和私钥解密的功能,通过使用Hutool库和BouncyCastle依赖,简化... 目录一、前言1、加密信息(示例)2、加密结果(示例)二、实现代码1、yml文件配置2、创建SM2工具

MyBatis-Plus 中 nested() 与 and() 方法详解(最佳实践场景)

《MyBatis-Plus中nested()与and()方法详解(最佳实践场景)》在MyBatis-Plus的条件构造器中,nested()和and()都是用于构建复杂查询条件的关键方法,但... 目录MyBATis-Plus 中nested()与and()方法详解一、核心区别对比二、方法详解1.and()

Spring IoC 容器的使用详解(最新整理)

《SpringIoC容器的使用详解(最新整理)》文章介绍了Spring框架中的应用分层思想与IoC容器原理,通过分层解耦业务逻辑、数据访问等模块,IoC容器利用@Component注解管理Bean... 目录1. 应用分层2. IoC 的介绍3. IoC 容器的使用3.1. bean 的存储3.2. 方法注

MySQL 删除数据详解(最新整理)

《MySQL删除数据详解(最新整理)》:本文主要介绍MySQL删除数据的相关知识,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、前言二、mysql 中的三种删除方式1.DELETE语句✅ 基本语法: 示例:2.TRUNCATE语句✅ 基本语

Python内置函数之classmethod函数使用详解

《Python内置函数之classmethod函数使用详解》:本文主要介绍Python内置函数之classmethod函数使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录1. 类方法定义与基本语法2. 类方法 vs 实例方法 vs 静态方法3. 核心特性与用法(1编程客

Python函数作用域示例详解

《Python函数作用域示例详解》本文介绍了Python中的LEGB作用域规则,详细解析了变量查找的四个层级,通过具体代码示例,展示了各层级的变量访问规则和特性,对python函数作用域相关知识感兴趣... 目录一、LEGB 规则二、作用域实例2.1 局部作用域(Local)2.2 闭包作用域(Enclos