博弈论详解 1(基本理论定义 和 Nim 游戏)

2024-08-26 18:20

本文主要是介绍博弈论详解 1(基本理论定义 和 Nim 游戏),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

公平博弈游戏

  1. 一般是两个玩家,轮流操作。
  2. 是否能够必胜只和当前局面相关,不与现在是轮到哪个玩家相关(说白了就是不分黑白棋子,格点也不分黑白,都一样)。
  3. 固定了开始状态后,可能的局面数是有限的。
  4. 游戏一定会在有限步内结束

怎么才能赢?

必胜局面与必败局面

我们定义当前的局面对于先手(指的是要对当前局面进行操作的人,下面对先手的定义也相同)是必胜的为 N N N 局面,必败为 P P P 局面。根据必胜与必败的定义,可知:

  1. 如果当前是 N N N 局面,那么操作者一定能够通过做某一种操作使得局面变成 P P P 局面,使对方(要对 P P P 局面操作的人)必败,自己也就必胜。简单说就是从 N N N 能走到 P P P
  2. 如果当前是 P P P 局面,那么操作者无论如何操作,总是会输,也就是说只能到达 N N N 局面,使对方必胜,自己必败(如果 P P P 能到 P P P,那么意味着操作者可以反败为胜,此局面是 N N N 局面,矛盾)。简单来说就是从 P P P 只能走到 N N N

什么样的局面是必胜的?

假设满足条件 C C C,局面就必胜,否则必败。根据上面的分析,容易发现:

  1. 满足 C C C 的局面一定能走到不满足 C C C 的局面。
  2. 不满足 C C C 的局面只能走到满足 C C C 的局面。

由于游戏结束时的局面是必败的(已经输了),所以再加上一条: 最终局面不满足 C C C
那么该怎么找到条件 C C C 呢?这很困难,一般都是引用先辈的结论。我们举一个简单的例子:Nim 游戏。

Nim游戏

游戏规则

n n n 堆石子,第 i i i 堆石子有 a i a_i ai 个,每次操作可以取走一堆石子中的任意数量的石子。如果轮到一方取石子的时候没有石子了,Ta 就输了。

必胜条件 C

C : a 1 ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n ≠ 0 C:a_1\oplus a_2\oplus a_3\oplus...\oplus a_n\ne0 C:a1a2a3...an=0 a 1 ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n a_1\oplus a_2\oplus a_3\oplus...\oplus a_n a1a2a3...an 也称为 Nim 和)
B u t But But W h y ? Why? Why?
首先,当 a 1 = a 2 = a 3 = . . . = a n = 0 a_1=a_2=a_3=...=a_n=0 a1=a2=a3=...=an=0 的时候,是最终局面,上述等式不成立,所以 C C C 要满足的第三个条件已经得证。
对异或的性质不是很了解的可以看一下本人之前写的一篇文章,主要结论:交换律,结合律和 x ⊕ y = z x\oplus y=z xy=z x ⊕ z = y x\oplus z=y xz=y

第一个条件:假设操作之后的石子数量变成 a 1 ′ , a 2 , a 3 . . . a n a_1',a_2,a_3...a_n a1,a2,a3...an,是 P 局面,则需满足 a 1 ′ ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n = 0 a_1'\oplus a_2\oplus a_3\oplus...\oplus a_n=0 a1a2a3...an=0,要证明 a 1 > a 1 ′ a_1>a_1' a1>a1
A = a 2 ⊕ a 3 ⊕ . . . ⊕ a n A=a_2\oplus a_3\oplus...\oplus a_n A=a2a3...an B = a 1 ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n B=a_1\oplus a_2\oplus a_3\oplus...\oplus a_n B=a1a2a3...an。因为 a 1 ′ ⊕ A = 0 a_1'\oplus A=0 a1A=0,所以 a 1 ′ = A a_1'=A a1=A;因为 a 1 ⊕ A = B a_1\oplus A=B a1A=B,所以 a 1 ′ = A = B ⊕ a 1 a_1'=A=B\oplus a_1 a1=A=Ba1
B B B 的二进制中最高的为 1 1 1 的位置是第 k k k 位(从低位到高位,最低位是第 0 0 0 位),不妨设 a 1 a_1 a1 的二进制中包含 2 k 2^k 2k(这 n n n 个数里必然有一个数包含 2 k 2^k 2k,否则 B B B 的第 k k k 位是 0 0 0)。因为两者的第 k k k 位都是 1 1 1,所以 B ⊕ a 1 B\oplus a_1 Ba1 的第 k k k 位是 0 0 0。但是 B B B 的更高位上没有 1 1 1 了,所以 B ⊕ a 1 < a 1 B\oplus a_1<a_1 Ba1<a1,即 a 1 ′ < a 1 a_1'<a_1 a1<a1,可以通过从 a 1 a_1 a1 中拿走一些石子实现转移。
你竟然看懂了第一个条件的证明!太厉害了,第二个条件会简单很多!

第二个条件:由于此时 Nim 和等于 0 0 0,假设你从第 i i i 堆拿走了 j j j 个石子,此时 Nim 和变为 ( a 1 ⊕ a 2 ⊕ . . . ⊕ a n ) ⊕ a i ⊕ ( a i − j ) (a_1\oplus a_2\oplus...\oplus a_n)\oplus a_i\oplus (a_i-j) (a1a2...an)ai(aij)(就是先把原本的 a i a_i ai 从 Nim 和中去掉,再异或上新的 a i a_i ai)。由于 j > 0 j>0 j>0,所以 a i − j ≠ a i a_i-j\ne a_i aij=ai a i ⊕ ( a i − j ) ≠ 0 a_i\oplus (a_i-j)\ne 0 ai(aij)=0,新的 Nim 和不等于 0 0 0,转移到 N 局面。

必胜操作

必胜操作也已经在第一个条件的证明中提到了,如果你必胜,那么就在 a 1 a_1 a1 中拿走 a 1 − ( a 1 ⊕ Nim和 ) a_1-(a_1\oplus \text{Nim和}) a1(a1Nim) 个石子( a 1 a_1 a1 是一堆石子,满足 a 1 a_1 a1 包含 Nim 和最高位的 1 1 1 所代表的值 2 k 2^k 2k

想继续学习请看后续:博弈论详解 2(SG函数——对于一切公平博弈游戏通用的必胜条件)

题外话

此结论和证明都过于神奇且抽象,如果没看懂可以多研究一下,本人写文章的时候也差点绕进去了。

这篇关于博弈论详解 1(基本理论定义 和 Nim 游戏)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1109329

相关文章

Redis中6种缓存更新策略详解

《Redis中6种缓存更新策略详解》Redis作为一款高性能的内存数据库,已经成为缓存层的首选解决方案,然而,使用缓存时最大的挑战在于保证缓存数据与底层数据源的一致性,本文将介绍Redis中6种缓存更... 目录引言策略一:Cache-Aside(旁路缓存)策略工作原理代码示例优缺点分析适用场景策略二:Re

Python开发文字版随机事件游戏的项目实例

《Python开发文字版随机事件游戏的项目实例》随机事件游戏是一种通过生成不可预测的事件来增强游戏体验的类型,在这篇博文中,我们将使用Python开发一款文字版随机事件游戏,通过这个项目,读者不仅能够... 目录项目概述2.1 游戏概念2.2 游戏特色2.3 目标玩家群体技术选择与环境准备3.1 开发环境3

Java注解之超越Javadoc的元数据利器详解

《Java注解之超越Javadoc的元数据利器详解》本文将深入探讨Java注解的定义、类型、内置注解、自定义注解、保留策略、实际应用场景及最佳实践,无论是初学者还是资深开发者,都能通过本文了解如何利用... 目录什么是注解?注解的类型内置注编程解自定义注解注解的保留策略实际用例最佳实践总结在 Java 编程

MySQL数据库约束深入详解

《MySQL数据库约束深入详解》:本文主要介绍MySQL数据库约束,在MySQL数据库中,约束是用来限制进入表中的数据类型的一种技术,通过使用约束,可以确保数据的准确性、完整性和可靠性,需要的朋友... 目录一、数据库约束的概念二、约束类型三、NOT NULL 非空约束四、DEFAULT 默认值约束五、UN

Python使用Matplotlib绘制3D曲面图详解

《Python使用Matplotlib绘制3D曲面图详解》:本文主要介绍Python使用Matplotlib绘制3D曲面图,在Python中,使用Matplotlib库绘制3D曲面图可以通过mpl... 目录准备工作绘制简单的 3D 曲面图绘制 3D 曲面图添加线框和透明度控制图形视角Matplotlib

MySQL中的分组和多表连接详解

《MySQL中的分组和多表连接详解》:本文主要介绍MySQL中的分组和多表连接的相关操作,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友一起看看吧... 目录mysql中的分组和多表连接一、MySQL的分组(group javascriptby )二、多表连接(表连接会产生大量的数据垃圾)MySQL中的

Java 实用工具类Spring 的 AnnotationUtils详解

《Java实用工具类Spring的AnnotationUtils详解》Spring框架提供了一个强大的注解工具类org.springframework.core.annotation.Annot... 目录前言一、AnnotationUtils 的常用方法二、常见应用场景三、与 JDK 原生注解 API 的

redis中使用lua脚本的原理与基本使用详解

《redis中使用lua脚本的原理与基本使用详解》在Redis中使用Lua脚本可以实现原子性操作、减少网络开销以及提高执行效率,下面小编就来和大家详细介绍一下在redis中使用lua脚本的原理... 目录Redis 执行 Lua 脚本的原理基本使用方法使用EVAL命令执行 Lua 脚本使用EVALSHA命令

SpringBoot3.4配置校验新特性的用法详解

《SpringBoot3.4配置校验新特性的用法详解》SpringBoot3.4对配置校验支持进行了全面升级,这篇文章为大家详细介绍了一下它们的具体使用,文中的示例代码讲解详细,感兴趣的小伙伴可以参考... 目录基本用法示例定义配置类配置 application.yml注入使用嵌套对象与集合元素深度校验开发

Python中的Walrus运算符分析示例详解

《Python中的Walrus运算符分析示例详解》Python中的Walrus运算符(:=)是Python3.8引入的一个新特性,允许在表达式中同时赋值和返回值,它的核心作用是减少重复计算,提升代码简... 目录1. 在循环中避免重复计算2. 在条件判断中同时赋值变量3. 在列表推导式或字典推导式中简化逻辑