博弈论详解 1(基本理论定义 和 Nim 游戏)

2024-08-26 18:20

本文主要是介绍博弈论详解 1(基本理论定义 和 Nim 游戏),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

公平博弈游戏

  1. 一般是两个玩家,轮流操作。
  2. 是否能够必胜只和当前局面相关,不与现在是轮到哪个玩家相关(说白了就是不分黑白棋子,格点也不分黑白,都一样)。
  3. 固定了开始状态后,可能的局面数是有限的。
  4. 游戏一定会在有限步内结束

怎么才能赢?

必胜局面与必败局面

我们定义当前的局面对于先手(指的是要对当前局面进行操作的人,下面对先手的定义也相同)是必胜的为 N N N 局面,必败为 P P P 局面。根据必胜与必败的定义,可知:

  1. 如果当前是 N N N 局面,那么操作者一定能够通过做某一种操作使得局面变成 P P P 局面,使对方(要对 P P P 局面操作的人)必败,自己也就必胜。简单说就是从 N N N 能走到 P P P
  2. 如果当前是 P P P 局面,那么操作者无论如何操作,总是会输,也就是说只能到达 N N N 局面,使对方必胜,自己必败(如果 P P P 能到 P P P,那么意味着操作者可以反败为胜,此局面是 N N N 局面,矛盾)。简单来说就是从 P P P 只能走到 N N N

什么样的局面是必胜的?

假设满足条件 C C C,局面就必胜,否则必败。根据上面的分析,容易发现:

  1. 满足 C C C 的局面一定能走到不满足 C C C 的局面。
  2. 不满足 C C C 的局面只能走到满足 C C C 的局面。

由于游戏结束时的局面是必败的(已经输了),所以再加上一条: 最终局面不满足 C C C
那么该怎么找到条件 C C C 呢?这很困难,一般都是引用先辈的结论。我们举一个简单的例子:Nim 游戏。

Nim游戏

游戏规则

n n n 堆石子,第 i i i 堆石子有 a i a_i ai 个,每次操作可以取走一堆石子中的任意数量的石子。如果轮到一方取石子的时候没有石子了,Ta 就输了。

必胜条件 C

C : a 1 ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n ≠ 0 C:a_1\oplus a_2\oplus a_3\oplus...\oplus a_n\ne0 C:a1a2a3...an=0 a 1 ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n a_1\oplus a_2\oplus a_3\oplus...\oplus a_n a1a2a3...an 也称为 Nim 和)
B u t But But W h y ? Why? Why?
首先,当 a 1 = a 2 = a 3 = . . . = a n = 0 a_1=a_2=a_3=...=a_n=0 a1=a2=a3=...=an=0 的时候,是最终局面,上述等式不成立,所以 C C C 要满足的第三个条件已经得证。
对异或的性质不是很了解的可以看一下本人之前写的一篇文章,主要结论:交换律,结合律和 x ⊕ y = z x\oplus y=z xy=z x ⊕ z = y x\oplus z=y xz=y

第一个条件:假设操作之后的石子数量变成 a 1 ′ , a 2 , a 3 . . . a n a_1',a_2,a_3...a_n a1,a2,a3...an,是 P 局面,则需满足 a 1 ′ ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n = 0 a_1'\oplus a_2\oplus a_3\oplus...\oplus a_n=0 a1a2a3...an=0,要证明 a 1 > a 1 ′ a_1>a_1' a1>a1
A = a 2 ⊕ a 3 ⊕ . . . ⊕ a n A=a_2\oplus a_3\oplus...\oplus a_n A=a2a3...an B = a 1 ⊕ a 2 ⊕ a 3 ⊕ . . . ⊕ a n B=a_1\oplus a_2\oplus a_3\oplus...\oplus a_n B=a1a2a3...an。因为 a 1 ′ ⊕ A = 0 a_1'\oplus A=0 a1A=0,所以 a 1 ′ = A a_1'=A a1=A;因为 a 1 ⊕ A = B a_1\oplus A=B a1A=B,所以 a 1 ′ = A = B ⊕ a 1 a_1'=A=B\oplus a_1 a1=A=Ba1
B B B 的二进制中最高的为 1 1 1 的位置是第 k k k 位(从低位到高位,最低位是第 0 0 0 位),不妨设 a 1 a_1 a1 的二进制中包含 2 k 2^k 2k(这 n n n 个数里必然有一个数包含 2 k 2^k 2k,否则 B B B 的第 k k k 位是 0 0 0)。因为两者的第 k k k 位都是 1 1 1,所以 B ⊕ a 1 B\oplus a_1 Ba1 的第 k k k 位是 0 0 0。但是 B B B 的更高位上没有 1 1 1 了,所以 B ⊕ a 1 < a 1 B\oplus a_1<a_1 Ba1<a1,即 a 1 ′ < a 1 a_1'<a_1 a1<a1,可以通过从 a 1 a_1 a1 中拿走一些石子实现转移。
你竟然看懂了第一个条件的证明!太厉害了,第二个条件会简单很多!

第二个条件:由于此时 Nim 和等于 0 0 0,假设你从第 i i i 堆拿走了 j j j 个石子,此时 Nim 和变为 ( a 1 ⊕ a 2 ⊕ . . . ⊕ a n ) ⊕ a i ⊕ ( a i − j ) (a_1\oplus a_2\oplus...\oplus a_n)\oplus a_i\oplus (a_i-j) (a1a2...an)ai(aij)(就是先把原本的 a i a_i ai 从 Nim 和中去掉,再异或上新的 a i a_i ai)。由于 j > 0 j>0 j>0,所以 a i − j ≠ a i a_i-j\ne a_i aij=ai a i ⊕ ( a i − j ) ≠ 0 a_i\oplus (a_i-j)\ne 0 ai(aij)=0,新的 Nim 和不等于 0 0 0,转移到 N 局面。

必胜操作

必胜操作也已经在第一个条件的证明中提到了,如果你必胜,那么就在 a 1 a_1 a1 中拿走 a 1 − ( a 1 ⊕ Nim和 ) a_1-(a_1\oplus \text{Nim和}) a1(a1Nim) 个石子( a 1 a_1 a1 是一堆石子,满足 a 1 a_1 a1 包含 Nim 和最高位的 1 1 1 所代表的值 2 k 2^k 2k

想继续学习请看后续:博弈论详解 2(SG函数——对于一切公平博弈游戏通用的必胜条件)

题外话

此结论和证明都过于神奇且抽象,如果没看懂可以多研究一下,本人写文章的时候也差点绕进去了。

这篇关于博弈论详解 1(基本理论定义 和 Nim 游戏)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1109329

相关文章

sky-take-out项目中Redis的使用示例详解

《sky-take-out项目中Redis的使用示例详解》SpringCache是Spring的缓存抽象层,通过注解简化缓存管理,支持Redis等提供者,适用于方法结果缓存、更新和删除操作,但无法实现... 目录Spring Cache主要特性核心注解1.@Cacheable2.@CachePut3.@Ca

SpringBoot请求参数传递与接收示例详解

《SpringBoot请求参数传递与接收示例详解》本文给大家介绍SpringBoot请求参数传递与接收示例详解,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋... 目录I. 基础参数传递i.查询参数(Query Parameters)ii.路径参数(Path Va

RabbitMQ 延时队列插件安装与使用示例详解(基于 Delayed Message Plugin)

《RabbitMQ延时队列插件安装与使用示例详解(基于DelayedMessagePlugin)》本文详解RabbitMQ通过安装rabbitmq_delayed_message_exchan... 目录 一、什么是 RabbitMQ 延时队列? 二、安装前准备✅ RabbitMQ 环境要求 三、安装延时队

从基础到高级详解Python数值格式化输出的完全指南

《从基础到高级详解Python数值格式化输出的完全指南》在数据分析、金融计算和科学报告领域,数值格式化是提升可读性和专业性的关键技术,本文将深入解析Python中数值格式化输出的相关方法,感兴趣的小伙... 目录引言:数值格式化的核心价值一、基础格式化方法1.1 三种核心格式化方式对比1.2 基础格式化示例

Python ORM神器之SQLAlchemy基本使用完全指南

《PythonORM神器之SQLAlchemy基本使用完全指南》SQLAlchemy是Python主流ORM框架,通过对象化方式简化数据库操作,支持多数据库,提供引擎、会话、模型等核心组件,实现事务... 目录一、什么是SQLAlchemy?二、安装SQLAlchemy三、核心概念1. Engine(引擎)

Java中的stream流分组示例详解

《Java中的stream流分组示例详解》Java8StreamAPI以函数式风格处理集合数据,支持分组、统计等操作,可按单/多字段分组,使用String、Map.Entry或Java16record... 目录什么是stream流1、根据某个字段分组2、按多个字段分组(组合分组)1、方法一:使用 Stri

Spring创建Bean的八种主要方式详解

《Spring创建Bean的八种主要方式详解》Spring(尤其是SpringBoot)提供了多种方式来让容器创建和管理Bean,@Component、@Configuration+@Bean、@En... 目录引言一、Spring 创建 Bean 的 8 种主要方式1. @Component 及其衍生注解

Python异步编程之await与asyncio基本用法详解

《Python异步编程之await与asyncio基本用法详解》在Python中,await和asyncio是异步编程的核心工具,用于高效处理I/O密集型任务(如网络请求、文件读写、数据库操作等),接... 目录一、核心概念二、使用场景三、基本用法1. 定义协程2. 运行协程3. 并发执行多个任务四、关键

从基础到进阶详解Python条件判断的实用指南

《从基础到进阶详解Python条件判断的实用指南》本文将通过15个实战案例,带你大家掌握条件判断的核心技巧,并从基础语法到高级应用一网打尽,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录​引言:条件判断为何如此重要一、基础语法:三行代码构建决策系统二、多条件分支:elif的魔法三、

Java利用@SneakyThrows注解提升异常处理效率详解

《Java利用@SneakyThrows注解提升异常处理效率详解》这篇文章将深度剖析@SneakyThrows的原理,用法,适用场景以及隐藏的陷阱,看看它如何让Java异常处理效率飙升50%,感兴趣的... 目录前言一、检查型异常的“诅咒”:为什么Java开发者讨厌它1.1 检查型异常的痛点1.2 为什么说