本文主要是介绍DRL应用实战(一)——开发德州扑克RL智能体【附代码】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1 pettingzoo德州扑克-无限制版 游戏规则

观测空间:一个54维的向量,每一维取值为0或1,1表示出现,0表示没出现。
| 索引 | 含义 | 取值 |
|---|---|---|
| 0~12 | 黑桃A~K | [0,1] |
| 13~25 | 红心A~K | [0,1] |
| 26~38 | 方块A~K | [0,1] |
| 39~51 | 梅花A~K | [0,1] |
| 52 | 玩家1下注的总筹码 | 1~100 |
| 53 | 玩家2下注的总筹码 | 1~100 |
动作空间:一个6维的向量,每一维取值为0或1,1表示选择该动作。
| 动作ID | 动作 |
|---|---|
| 0 | Fold / 弃牌 |
| 1 | Check / 让牌 / 过牌 |
| 2 | Call / 跟注 |
| 3 | Raise Half Pot / 加注和奖金池的一半等值的筹码 |
| 4 |
这篇关于DRL应用实战(一)——开发德州扑克RL智能体【附代码】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!