CCF201803-4棋局评估,对抗搜索,极大极小算法
先说说极大极小算法,是指给可能出现的所有状态赋予一个评估值,两个玩家接下通过计算不同下棋策略对应不同的评估值,来决定如何下棋。对于井字棋游戏来说,它的博弈树(各种走法组合形成的树)如下:
MAX下X,MIN下O,直到到达了树的终止状态即一位棋手占领一行,一列、一对角线或所有方格都被填满。Utility指效用函数,定义游戏者在状态S下的数值。在这道题中,就是指:
– 对于Alice已经获胜的局面,评估得分为(棋盘上的空格子数+1);
- 对于Bob已经获胜的局面,评估得分为 -(棋盘上的空格子数+1);
- 对于平局的局面,评估得分为0;
所以,在5.1的策略树中,Alice(MAX)会选择最大的评估分对应的走法,Bob(MIN)会选择最小的评估分对应的走法。这样才能使自己尽快的赢得比赛。题目中只给出了策略树中叶子节点的评估分的计算方法(赢输或平局),那如何计算5.1的策略树中每个非叶子节点对应的评估分值呢?
答案是采用深度优先搜索对整个策略树进行后序遍历,这样,先计算策略树中叶子节点的评估值,在一层层的往上计算非叶子节点的评估值,最终,会得到整个策略树的评估值,这样就可以确定玩家在当前情况下应该如何走棋了。
根据以上思路:
#include <bits/stdc++.h> using namespace std; int q[10]; int checkok(){ int i1, i2, ok = 0; for(i1 = 1; i1 <= 3; i1++) { i2 = 3 * (i1 - 1); if ((q[i1] == q[i1 + 3])&&(q[i1 + 3] == q[i1 + 6]) && (q[i1] != 0)){ if(q[i1] == 1) ok = 1; else ok = 2; break; } if ((q[i2 + 1] == q[i2 + 2]) &&(q[i2 + 2] == q[i2 + 3]) && (q[i2 + 1] != 0)){ if(q[i2 + 1] == 1) ok = 1; else ok = 2; break; } } if( (!ok) && ((q[1] == q[5]) && (q[5] == q[9]) && (q[1] != 0)) ) if(q[1] == 1) ok = 1; else ok = 2; if( (!ok) && (q[3] == q[5]) && (q[5] == q[7]) && (q[3] != 0)) if(q[3] == 1) ok = 1; else ok = 2; i2 = 0; for(i1 = 1; i1 <= 9; i1++) if(q[i1] == 0) i2++; if(ok == 1) return (i2 + 1); else if(ok == 2) return -(i2 + 1); else if(i2 == 0) return 0; else return 100; } int dfs(int turn){ int value = checkok(); if(value != 100) return value; int i1,i2; if(turn == 1) i2 = -100; else i2 = 100; for(i1 = 1; i1 <= 9; i1++){ if(q[i1] != 0) continue; if(turn == 1){ q[i1] = 1; i2 = max(i2, dfs(0)); }else{ q[i1] = 2; i2 = min(i2, dfs(1)); } q[i1] = 0; } return i2; } int main() { //freopen("a.txt", "r", stdin); int T,i1,i2; scanf("%d", &T); while(T--) { for(i1 = 1; i1 <= 9; i1++){ scanf("%d", &i2); q[i1] = i2; } printf("%d\n", dfs(1)); } return 0; }
可以得到100分的答案。
还要说的是井字棋策略树下,可以完全遍历,直接使用极大极小算法,面对更复杂的棋时,还需要采用α-β剪枝等更高级的方法。
参考书籍:人工智能——一种现代方法。