MCTS全称是蒙特卡洛树搜索,是一种通用的游戏对弈算法,它不需要知道游戏具体的领域知识,只需要知道胜负规则。
MCTS算法如下:
Selection采用UCT(Upper Confidence bounds applied to Trees)函数:
迭代20000次的效果(※是玩家,○是AI,玩家先手):
MCTS全称是蒙特卡洛树搜索,是一种通用的游戏对弈算法,它不需要知道游戏具体的领域知识,只需要知道胜负规则。
MCTS算法如下:
Selection采用UCT(Upper Confidence bounds applied to Trees)函数:
迭代20000次的效果(※是玩家,○是AI,玩家先手):