《人机博弈》摘录(七)估值核心

1、终点估值,end-point evaluation,以末端节点的估值为准。

2、棋子价值表算法,增量计算局面的评分,可提升估值速度。

3、博弈性能公式如下

Performance(性能)= Speed(速度)X Knowledge(知识)

选取合适的估值方法,保持速度和知识的平衡,对博弈性能尤为重要。

4、如何制定估值函数?

(1)手工调整,费时,低效。

(2)爬山法,Hill Climbing,每次微调参数,统计获胜几率,若提高,则继续向这个方向调整,否则则放弃这个调整方向。此方法较慢,不能保证找到最佳值。

(3)模拟退火,Simulated annealing,使用多种初始参数值在不同位置“爬山”,更慢,但提高了找到最优解的概率。

(4)遗传算法,Genetic algorithms,维护多组较好的参数,模仿生物遗传机制,通过交叉、变异和淘汰,减少局部震荡的干扰,更稳定。很大程度依赖实施者的经验。

(5)寻优算法非完全自动化,需要大量的人工干预。若要完全自动寻优,则涉及机器学习,属于人工智能范畴。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容