AlphaGo挑战李世石结束,就明显感觉到这个热点关注度直线下降,一个围棋AI吸引了那么多目光,也是够了,功不可没。其实欧美对此事没有我们中日韩这么关注,也说明推广围棋依然任重道远。
我在最近十几天由于AlphaGo表现带来的刺激,各种脑力激荡,由此想到如何解决围棋公平贴目数的问题。
其实早已有人也想到了用计算机围棋技术来解决这个问题。作者首先在3月16日大战结束后提出一种设想 -- 建议修改围棋的胜负规则
作者关键观点如下:
围棋的贴目问题是这个集逻辑和计算与一身的顶级智力游戏的要命短板。贴目规则完全是经验性的,没有办法去证明并保证任何贴目规则的公平性,也无法知道在理论上还是在数值上是否有可能获得的公平的贴目数,虽然使用两个相同的计算机随机模拟可能值得一试。
后来作者在3月17日的另一篇博文补充说到 围棋的公平贴目数在实践上其实不存在
我在看到作者这个说法之前,已经通过思考得出自己的看法,其实我们并不要非常公平的贴目数,因为这样会严重破坏围棋对弈的趣味性。本文后面会展开我这一观点。
作者在 一文中为了解决公平问题,建议这样来修改比赛规则:
在此,我想出了这个建议来修复这个bug。我的建议很简单,就是彻底清除这种补偿规则。然后,每场比赛将包括两盘棋,或两个半场,每个棋手执黑一盘。比赛的最终比分将根据从两盘棋中获得的总子数计算。如果一名棋手中盘认输,那么整个棋盘子数将归属于另一方。两名棋手之间的竞赛可以有一个奇数倍的场数。
其实这种建议是可操作性是很低的,即便能这样操作,弊大于利。作者在文中也说:
该提议将在逻辑和数学上带来完全的公平,一个有益的副作用是新规则不鼓励中盘认输,尤其是在第一盘棋。因此,鼓励每一个棋手战斗到最后,无论情形如何落后。
我认为弊大于利,其实远不是上面的原因这么简单,因为这种规则同样会严重破坏围棋对弈的趣味性。我所指的趣味性包括职业棋手之间和业余爱好者之间的对弈趣味性,还有观看这些对弈的趣味性。
如果仅从可操作性来说,这种规则会严重损害举办方和赞助商的利益,其实最终也是影响围棋观众的利益。
作为30年棋龄的围棋爱好者,我深深地记得当年中日围棋擂台赛的直播。由于围棋比赛本身的特点,围棋比赛的直播和其他体育节目的直播是很不一样的,以往的比赛用时比较长,除了关键场次想要全程直播加解说是不太现实的。
围棋比赛时间长,第三届擂台赛刘小光对日本老将石井邦生,两人这局棋共耗时8小时36分,曾创下擂台赛用时最长纪录。实际上,这么多年来围棋比赛的发展,比赛用时是趋向缩短的,为的就是变得更适合电视直播。
作为电视直播方来说,需要比赛激烈紧凑,场外评说精彩,8个小时的直播和场外评说是难以想象的。作为狂热棋迷的我,也要反对广泛采用长时间的直播,注意我用了广泛二字,为了自身利益,我也是希望直播紧凑,可以吸引更多的人学会下围棋爱上下围棋。
如果按照作者的建议修改规则,我可以想象到比赛节奏变得更慢,增加了举办方的负担而并未增加比赛的趣味性。
围棋对弈和观看的趣味性来自什么呢?我不想一一列举,只想说胜负的不确定性是一个很重要的因素,这个不确定性受到很多因素的影响,棋手的实力、棋风、对弈者的状态、贴目数、执黑还是执白、场地、外界压力,甚至还有盘外招。正是这些,特别是让我们这些观看者总是充满了好奇、期待、猜测、分析,乐趣无穷。
如果有一天AlphaGo已经远远超越人类棋手,狗狗分先必胜的时候,我们看狗狗比赛恐怕就只能抱着学习的态度,但是趣味性大减。
棋手之间的对弈趣味性却不会因为AlphaGo的存在变得无趣,相反,我们总是会不断想办法让比赛变得更有趣味。即便是业余棋手之间的对弈,也有天弈围棋规则 这种尝试,在我看来,公平无需由精密的规则来保证,而这种尝试带来的趣味性倒是我所看重的。
为什么我认为我们并不要非常公平的贴目数呢?
比如说,李世石和古力有很长一段时间的对抗,只要他们两人之间对弈的次数够多,双方执黑执白的可能性总是趋向一致的,这就是公平,没有必要强调贴目是否绝对公平,也没有必要强调采用哪个国家的围棋规则,采用不同的规则其实也是带来了一些变化、不确定性和趣味。从这个角度看,就可以理解围棋规则的统一有利于在世界范围内推广,但是对于中日韩棋手来说并非最迫切需要的,动力不足。如果大家都觉得到了不统一规则将严重影响围棋影响力,最终影响到棋手的利益的时候,规则统一就容易办了。
作者在3月17日的另一篇博文围棋的公平贴目数在实践上其实不存在 提到
从日本贴目规则的发展历史来看,贴目数逐渐增加的过程也与围棋水平提高的进程相吻合。
我觉得没有任何证据说明贴目数的增加和围棋水平提高之间的关系。不过这不是博文的关键观点。作者在上面那句话后紧接着说:
这样看的话,公平的贴目数是随对弈棋手的水平而变化的,因此在数学上也就不存在一个唯一解,即未知公平贴目数X(d1,d2)是一个双方棋手水平例如段位的函数。
更进一步看,即便在数名水平相当的棋手之间,由于个人风格不同,他们两两之间的贴目数也都会有略微变化,X(d1,d2)进而要修改为X(p1,p2)是两名具体棋手的函数,即两名具体棋手要进行成千上万的棋局博弈,再对结果进行统计平均得到公平贴目数。换言之,在数学上公平贴目数是随任何两名具体棋手变化而变化的。......用一个简单而严谨的胜负规则取代目前含糊的贴目规则应该·不是什么坏事。
其实基于我自己的思考,作为爱好者而非研究人员,我已经没有太大兴趣研究公平的贴目数是否随对弈棋手的水平而变化,也没有兴趣研究在数学上公平贴目数是随任何两名具体棋手变化而变化的是否成立。因为,我的观点是,作为任何一个活跃的职业棋手,在充分参与各种比赛的情况下,例如ELO等级分制度已经得到大多数人的认可,相当公平,没有必要追求绝对的公平而破坏棋类比赛的趣味性,趣味性是生存发展的关键,不管是棋类、球类还是冒险。
无法知道在理论上还是在数值上是否有可能获得的公平的贴目数,虽然使用两个相同的计算机随机模拟可能值得一试。
其实对于作者第一篇博文中提到的上面这个看法,我认为数学理论上应该是可以证明能够获得公平贴目数的,采用计算机随机模拟,也就是蒙特卡洛方法应该是可以解决的,不用担心公平贴目数随着对弈棋手的水平而变化,因为我们应该可以证明随机模拟和AlphaGo无限接近神之一手都可以得出所谓的公平贴目数,只要两个计算机围棋AI的水平保证一致,并对弈次数足够多,至少在100万盘,这个数量对于蒙特卡洛方法来说轻而易举,并不耗费太长时间。
看到这里你想到3月14的π日了吗?如果你想到了,请记得我写下这个句子时弹指一笑 :) 谢谢你的耐心阅读
终,转载需联系本人
后记
各位有兴趣的可以想想围棋的贴目数如果为整数,就会经常有和局,对比赛来说是否好好处?
胜负虽然和贴目数有很大关系,不过其实同一个棋手在执黑和执白时的心态是不一样的,即便我们找出了公平贴目数,由此心态带来的影响是不可忽略的。如我,我是尤其喜欢白子,喜欢后发,也喜欢白色,总之,执白时我心里会比较舒畅。有些棋手据说也是擅长执白,或者擅长执黑。