围棋吧 关注:339,024贴子:10,268,632
  • 1回复贴,共1

我来科普一下这条狗打劫水平的问题吧

只看楼主收藏回复

首先,fh的第4,5局中有打劫。
其次,我从原理上分析下狗打劫的问题。先讲一讲这条狗的设计。个人理解,如有不对请指出。
第一步:把人类棋谱的三千万个局面,输入狗脑,做初始化,直到狗脑能对人类在某个局面的下一步棋,做出60%准确率的预测。也就是说,随便拿出一个局面,狗脑选出a,b,c,d....点。人类棋手在实际对局中有60%的可能下一步落子在这些点里面。类似于我们在杂志上做题目,题目给你A,B,C,D,E。要你选一个正解。
第二步:做模拟对局,蒙特卡罗模拟到终局,对初始化训练后的“a,b,c,d....”点进行再赋值,选出胜率最高的点。好了,仅这两个步骤,我们来看下所需要的计算资源。纯蒙特卡罗:361*360*359.....................狗: 20*20*20*20*20................如果要打个比方的话,计算量从宇宙级下降到地球级。
另外,狗加入了决策树,也就是所谓的形势判断。这个形势判断大致是第二步模拟后的成果,例如某个局面,模拟的结果为黑棋不利,假设胜率低于20%,纳入库中,作为未来的决策依据。这样就更加指数级降低了运算量。(类似于人类的公认此局面黑棋不利)
下面,我们来看下打劫。以第一局为例,所有略具水平的人类都能看出终局前左下角白棋有个连环劫做活的手段。电脑为什么不下?要知道,人类是把这个连环劫作为一个局部看待得出结论的。而狗是做全局模拟的,而全局模拟,每一步都有提连环劫的选择,那么复杂度指数级上升,而复杂度的上升导致胜率评估的下降,而这条哈巴狗的逻辑是有90%的可能赢一目,绝不选择75%的可能赢10目。所以。。。。。
而普通劫争呢?同样,每一步模拟中都包含提劫的选择,所以模拟的计算量将上升,如果狗觉得自己优势,不会挑劫,因为胜率将下降。而如果狗觉得自己劣势,将很有可能主动挑劫,使对手胜率下降。
别自欺欺人了,这条哈巴狗根本不会为劫争单独写个程序,以前的zen,crazystone之流打劫能力差是没有加入选点机制和判断机制,以哈巴狗展现出来的价值判断和选点,会怕打劫?呵呵。
同样,你们认为狗在某个局部下的不好,其实狗计算出全局的胜率并无甚影响或更高,起码99%的情况下如此。而如果想见识他局部最强,只需要把赋值规则稍作调整,比如如果胜率达到60%以上的所有选点,以赢的最多的选点为高权重点,则马上可以见识到哈巴狗变疯狗。你说你觉得哈巴狗下的不好,是因为你没有逼它展现真正面目的实力,是不是很打击人?你说这个没发挥好,那个下的臭,别忘了,精神也是人类实力不可分割的一部分,否则韩国流根本到不了那个地位。你说你的实力有100%,可惜你一生都下不出一盘90%的棋,你说你实力有多少?何况面对一个永远100%的对手,你能发挥60%吗?说的残酷点,二子之差就是现实。每一个懂棋的人,做梦都想见识神之一手,放下可怜的自尊心吧,狗比人类更接近棋神。


IP属地:湖南1楼2016-03-10 20:11回复
    我只想祈求 人定胜天


    来自iPhone客户端2楼2016-03-10 22:20
    回复