些时间就可以更好地分配到前面的步骤中去,每人多半小时思考。
至于第二天具体李世石走到多少步之后彻底双放手交给阿尔法go,李世石准备吃完饭稍微和阿尔法狗试几个150手左右的中盘残局从他本人历史上和对手下的比较胶着的棋局中挑来试试看阿尔法go的水准。
“另外,阿尔法go在布局阶段也谈不上什么能力,只能是给你一些参考定式,你看了之后挑出其中最好的一个结果就行我们只能保证,最好的结果肯定在那个八屏选项之内,但是具体是哪一个,阿尔法go判断不出。”
“阿尔法go也有做价值判断网络这个工具,到时候在给出机器意见之后,会在屏幕上打出一个判断,告诉你这一步是绝对不可能有更好的解法了,还是机器也不知道谁最好,只是没时间想暂时觉得这个最好。所以那些机器肯拍胸脯告诉你这就是最佳答案的步骤,你也可以省掉一些思考时间。”
李世石听到这儿,停下了筷子,亲口向黄教授确认了这玩意儿的运作法则。
黄教授也不藏私,坦荡地告诉他:阿尔法go里面其实是有两套走子算法的,第一套是绝对穷尽最佳可能性的算法,但是耗时非常巨大。哪怕以如今谷歌的云端服务器群和积累的棋局大数据