并且,如果造出来的智能下不过自己,这件事情属实没什么意思。
“你们目前的想法和策略大概是什么样的。”大概聊了一些情况之后,孟繁岐将话题切入了具体的算法部分。
从理论上来说,围棋问题的输入和孟繁岐非常擅长的图像类其实很像。
彩色图片在计算机中的形式就是多通道矩阵,通常为3通道,代表三原色。
比如,一张分辨率为224x224的图片,就是以三个[224, 224]矩阵的形式进行存储。
一般来说,每个位置的取值在0~255之间。
对于围棋这个情况来说,它的输入就像是一个19x19的单通道图片。
19x19表示棋盘上所有的落子地点,而每个地点的取值就只有三种状态,黑,白,无子。
可以用[-1,0,1]三个数字来指代。
而围棋智能的目标,所谓的下棋。
如果不考虑其中原理的话,它的外在反馈其实就是给定这样一个[19,19]的棋盘,希望程序可以在上面仅改变一个无子的数字0到给定的棋子类型(数字-1或者1),同时使得该方获胜的概率尽可能地变大。
“棋盘就是一副黑白的单