第180章围棋软件的工作原理（第2/2页）

1
2

可惜的是，学生们大部分对元霄都不感冒。

这就是收集傲世指数困难的地方。

看来只有等成品问世，对他们才能收割一波。

任务有坑啊。

柯杰兴趣很浓：“那么问题在于，如何筛选出这样的点。”

“所以，我们需要对算法进行加成。”元霄解释。

围棋棋盘上的一个点，可以用数值表示它的状态。

比如有白棋是1，有黑棋是-1，没有棋就是0。

这是最基础的。

如此一来，就可以对整个棋盘361个点，建立数学数值。

然后，程序就可以对这群数值进行反复的运算。

元霄画出一个概念图：“第一个我们需要的是，可以称为策略神经网络。”

策略神经网络的作用，是判断当前局势下，下一步棋下在哪里最合适。

元霄认为，这里的选点，可以参考人类棋手的棋谱。

模仿人类棋手的思考模式，快速将一些低概率的点淘汰掉。

柯杰叹了口气：“看来，到时候我还要提供目前为止所有人类的对局棋谱了。”

理论上而言，棋谱数量越多，策略神经网络的成熟度也越高。

“这一点，我们让计算机自主学习。”元霄指出其中的关键。

反复推演学习的结果，将会使策略神经网络更加强大，选点更为准确。

“而要做到这一步，还需要另外一个神经网络的结合。”元霄写下一个公式。

价值神经网络。

其作用是能够计算出，每个选点的胜率。

每一步都进行这样的估值判断，直到棋局的结束，得到最精准的胜率数值。

而同样，这东西也可以自己学习。

总结起来其实很简单。

就是模拟人类下棋的思维。

首先判断在哪些地方可以下，每个地方的胜率是多少。

然后对这些选点进行集中计算，推演出最后的结果。

每一步都这么执行。

那么得到的每一手，自然就是最佳的下法。

如果说一开始柯杰觉得元霄说的是天方夜谭。

到了现在，他感觉这东西并不是完全不可能实现的了。

他咽下口水：“如此一来的话，那不是一开始的时候，计算机就已经锁定了结果。”

必胜的结果。

傲世指数+8888

“这只是大概的概念，实际我们还需要一步步来，”元霄放下笔，“柯院长，到时候和围棋软件的对弈，还需要你来。”

柯杰表示责无旁贷。

苏辰逸、卓越、方旭尧几个都听懂了。

夏晚晴黎沐岚之流，当然是不知所云。

尤其是夏晚晴，她表示很鄙视。

花脑袋去开发这玩意有啥用。

老师也真是的，有时间和我一起不香么。

计算机的世界，果然蕴含宅的属性。

1
2