人工智能alphago学习算法叫什么？深度学习笔记深度学习

时间：2024-01-02 01:05:39/人气：449 ℃

阿尔法狗（AlphaGo）是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能程序。它主要的原理就是深度学习。

柯杰对战AlphaGo

围棋界公认AlphaGo的棋力已经超过人类职业围棋顶尖水平，AlphaGo的胜利是人工智能历史上的一座里程碑。

早在1997年，IBM的国际象棋系统深蓝，击败了世界冠军卡斯帕罗夫时，采用的算法是通过暴力搜索的方式尝试更多的下棋方法从而战胜人类，其所依赖的更多是计算机的计算资源优势。

卡斯帕罗夫对战深蓝

在围棋上，深蓝的方式完全不适用。为了战胜人类围棋选手，AlphaGo需要更加智能且强大的算法。深度学习为其提供了可能。

AlphaGo主要包括三个组成部分：

AlphaGo的一个大脑——策略网络，通过深度学习在当前给定棋盘条件下，预测下一步在哪里落子。通过大量对弈棋谱获取训练数据，该网络预测人类棋手下一步落子点的准确率可达57%以上（当年数据）并可以通过自己跟自己对弈的方式提高落子水平。

AlphaGo的另一个大脑——估值网络，判断在当前棋盘条件下黑子赢棋的概率。其使用的数据就是策略网络自己和自己对弈时产生的。

AlphaGo使用蒙特卡罗树算法，根据策略网络和估值网络对局势的评判结果来寻找最佳落子点。

基于以上深度学习的各种算法的有机结合，才让Alpha以悬殊的比分战胜人类选手。

人类选手压力山大

AlphaGo战胜人类世界冠军不是人际博弈的终点，相反，这只是一个开始，极大的促进了人工智能在当今社会的影响力。

有消息称，AlohaGo的开发团队又有了下一个目标，那就是大名鼎鼎的暴雪的星际争霸。结果如何，我们拭目以待。