人机对战：不断革新的AlphaGo —

人机对战：不断革新的AlphaGo ——深度学习

GeJinZi 2021-08-31 原文

2017-04-23

2017年5月23日-27日，现等级分第一人、世界冠军柯洁九段将在浙江乌镇迎战谷歌人工智能AlphaGo，“人机大战Ⅱ”势必再掀围棋热潮。

　　人机对战：不断革新的AlphaGo

　　AlphaGo是一款由谷歌旗下DeepMind公司研发的围棋人工智能程序。这个名字第一次见诸报端还是去年初，它在没有让子的前提下5-0击败欧洲冠军樊麾。但彼时AlphaGo也仅被视为诸多棋类AI中的一个，尚无今日的影响力。

　　直到去年三月，在业内普遍乐观的情况下，世界冠军头衔上双的韩国棋手李世石却被AlphaGo在五番棋中以4-1击败，“人机大战” 引发了关于围棋与人工智能的新思考与新讨论。

李世石与AlphaGo的“人机大战”

　　赛前圈内之所以压倒性看好李世石，是基于AlphaGo与樊麾的对局，高段棋手普遍认为AlphaGo的实力尚不足以挑战韩国天王，水平大概处于业余六至七段之间。但短短不到三个月，AlphaGo就完成了从业余六段到超职业九段的跨越。

　　相比其他围棋AI而言，AlphaGo拥有如此之快的进步速度，这与它“深度学习”的特性密不可分。新版的AlphaGo会产生大量自我对弈棋局，为下一代AI提供训练数据，更新的版本随之而生，此过程循环往复。这意味着，AlphaGo无时无刻不在进步。

　　“销声匿迹”大半年后，化名“Master”的AlphaGo于去年底重出江湖，它连挫中、日、韩三国顶尖围棋好手，豪取60胜却难求一败。

　　在结束了Master的测试后，DeepMind团队于今年1月下旬宣布推出新版AlphaGo。与前作相比，新版AlphaGo在继续深耕“深度学习”的基础上，摒弃了人类棋谱，这意味着AlphaGo可弈出更贴合人工智能的围棋。

　　与柯洁对弈的将是怎样一个AlphaGo，谷歌方面并没有在10日的发布会上披露太多升级细节。但谷歌大中华区总裁石博盟表示，即将亮相乌镇的是AlphaGo的最新版本，优于与李世石对抗之时。

　　新模式：顶尖棋手合力“围剿”

　　此番柯洁将与AlphaGo对战三番棋，比赛采用中国规则，每方用时为三小时，保留5次1分钟读秒。除番棋对决外，今次还将举办两场形式不同的交流比赛，即配对赛与团体赛。

　　世界冠军古力将与连笑一道出战配对赛，两位棋手将与AlphaGo进行交叉组队。古力透露，人机配对此前并未有过练习，由于对局弈和的可能性较小，这也表示其中一方的AlphaGo会输。古力同时表示，如何理解AlphaGo的独特风格并与之合作，是两位参赛棋手将面临的最大挑战。

　　团体赛中，时越、芈昱廷、唐韦星、陈耀烨、周睿羊五位世界冠军将组成豪华阵容携手出战，对抗AlphaGo。据悉五位世界冠军将建立“神经网络”，借此降低心理因素的影响，从而作出更加客观的判断。团体赛每方用时为2小时30分，少于柯洁与AlphaGo的三番战。

　　的确，在去年年底Master的惊艳表现之后，业内就有声音认为，人机大战的结果其实已无悬念。回想过往约一年时间里，AlphaGo未能取胜的两盘棋：一是败于李世石的灵犀妙手，不过那时的AlphaGo与今时不可同日而语；二就是在与陈耀烨对局时，因断线而被判和棋。

本文链接：https://www.cnblogs.com/GeJinZi/p/6753046.html

人机对战：不断革新的AlphaGo ——深度学习的更多相关文章

yolov5实战之皮卡丘检测

前言从接触深度学习开始一直都做的是人脸识别，基本上也一直都在用mxnet. 记得之前在刚接触的时候看到博客中 […]...

万字长文，详解推荐系统领域经典模型FM因子分解机

在上一篇文章当中我们剖析了Facebook的著名论文GBDT+LR，虽然这篇paper在业内广受好评，但是毕竟 […]...

Faster RCNN 关键点总结

术语描述 RoI Region of Interest RPN Region Proposal Netw […]...

【深度学习系列】用PaddlePaddle和Tensorflow实现经典CNN网络Vgg

　　上周我们讲了经典CNN网络AlexNet对图像分类的效果，2014年，在AlexNet出来的两年后，牛津大 […]...

吴恩达《Machine Learning Yearning》总结（11-20章）

11.何时修改开发集、测试集和度量指标开展一个新项目，尽快选好开发集和测试集；例子，根据度量指标A分类器排在 […]...

李宏毅机器学习课程笔记-15.1无监督学习简介

目录聚类 K-means HAC 降维引入降维降维作用原理如何实现降维生成无监督学习(Unsupe […]...

深度学习

什么是深度识别？在实际应用中,例如对象分类问题如对象的分类(对象可是文档、图像、音频等),我们不得不面对的一 […]...

吴恩达深度学习笔记 course2 week1 作业3

Gradient Checking¶ Welcome to the final assignment for […]...

随机推荐

idea 设置格式化代码快捷键

...

简说设计模式——迭代器模式

一、什么是迭代器模式　　迭代器这个词在Java中出现过，即Java中使用Iterator迭代器对集合进行遍历 […]...

论逻辑思维和理解能力对程序员的重要性

我带开发团队，喜欢把手底下成员分为4种类型。 1、逻辑思维厉害且理解能力好的人 2、逻辑思维厉害但理解能力差的 […]...

【Solr】Solr的安装部署

目录 Solr安装部署 Solr Web界面分析回到顶部 solr安装和部署 solr下载 http:/ […]...

服务器托管和服务器租用的区别

服务器托管和服务器租用的区别 2019-09-11 14:34 asdfg2019 阅读(…) 评 […]...

逻辑回归算法介绍

//2019.08.13#逻辑回归算法(Logistic Regression)1、根据2017-2018年人 […]...

mysql中整数类型后面的数字，比如int(11)，11代表11个字节吗？

原先对mysql不太理解，但也没有报错。但理解的不够深入。这次补上。原来以为int(11)是指11个字节，i […]...

阿里巴巴开源故障注入工具_chaosblade

chaosblade是阿里巴巴最近开源的一款故障注入的工具，因为我最近在做公司的虚拟化平台的可靠性测试工具，无 […]...

人机对战：不断革新的AlphaGo ——深度学习

人机对战：不断革新的AlphaGo ——深度学习的更多相关文章

随机推荐

热门专题

目录导航