人机对战:不断革新的AlphaGo ——深度学习
人机对战:不断革新的AlphaGo
AlphaGo是一款由谷歌旗下DeepMind公司研发的围棋人工智能程序。这个名字第一次见诸报端还是去年初,它在没有让子的前提下5-0击败欧洲冠军樊麾。但彼时AlphaGo也仅被视为诸多棋类AI中的一个,尚无今日的影响力。
直到去年三月,在业内普遍乐观的情况下,世界冠军头衔上双的韩国棋手李世石却被AlphaGo在五番棋中以4-1击败,“人机大战” 引发了关于围棋与人工智能的新思考与新讨论。
1
|
赛前圈内之所以压倒性看好李世石,是基于AlphaGo与樊麾的对局,高段棋手普遍认为AlphaGo的实力尚不足以挑战韩国天王,水平大概处于业余六至七段之间。但短短不到三个月,AlphaGo就完成了从业余六段到超职业九段的跨越。
相比其他围棋AI而言,AlphaGo拥有如此之快的进步速度,这与它“深度学习”的特性密不可分。新版的AlphaGo会产生大量自我对弈棋局,为下一代AI提供训练数据,更新的版本随之而生,此过程循环往复。这意味着,AlphaGo无时无刻不在进步。
“销声匿迹”大半年后,化名“Master”的AlphaGo于去年底重出江湖,它连挫中、日、韩三国顶尖围棋好手,豪取60胜却难求一败。
在结束了Master的测试后,DeepMind团队于今年1月下旬宣布推出新版AlphaGo。与前作相比,新版AlphaGo在继续深耕“深度学习”的基础上,摒弃了人类棋谱,这意味着AlphaGo可弈出更贴合人工智能的围棋。
与柯洁对弈的将是怎样一个AlphaGo,谷歌方面并没有在10日的发布会上披露太多升级细节。但谷歌大中华区总裁石博盟表示,即将亮相乌镇的是AlphaGo的最新版本,优于与李世石对抗之时。
新模式:顶尖棋手合力“围剿”
此番柯洁将与AlphaGo对战三番棋,比赛采用中国规则,每方用时为三小时,保留5次1分钟读秒。除番棋对决外,今次还将举办两场形式不同的交流比赛,即配对赛与团体赛。
团体赛中,时越、芈昱廷、唐韦星、陈耀烨、周睿羊五位世界冠军将组成豪华阵容携手出战,对抗AlphaGo。据悉五位世界冠军将建立“神经网络”,借此降低心理因素的影响,从而作出更加客观的判断。团体赛每方用时为2小时30分,少于柯洁与AlphaGo的三番战。