如何利用人工智能围棋训练
A. 怎样用ai进行围棋训练
今年对围棋来说是载入史册的一年。一月阿法狗初露端倪,毁誉参半。三月震惊世界,一战惊天人。面对三千年未有之大变局,逃避是没有丝毫益处的。我们能做的只是努力了解新科技,并且努力使自己适应这些变化。
笔者从小跟父亲学习下围棋。至今笔者仍然记得自己是怎样被带入这个坑的。当年年过三十并且依然中二的父亲跟我说:“我觉得你学习是学不出来的(我去年买了个表,你哪只眼睛看出来我学不出来?是不是亲生的?)。想想能不能走别的路吧,我觉得你可以努力当运动员(纳尼?)。我查了一下,奖金最高的是三个项目(奖金!奖金!)。第一个太贵了,咱们学不了(是啥?),是网球。教练场地咱都花不起那个钱。第二个你也学不了(还有我学不了的?),是拳击(。。。。。。。。。。。。。。。。。。。)。第三个就是围棋,你就学这个吧(好吧我就学围棋吧。等等,好像哪里不对。那时候没有网,你从哪查到的奖金排名?套路,都是套路)。”
从那以后就开始学着下,自己看书,看CCTV5的纹枰论道,看一些挂盘讲解。开始提高的还比较快,很快父亲就下不过我了。可是到了一定程度,就怎么也提高不了了。看死活题的书,要么就是太容易没价值,要么就是太难,看得一头雾水。书上没有的参考图,自己心中仍然也有很多疑问。布局,作战方向上没有老师的指导,终究是很难有突破的。终于到后来就放弃了围棋,还是老老实实读书去了。现在想来,如果小时候就有阿法狗给我玩,就算达不到职业水平,也不会仅仅是今天这个水平吧。
小学的时候偶然间接触到了一个围棋游戏,从那时开始关注计算机围棋,距今已有十几年了。玩过的有名的对战程序有GNU Go,银星围棋,Crazy Stone和Zen。解死活题的程序有横滨死活题。特别是Zen,从Zen4玩到Zen6,亲眼目睹了程序的成长,同时在利用围棋程序更高效地提高自身水平方面,有一些自己的心得。本文主要目的是针对想努力提高自身围棋水平的业余爱好者,谈一谈怎样利用世界中的“他者”,更好地为自己服务。
Zen6
Zen6是日本工程师开发的计算机对战软件。在比较好的个人电脑上运行可以达到弈城8段甚至9段的水平。可以说除了阿法狗之外,目前就数Zen6最强。
虽然Zen6没有阿法狗强,但是对于一般的爱好者来说,Zen6比阿法狗更合适。首先,他们用的算法相似,都是神经网络加蒙特卡洛树搜索。其次,成本上来说阿法狗一般人根本玩不起,Zen6相当亲民。最后,阿法狗太强了,对于一般业余爱好者来说,Zen6的实力更适合一些。
B. 人工智能是如何挑战下法无穷的围棋的
你可以想象一下一个很便宜的计算器是如何运算大数字的。对于机器那些全不在话下。
所以人工智能很强。所谓下法无穷的围棋的抵挡不住的。
C. 如何看待人工智能alphago战胜围棋九段高手李世石
“人工智能”一词最初是在1956 年Dartmouth学会上提出的。从那以后,研究者们发展了众多理论和原理,人工智能的概念也随之扩展。人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。
人工智能是对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。
D. 什么样的人工智能击败了职业围棋手
由谷歌英国研究团队开发的计算机系统在围棋比赛中击败了职业棋手。作为一种古老的东方棋类游戏,围棋强调策略和直觉。过去数十年,围棋一直是人工智能专家未能攻克的堡垒。然而,人工智能正在这一领域取得重要突破。
此前,计算机已在其他多种比赛,例如国际象棋、奥赛罗棋和智力竞赛《危险边缘》中胜过了人类对手。然而,围棋是一种具有2500多年历史的古老技艺,其复杂程度远超国际象棋,因此人类高手此前几乎不费吹灰之力就能胜过即使最强的计算机系统。本月早些时候,谷歌以外的人工智能专家已提出这样的问题,即人工智能在围棋领域的突破能否迅速实现。而直到去年,大部分人仍认为,计算机击败职业棋手还需要10年时间。
然而,谷歌已经做到了这一点。法国研究者雷米·库洛姆(Remi Coulom)此前曾开发了全球最强大的人工智能围棋程序。他表示:“这一天的到来比我想象中更快。”
谷歌于2014年收购了自称为“人工智能领域阿波罗项目”的DeepMind。去年10月,DeepMind的研究团队在伦敦办公室里主持了人工智能与人类选手的较量。DeepMind的这一系统名为AlphaGo,而它的对手是欧洲围棋冠军樊麾。在《自然》杂志编辑和英国围棋协会裁判的监督下,AlphaGo在五番棋比赛中取得了5:0的压倒性胜利。《自然》杂志编辑坦古伊·乔阿德(Tanguy Chouard)博士在本周二的媒体电话会议上表示:“无论作为研究者还是编辑,这都是我职业生涯中最令人兴奋的时刻之一。
自然》杂志发表的一篇论文介绍了DeepMind的系统。这一系统利用了多种技术,其中也包括越来越重要的一种人工智能技术,即深度学习。利用海量的人类高手棋谱(总步数约达3000万),DeepMind的研究团队训练AlphaGo自主学习围棋。然而这仅仅只是第一步。从理论上来说,这样的训练最多只能培养出与最优秀人类选手同等棋力的人工智能。而为了击败最优秀的人类选手,研究团队使这一系统自己与自己对弈。这带来了新的数据,而这些数据可被用于训练新的人工智能系统,最终胜过顶尖高手。
DeepMind负责人德米斯·哈萨比斯(Demis Hassabis)表示:“最重要的一点在于,AlphaGo不仅仅是专家系统,遵循人为设定的规则。实际上,这使用了通用的机器学习技术,能自行探索如何在围棋比赛中取胜。”
人工智能的这次胜利并不新鲜。谷歌、Facebook和微软等互联网服务早已利用深度学习技术去识别照片和语音,或是理解自然语言。DeepMind的技术结合了深度学习、增强学习,以及其他方法。关于现实世界机器人如何学习日常任务,并对周围环境做出响应,这指明了未来的方向。哈萨比斯表示:“这非常适合机器人。”
他同时认为,这些方法能加速科学研究,通过在工作中引入人工智能系统,科学家将可以取得更多成果。“这一系统能处理规模更大的数据集,分析得出结构化信息并提供给人类专家,从而提高效率。系统甚至能向人类专家提供方式方法的建议,协助带来突破。”
不过目前,围棋仍是他的关注重点。在关起门来击败一名职业选手之后,哈萨比斯及其团队将目标瞄准了全球顶尖的围棋选手。3月中旬,AlphaGo将在韩国公开挑战李世石。李世石拥有的国际比赛冠军头衔数排名第二,而过去10年中,李世石有着最高的胜率。哈萨比斯认为,李世石就是“围棋界的费德勒”。
比国际象棋更难
2014年初,库洛姆的围棋软件Crazystone在日本的巡回赛中挑战了依田纪基九段,并取得了胜利。不过,这一胜利的成色不足:Crazystone获得了四子的让先。当时,库洛姆预言,在没有让先的情况下,人工智能击败顶尖围棋高手还需要10年时间。
这一挑战的难度在于围棋本身。此前,在合理时间内,任何超级计算机都没有足够的处理能力,去预判每种可能的着法会带来什么样的后续结果。1997年,IBM“深蓝”击败了国际象棋大师卡斯帕罗夫,当时这台超级计算机采用了“暴力计算”的方式。从本质上来看,“深蓝”分析了每一步走法可能出现的各种结果。然而,这样做在围棋比赛中行不通。在国际象棋比赛中,一个回合可能的走法平均为35种。而围棋比赛采用了19x19的棋盘,平均每回合走法有250种。哈萨比斯指出,围棋棋盘上的棋型类型要比宇宙中的原子总数还要多。
利用名为“蒙特卡洛树搜索”的方法,类似Crazystone的系统能完成更多步的预判。而结合其他一些技术,计算机可以完成对多种可能性的必要分析。这样的计算机能击败一些不错的围棋选手,但距离顶尖高手还有很大差距。对真正的高手来说,直觉是很重要的一部分。这些棋手会根据棋盘上棋型来选择如何行动,而不是精确分析每一种着法可能会带来的结果。哈萨比斯本人也是围棋选手,他表示:“良好的棋型看起来就很漂亮。这似乎遵循某种美学。这也是这一游戏数千年来历久不衰的原因。”
不过,在进入2015年之后,一些人工智能专家,包括爱丁堡大学、Facebook和DeepMind的研究人员,开始探索利用深度学习技术去解决围棋的难题。他们设想,深度学习技术能模拟围棋比赛中必要的人类直觉。哈萨比斯表示:“围棋有着许多暗示,模式匹配很重要。深度学习可以做得很好。”
自我增强
深度学习的基础是神经网络。这种由软硬件构成的网络能模拟人脑中的神经元,其运转并非依靠“暴力计算”和人工制定的规则。神经网络会分析大量数据,以从事某项任务的“学习”。例如,如果向神经网络输入足够多的袋熊照片,那么它就能识别出袋熊。如果向神经网络输入足够多的单词发音,那么它就能识别你的语音。如果向神经网络输入足够多的围棋棋谱,那么它就能学会如何下围棋。
在DeepMind、爱丁堡大学和Facebook,研究人员希望,通过“观察”棋盘棋型,神经网络能掌握下围棋的方法。正如Facebook近期在一篇论文中所说,这一技术的运行情况良好。通过深度学习和蒙特卡洛树方法的结合,Facebook的系统已经击败了一些人类选手。
不过,DeepMind在此基础上更进一步。在学习了3000万步人类选手的围棋下法之后,这一神经网络预测人类选手下一步走法的准确率达到57%,远高于之前的44%。随后,哈萨比斯及其团队对这一神经网络进行了小幅调整,使其与自己对弈,这种做法被称作增强学习。在这一过程中,神经网络可以了解,什么样的走法能带来最好的结果。
DeepMind研究员大卫·希维尔(David Silver)表示:“通过在神经网络之间进行数百万局的对弈,AlphaGo学会自己发现新策略,并逐步改进。”
希维尔表示,这使得AlphaGo能胜过其他围棋软件,包括Crazystone。随后,研究人员将结果输入至另一个神经网络。在首先判断对手的下一步行动之后,这一神经网络能利用同样的技巧去预判每一步的结果。这与“深蓝”等较老的系统类似,而不同之处在于AlphaGo能在过程中进行学习,并分析更多数据,不再使用暴力计算的方法去判断所有可能的结果。通过这种方式,AlphaGo不仅能胜过当前的人工智能系统,还能击败人类高手。
专用芯片
与大部分先进的神经网络类似,DeepMind的系统运行在基于GPU(图形处理芯片)的计算机上。GPU最初的设计目的是游戏和其他图像应用的图形渲染,但近年来研究表明,这类芯片也非常适合深度学习技术。哈萨比斯表示,DeepMind的系统在配备多个GPU芯片的单台计算机上有着相当好的表现,但为了挑战樊麾,研究人员搭建了更庞大的计算机网络,其中包括170块GPU卡和1200个标准CPU处理器。这一庞大的计算机网络对AlphaGo进行了训练,并参与了比赛。
哈萨比斯表示,在与李世石的比赛中,AlphaGo将采用同样的硬件配置。目前,他们正在持续改进这一人工智能系统。为了准备与李世石的比赛,他们还需要互联网连接。哈萨比斯表示:“我们正在安装自己的光缆。”
库洛姆和其他一些专家指出,与李世石的比赛将更困难。不过,库洛姆已经下注DeepMind。过去10年中,他一直希望开发出能胜过顶尖围棋高手的系统,他认为,这一系统现在就在这里。他表示:“我正在购买一些GPU。”
未来之路
AlphaGo的重要性不言而喻。这一技术不仅可以应用于机器人和科学研究,也适合其他许多任务,例如类似Siri的移动语音助手以及金融投资决策。深度学习创业公司Skymind创始人克里斯·尼克尔森(Chris Nicholson)表示:“你可以将其用于任何具有对抗性的问题,例如需要用到策略的各种比赛,以及战争和商业交易。”
对一些人来说,这种情况令人担忧,尤其考虑到DeepMind的系统已经有能力自学围棋。AlphaGo的学习素材并不来自人类,而是可以通过自行生成数据来自我指导。近几个月,特斯拉创始人伊隆·马斯克(Elon Musk)等知名人士曾表示,这样的人工智能系统最终将超越人类智力,突破人类的控制。
不过,DeepMind的系统受到了哈萨比斯及其团队的严格控制。AlphaGo被用于最复杂的棋类游戏,但这仍只是一款游戏。实际上,AlphaGo距离真正的人类智慧还有遥远的距离,远远没有达到超级智能的水平。
华盛顿大学专注于人工智能的法学教授、科技政策实验室创始人瑞安·卡洛(Ryan Calo)表示:“这仍是一种高度结构化的情况,并非真正人类水平的理解力。”不过,AlphaGo指明了未来的方向。如果DeepMind的人工智能系统能理解围棋,那么就能理解更多信息。卡洛表示:“宇宙只不过是一场更大的围棋游戏。”
E. 如何训练自已的围棋ai
围棋吧不是有丽拉吗,可以训练一下那个啊。去了解 一下情况吧。
F. 究竟谁搞定了围棋人工智能
好多种
但Google应该是最牛的
Google日前宣布其程序AlphaGo击败了欧洲围棋职业选手,这意味着人工智能技术又或得了极大的突破。计算机目前已经在许多智力游戏比赛上战胜了人类顶级选手,包括国际象棋、五子棋、黑白棋、拼字游戏等等。而对于有着2500年历史的东方游戏围棋——比国际象棋要复杂得多——人类始终能够保持在和计算机对决中的胜利。不过,Google人工智能专家表示, 这个壁垒或许很快将要被打破。随着AlphaGo在没有任何让子的情况下以5:0完胜法国围棋职业二段棋手樊麾,AlphaGo将在三月份对战韩国九段棋手李世乭。今天早上,《自然》杂志发表了一篇Google DeepMind团队——程序AlphaGo的创造者撰写的关于深度学习系统的论文。根据论文描述,在AlphaGo中,DeepMind研究员在程序中录入了大量职业棋手的棋谱——加起来多达3000万步——他们用增强学习的方法训练AI,让它自己下棋,研习棋谱。不过这只是第一步。理论上,这样的训练只能让这个人工智能系统无法突破人类的计算。为了获得更好的成绩,研究员随后让系统进行自我博弈,计算出比基础棋谱更多新的打点。也就是说,战胜人类就要靠这些新的东西。
“这其中最重要的是,AlphaGo不仅记录着大量的棋谱,还有一系列规则来指导 思考 ,”DeepMind CEO Demis Hassabis说道,“事实上,该程序能够通过机器学习的方式掌握比赛技巧。”
DeepMind的技术核心结合了“强化学习”及其他人工智能手段,这种技术能够用于解决现实机器人执行物理任务和对环境作出回应的技术问题。就是说,要让机器人变得更“自然”。
G. 如何看待人工智能围棋大战
表面看是人工智能发展程度的一种测试,而如果是AI互相比赛就没有什么意义了,因为围棋的一种根本属性是艺术性,并不是竞技性,竞技性只是商业化的外化表现。如果人类可以学习它的下法和思路还是对提高人类自身水平和改变思维固有定式很有好处,但这需要深层次的学习电脑的思维方式和计算方式。