当前位置:主页 > 国际 > 深度解读 > 正文
谷歌围棋:谁是下一个对手
来源:     作者:      2016-10-08 16:55       
摘要:在最优秀的人类棋手之一战败后,古老的围棋加入到不断增长的、证明电脑表现得比人类出色的任务清单中。一场在韩国首尔举行、据报道被全球1亿人观看的6天比赛中,由谷歌下属深度思维公司创建的电脑算法“阿尔法围棋”以4:1击败专业选手李世石。这种古老棋盘游戏的复杂性和直觉本质,使围棋成为人工智能(AI)面临的最大挑战之一。如今,最大的问题在于深度思维团队下一步将何去何从。



专业围棋选手李世石(中)在和谷歌的“阿尔法围棋”算法对弈中以1:4 战败。


图片来源:Kim Hong-Ji/TPX/REUTERS


在最优秀的人类棋手之一战败后,古老的围棋加入到不断增长的、证明电脑表现得比人类出色的任务清单中。一场在韩国首尔举行、据报道被全球1亿人观看的6天比赛中,由谷歌下属深度思维公司创建的电脑算法“阿尔法围棋”以4:1击败专业选手李世石。这种古老棋盘游戏的复杂性和直觉本质,使围棋成为人工智能(AI)面临的最大挑战之一。如今,最大的问题在于深度思维团队下一步将何去何从。


“阿尔法围棋”的通用方法(主要通过学习获得,少数元素专门为围棋定制)能被应用于涉及模式识别、决策制定和规划的问题。不过,这种方法也存在局限性。“这真的令人印象深刻,但与此同时,仍然存在很多挑战。”加拿大蒙特利尔大学计算机专家Yoshua Bengio表示。


曾预测将在此次谷歌比赛中获得压倒性胜利的李世石也为自己的失败感到震惊。去年10月,“阿尔法围棋”击败欧洲冠军范辉。不过,阿尔伯塔大学计算机专家Jonathan Schaeffer介绍说,在首尔获胜的程序版本要更加强大。“我预计它们会利用更多计算资源,并且实现更多学习,但仍未料到会有这种惊人的表现。”Schaeffer开发的奇努克语软件在2007年掌握了下国际跳棋的技能。


研究AI趋势的美国亚利桑那州立大学社会学家Miles Brundage表示,这种改进在很大程度上归结于这样一个事实,即“阿尔法围棋”下的次数越多,表现得就越好。“阿尔法围棋”利用的是一种被称为神经网络的脑启发架构——各层模拟神经元之间的连接会基于经验不断强化。它首先研究了来自人类游戏的3000万个棋谱,然后通过自己反复下围棋提高水平。这种技术被称为强化学习。随后,深度思维将“阿尔法围棋”识别成功棋盘布局的能力和一种能分析下一步棋的结果并利用其决定选择走哪一步的“预测搜索”结合起来。


下一步,深度思维会解决更多游戏。目前,选手往往能获得关于棋局所有信息的大多数棋类游戏都已被解决掉。不过,机器仍无法在很多选手参加的扑克游戏中战胜人类,也就是说,每个选手只能看到自己的牌。深度思维团队已表示出对解决科幻战略游戏“星际争霸”的兴趣。Schaeffer建议,深度思维可设计一种能从头开始学习玩不同类型游戏的程序。此类程序每年都在面向创建更加通用的AI类型的全局游戏策略国际竞赛中进行比拼。Schaeffer猜测,深度思维将在比赛中胜出。


与此同时,深度思维的创始人和首席执行官Demis Hassabis在上个月的一次会议中提到了这样一种可能性,即训练一个版本的“阿尔法围棋”仅利用自我对弈,忽视来自人类专家的知识。该公司在2015年创建了以这种方式玩没有那么复杂的大型电玩游戏的程序。Bengio表示,没有一个有利的开端,“阿尔法围棋”可能需要学习更长时间,并且或许永远不会打败最优秀的人类选手。不过,这是很重要的一步,因为人类就是在这么少的指导下学习的。


总部位于英国伦敦的深度思维还计划在游戏之外有所发展。今年2月,该公司创建“深度思维健康”,并和英国国家卫生署发起一项合作:它的算法最终能被应用于临床数据,以改善诊断或治疗计划。位于西雅图的非营利性机构——艾伦人工智能研究所首席执行官Oren Etzioni表示,此类应用面临的挑战和游戏完全不同。“关于游戏的普遍现象是你可以收集任意数量的数据。”他说,程序通过玩很多游戏,持续获得关于什么是好或坏的反馈。然而,在凌乱的现实世界中,关于罕见疾病的数据可能非常稀少。即便是普通疾病,为一项决策的结果贴上“好”或者“坏”的标签或许并没有那么简单。


深度思维的方法并非推进AI疆域的唯一办法。纽约大学神经学家Gary Marcus和别人共同成立了一家初创公司“几何智能”,以探索从少数例子中进行推断的学习技术。这受到了儿童如何学习的启发。在短暂的生命中,“阿尔法围棋”可能下了数十亿盘棋。这比仍在5局中赢了1局的李世石多太多。“或许,和电脑相比,人类是快很多的学习者。”(宗华)