移动平台
`
2016/3/8 16:12
人机大战结果已出:李世石不敌谷歌AlphaGo 中盘告负
0
0

结果速递:

经过三个半小时的鏖战,李世石执黑186手中盘负谷歌AlphaGo。

总体而言,电脑在局部战斗中不落下风甚至更强,但在布局和大局判断上不如人类顶级棋手。李世石今天输在中后盘的松懈上,如果后面李世石能够乘胜追击的话,胜负很有悬念。

你还记得多年前的好莱坞大片《骇客帝国》吗?

当时,大家可能觉得还是天方夜谭,但还没有等到猴年马月(今年农历五月),这就开始涌现出端倪。

北京时间今天中午12点,谷歌旗下的Deep Mind公司所开发Alpha-Go(阿尔法围棋,一款围棋人工智能程序)将会与韩国围棋九段李世石展开第一场较量。在此之后,这一对人机在3月10日、12日、13日、15日还将对战四局,比赛采用贴7.5目的中国围棋竞赛规则。

比赛完全平等,获胜者将得到100万美元的奖金。当然钱不是事儿,这场比赛之所以备受世人关注,是它关乎人类的脸面,也关乎人类的未来。与以往围棋AI不同,Alpha-Go的战绩可谓十分辉煌:今年年初,Alpha-Go以5:0的比分横扫法国职业二段棋手、欧洲冠军樊麾,并登上了1月27日《自然》期刊的封面,这也是人类历史上围棋AI首次在公平比赛中战胜职业选手。

为啥会是围棋:人脑的最后堡垒

其实,说起人工智能,我们应该并不陌生。

在1997年,IBM的超级计算机“深蓝”二代目就创造了一项里程碑:战胜了当时国际象棋世界冠军卡斯帕罗夫,证明了人工智能在某些情况下有不弱于人脑的表现。

然而,人类在国际象棋上的失利却并没有带来过度惶恐,毕竟还有围棋这一始终不能被电脑攻克的项目。为什么围棋的“攻克”会较国际象棋难?围棋棋盘上有横竖各19条线,共361个交点,那么涉及到的可能出现的局面数量最大可达3^361(1.7408965065903 * 10^172)。

这个数量级是一个什么概念?有研究推测,在可观测的宇宙中所有原子的数量“仅有”10^80,后面差了90个“0”,与围棋差的不是一星半点,而是天壤之别!而用相同的方法,国际象棋就显得简单不少,大约是10^47。当然,在实际对战中涉及到的可能性并不能达到10^172这么多,但是,在规定时间内想要让计算机利用穷举法战胜甚至是必胜人类在现有的硬件条件下并不能做到。

于是研究人员开始从人类的思维方式入手,说白了就是模仿人类高端棋手的下棋方式。而这也正是Alpha-Go被称为人工智能的独特之处,它具备了类似于人类的深度学习能力。

Alpha-Go的三板斧:不是机器而是人

那么,Alpha-Go和以往的下棋机器人有何不同呢?

其实,对于解棋类项目,最初人们想运用的方法是穷举法。其基本思想是根据题目的部分条件确定答案的大致范围,并在此范围内对所有可能的情况逐一验证,直到全部情况验证完毕。但是,在围棋这个浩繁的黑白时间内,在规定时间内想要让计算机利用穷举法战胜甚至是必胜人类在现有的硬件条件下并不能做到。

于是研究人员开始从人类的思维方式入手,让它具备了类似于人类的深度学习能力,可以向人类一样地不断进化。所以说,Alpha-Go不是一台机器,而是一个会“三板斧”的机器人。

第一板斧,蒙特卡洛算法。

蒙特卡洛算法是近十年来围棋AI都在用的一个模拟算法,非常适合计算机进行计算。

电脑在数据储量上要比人类具有明显的优势,通过大量的棋局储备,电脑可以通过大数据的分析将出现的情况与已知情况进行对比,并通过胜负概率进行判断,找出一个“方向”。

通俗一点地说,Alpha-Go搜集了大量的对弈棋谱,在面临各种情况时能在棋谱中找到相似的“拆招”方式,并通过最终的胜负概率进行选择,给出可能的几个选择。这点与人类学习围棋非常相似——人们学习围棋除了了解基础规则以外,也是通过很多棋谱的复盘去一点一点掌握围棋的“棋感”。

第二板斧,深度神经网络

Apha-Go在蒙特卡洛的基础上,又增加了两种深度神经网络:“策略网络”(policy network)和“价值网络”(value network)的应用,主要目的就是权衡利弊。

其中,“策略网络”会对全局进行把控,先剔除一些多余选项——面对眼前的一盘棋,有些棋步是明显不该走的,比如不该随便送子给别人吃。而“价值网络”会对棋路的价值进行评估——AI会一边推算一边判断局面,在处于明显劣势的时候,再集中进行推算的价值已经不高,所以果断放弃,避免了一条道走到死。

第三板斧,自我学习。

如果看到这你就认为Alpha-Go已经很像个“人”了,那我只能说你太Simple了!人类学习围棋的过程中,复盘是一个非常重要的过程。不论是自己的对弈还是对已有的高端比赛的复盘,人在这个过程中去培养棋感,积累经验。而Alpha-Go同样也有这个过程,研究人员将此称为“监督学习”upervised learning。

关键的是,Alpha-Go通过自己与自己对弈(reinforcement learning),就可以不断地使棋力提高。

也就是说,它在不断的自我进化。正如搜狗CEO王小川在做客某节目时所说的,这个“自己与自己对弈”就像是武侠小说中的周伯通,正是依靠他自创的左右互搏术,自己跟自己打,才能打遍江湖。

谁输谁赢并不重要

其实,无论是Alpha-Go赢得比赛开创历史,还是李世石赢得比赛捍卫人类脸面,这都不重要。

谷歌母公司Alphabet董事长埃里克·施密特(Eric Schmidt)表示,“李世石AlphaGo围棋大战”吸引了人们的极大关注,但无论谁胜谁败,人类都是赢家。“人工智能和机器学习技术的日益发展将使世界上的每个人变得更加聪明、更强大,让人们的生活更美好。”

他说:“早在20世纪60年代,我们就希望能上演今天的这一幕(李世石和AlphaGo人机大战)。但在随后的30年,可以说是人工智能技术的冬天,几乎没取得什么进展。但最近10年,人工智能得到了极大突破,主要得益于新的算法、运行速度更快的计算机,以及更多的人力和财力资源的投入。”

相比之下,PayPal创始人伊隆·马斯克(Elon Musk)和著名物理学家史蒂芬·霍金(Stephen Hawking)均认为,人工智能的发展将给人类带来威胁。霍金甚至认为,人工智能可能摧毁人类。

李世石在发布会上表示:“之所以接受机器的挑战,是因为听到欧洲冠军被击败感到震惊。如果我失败,可能会对围棋的流行造成影响,但人工智能击败人类是不可避免的事情。”

李世石还称:“虽然AlphaGo战胜了欧洲冠军,但我认为到目前为止还是人类比人工智能强。但听到人工智能具有了类似人类的直觉判断能力,我感到有些紧张,恐怕我以5比0战胜它有点儿难度,因为人类下棋时会有失误。”

说句不太科学的话,围棋下到一定境界,就会超越胜负,进入到哲学或者艺术的层面,追求平衡与和谐,在沉思天地人关系的时候兼顾胜负。这是比结果导向的、单纯在盘面上不顾一切搏胜负的“胜负师”更高的境界,吴清源能让自己战败的棋局也成为经典,就是这个道理。机器有可能在对弈的技术层面战胜人类,但让它懂得围棋的哲理意味还需要更为漫长的时间,也许它永远也不会懂,而这才应该是人类真正的骄傲。

免责声明:本文仅代表作者个人观点,与C114通信网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

给作者点赞
0 VS 0
写得不太好

C114简介     联系我们     网站地图

Copyright©1999-2025 c114 All Rights Reserved 沪ICP备12002291号-4

C114通信网版权所有 举报电话:021-54451141 用户注销