曝光台/慧买

AlphaGo是否代表了人工智能的成功和未来

2016年03月17日 23:45   0   2095
来源:来源不详

蛙盟云按:智慧全媒体技术提供商-关注产品信息和企业信息透明化的平台,北京金启程科技的产品线:数字报、数字报软件、电子报软件、移动数字报APP、全媒体集群门户、portal网站群、内容管理系统、CMS系统、政府门户、教育门户等。
    xpaper数字报云:注册会员即可获得1000元代金券。我现在就要注册数字报云平台,【点击注册】

Google旗下DeepMind的AlphaGo VS. 韩国职业九段围棋棋手李世石

  欢迎关注“创事记”的微信订阅号:sinachuangshiji

文/Michael282694

相信在最近几天时间里无论是否关注围棋,只要你是一个拥有基本社交关系的正常青年,一定都被AlphaGo VS. 韩国职业九段围棋棋手李世石(或李世乭)的重磅对抗新闻刷了无数屏。对阵双方是Google旗下DeepMind公司[1-2]开发的AlphaGo围棋人工智能(Artificial Intelligence, AI)程序和韩国乃至世界顶级围棋高手李世石,DeepMind试图证明AI科技可以使冰冷的计算机具备人类思考意识,以期未来布局到游戏、医疗、机器人以及手机等领域从而更好地服务人类;而李世石作为代表人类的一方,则试图抛开人类的偏见和自负,承担起捍卫圣杯的义务(当然,胜利一方将获得$100w美金奖金)。遗憾的是李世石目前已经输掉了整场比赛,被AlphaGo以3: 0的比分毫无悬念摘下这场天王山之战的胜果(按照官方赛制规定比赛采用5局3胜制,无论哪一方提前胜出都要下满5局),现在社交网络上的风评已经由讨论比分几比几转变成讨论李世石到底能不能扳回哪怕一城?(创事记注:在13日进行的第四局比赛中,李世石战胜AlphaGo,获得了其在本次系列赛的首场胜利。)透过直播甚至能看到比赛期间李世石频繁摇头叹气,赛前誓言要5: 0血洗AI的豪气早已不复存在,私下里还被网民戏谑为“Google高级软件测试工程师”。

前三场比赛的比分

如果不出意外,这场比赛将会以人类一方被5: 0的血洗终结并载入AI科技发展史。AlphaGo内部的增强学习机制只会让其棋艺越来越专业,而且机器不会受情感波动的影响稳定发挥,所以现阶段压力几乎全扑向李世石一边,剩下两局已经不再是输赢的问题了,这对他旗艺的发挥必然造成影响。

这场比赛为什么空前受瞩?

此役之前,AlphaGo曾以5: 0的大比分轻松横扫欧洲围棋冠军樊麾,初步证明了AlphaGo的围棋“思考”能力已经具备围棋大师赛水准。按照最新的Elo分数世界排名(http://www.goratings.org/),樊麾以2986分排名世界第513 / 827位,属于职业二段棋手,而李世石的得分是3520,世界排名第4 / 827(2007-2011年间世界排名第1,近几年长期盘踞前4状态),属于职业九段棋手,几乎代表了人类围棋博弈的智慧顶峰,所以这场比赛和1997年IBM的计算机程序“深蓝” VS. 加里·卡斯帕罗夫那场国际象棋大赛地位相当。

Elo分数排名和分布

从解空间大小来看国际象棋的穷举解空间只有10^46,而围棋的穷举解空间高达10^172,即使穷尽整个宇宙的物质也存不下围棋的所有可能性(宇宙中的原子总数是10^80),针对每一步落子的棋局分析和剪枝优化判定都比国际象棋复杂得多。很多没有算法概念的小白一厢情愿地认为只要用足够多的计算资源进行暴力穷举(brute-force)就能得到最优解,这种心态类似著名的猴子无限定理中所描述的:让一只猴子在打字机上随机地按键,当按键时间达到无穷时,几乎必然能够打出任何给定的文字,比如莎士比亚的全套著作。不过在现实中,猴子打出一篇像样的文章的概率是零,因为科学家经过反复试验后发现,猴子在使用键盘时通常会连按某一个键或拍击键盘,2003年,某个科学家做了这个实验,结果打出了5张全是‘S’的纸。最终打出的文字不可能成为一个完整的句子。这是因为现实是非常大的有限,而不是严格意义上的无限。

AlphaGo解空间示意图

AlphaGo是什么,有何厉害之处?

通过阅读AlphaGo发表在《Nature 2016》上的文章Mastering the game of Go with deep neuralnetworks and tree search[3]可以了解到:

Abstract: The game of Go has long been viewed as the most challengingof classic games for artificial intelligence owing to its enormous search spaceand the difficulty of evaluating board positions and moves. Here we introduce a new approach tocomputer Go that uses ‘value networks’ to evaluate board positions and ‘policynetworks’ to select moves. These deep neural networks are trained by a novelcombination of supervised learning from human expert games, and reinforcementlearning from games of self-play. Without any lookahead search, the neuralnetworks play Go at the level of state-of-the-art Monte Carlo tree searchprograms that simulate thousands of random games of self-play. We alsointroduce a new search algorithm that combines Monte Carlo simulation with valueand policy networks. Using this search algorithm, our program AlphaGoachieved a 99.8% winning rate against other Go programs, and defeated the humanEuropean Go champion by 5 games to 0. This is the first time that a computerprogram has defeated a human professional player in the full-sized game of Go,a feat previously thought to be at least a decade away.

AlphaGo的神经网络训练模型和架构

通俗地讲,AlphaGo就是一套针对围棋周密设计的深度学习引擎,采用多种机器学习技术进行整合:增强学习(reinforcement learning),深度神经网络(deep neural network),走棋网络(policy network)、快速走子(fast rollout)、估值网络(Value Network)和蒙特卡洛树搜索(Monte Carlo tree search, MCTS),加上Google强大的硬件支撑和云计算资源,结合CPU   GPU,通过增强学习和自我博弈学习不断提高自身水平[4-5]。值得一提的是,paper两位主要作者之一的Aja Huang(一名低调的台湾教授,另一位是David Silver)也是一名围棋爱好者,目前水平已经达到业余六级(普通人一般是业余二级),整个AlphaGo主要来自两位在博士阶段及毕业以后五年以上的积累。

在未来,AI科技能否超越人脑?

自1956年AI这个概念被提出并确立以来,一共经历了符号主义→ 专家系统 …→ 统计学习→ 神经网络→ 深度学习等几大重要阶段,尤其是近十年来对深度学习的研究使得AI在历经神经网络发展低潮过后再一次空前崛起。回顾过往,历史上比较著名的AI对抗人类智慧事件共有三次:

1.1997年IBM的计算机程序“深蓝”在国际象棋大赛中以3.5: 2.5 (2胜1负3平)战胜加里·卡斯帕罗夫,当时使用的是人工调整的评估函数,而且是用特殊设计的硬件和“暴力”的搜索。

2.2011 - 2012年,吴恩达(Andrew Y. Ng)在Google Brain搭建了一个拥有1.6万多个微处理器、数十亿连接的神经网络,通过观看千万数量级的YouTube图像后,无监督地从里面自主辨识出了“猫”这种生物。然而这样一个庞大集群却也只能达到一个几岁孩子的思维水平。

吴恩达现就职于百度,担任公司首席科学家,负责百度研究院的领导工作,尤其是Baidu Brain计划。

3.近期,Google旗下DeepMind的AlphaGo与韩国职业九段围棋棋手李世石的围棋对抗,目前比分为AlphaGo: 李世石 = 3: 0,AlphaGo胜。

那么,若AlphaGo赢下全部五局比赛,是否意味着AI科技进入全面应用的智能生活时代?不尽然也。按照智能程度分类,AI可以分为强人工智能和弱人工智能,强人工智能的观点是让机器真正的思考(can machine really think),弱人工智能的观点是让机器智能的行动(can machine act intelligent),本质上现有的大多数AI系统包括AlphaGo都还处于弱人工智能阶段,人工投入越多,智能的表现就越多,机器只是执行人类复杂程序命令,并不具备类人情感情绪和思维思考。注意到对AI的分类并不是以解空间大小作为标准,像语音 / 图像搜索、机器翻译、智能家居和无人驾驶等即将或已投入使用的AI科技的计算体量都比AlphaGo小得多。

谷歌人工智能软件首赢韩国选手李世石看上去是一座里程碑,它似乎意味着电脑已经能做任何人类所擅长的事,但事实并非如此。世界上还有无数人类能够完成的任务,是电脑难以接近的。“世界上最强大的力量应当是人类本身,而不是一把铁锹或者核潜艇。人类制造的产物不讲道德和感情,但他们拥有力量,这种力量的快速增长往往让人类感到恐惧。”——英国《卫报》

让电脑模拟出人类思维方式是一件很难的事情,计算机能正常运转是通过按部就班地执行一行行程序代码实现,这些代码指令最终都会变成0和1的二进制机器码。

l语音搜索

一个简单的搜索引擎案例,当你想了解黄晓明的家人都有谁时,会在搜索框中输入“黄晓明的老婆是谁”,结果是Angelbaby,但如果你想继续了解“黄晓明的妈妈是谁”,就必须重新执行第二次搜索动作才会得到结果。试想一下如果搜索引擎具备了人脑的思维方式,整个过程将会变成:“黄晓明的老婆是谁”→“Angelbaby”→“妈妈呢”→“张素霞”,相当便捷。如果将这种搜索方式以语音的方式交互,省去在小块手机屏幕上打字输入的烦恼,对搜索用户体验将带来极大的提升。语音搜索是一种结合多种AI技术的典型应用,包括但不限于语音识别(speech recognition)、自然语言处理(natural language processing, nlp)、机器学习(machine learning, ml)和对数据的挖掘(data minging, dm)和呈现(data visualization),实现过程相对于单一任务、封闭式规则的围棋项目要复杂许多,可以通过语义理解与多轮对话精准识别你的需求,带有一定的思考判断能力。在未来,语音搜索可以应用到例如智能硬件服务、汽车导航助手、基于语音特征的金融支付、新闻媒体和咨询顾问等行业中,不排除未来发展成为强人工智能的趋势。

具有多轮对话功能的语音搜索

l图像识别

丰富的社交网络让人人自带媒体属性,情感在互联网上被肆意发泄,可以无时无刻分享心情和照片。最近几年因深度学习被大力推崇与发展,搜索功能也变得不再单一,尤其是语音和图像搜索识别技术开始大放异彩,无数科学家前后投入希望搜索引擎更加智能地服务用户。比如哪一天你在朋友圈刷到一张美女明星图,不追星的你出于对美女的钟爱也很想知道这是哪位明星以及她的基本资料,只要将图片保存后上传到图像搜索引擎中分析识别,计算机会帮你找到想知道的信息。

基于海量数据的图像识别

除此之外,还有基于人脸、姿态和场景等综合的相似性图像推送。

基于海量数据的相似图片推送

l机器翻译

语言是沟通的桥梁。在没有中间翻译的条件下,两个不同语种的人交流往往十分困难。近年来伴随着语音识别和深度神经网络(DNN)等技术的快速发展和经济全球化的需求,多语言机器翻译研究成为当今信息处理领域新的研究热点。基于深度学习的翻译系统的核心是一个拥有无数结点(神经元)的深度神经网络,一种语言的句子被向量化之后,在网络中层层传递,转化为计算机可以“理解”的表示形式,再经过多层复杂的传导运算,生成另一种语言的译文。

机器翻译演示

以目前的发展趋势预测,AI替代人类部分工作只是时间问题,这在众多领域已经初现端倪。最后引用开复老师的精彩答案[6]来回答:战胜李世石的AlphaGo是否代表了人工智能的成功和未来?

1.在可以凭逻辑分析推算的问题上,机器即将远远把人类抛在后面。机器速度会越来越快,学习能力会越来越强,数据会越来越多。当年,大家讨论“国际象棋输给机器不算什么,围棋才是真正的智慧”只是我们人类维护自己尊严但是不实际的幻想!今天,我们该面对现实了!

2.在大数据机器学习大规模并行计算的时代,我们将看到无数的商机和产品,能够在预测、分析、推荐等方面,产生巨大的商业和用户价值。不过,这些解决方案和人类相比,其实没有什么意义,因为人差太远了(比如说:推荐引擎将能推荐你最可能会买的产品、想吃的菜,想认识的人;自动交易能得到更高的投资回报和风险比例。。。)。

3.在感知方面,人类也将会被机器超越。今天的语音识别,人脸识别,未来的自动驾驶,都是例子。

4.但是,以上都还是冷冰冰的技术,机器打败了世界冠军也没有感到高兴(甚至说不出为什么)。对于那些科幻片的粉丝们:机器人是否会人性化?这还是未知的。毕竟,在情感、喜怒哀乐、七情六欲、人文艺术、美和爱、价值观等方面,机器离人还差的很远,甚至连基础都没有。对人工智能的研究者,这是下一个挑战。对我们人类,在下个突破之前,我们还是多发展右脑吧!

参考资料

1.DeepMind:https://deepmind.com/alpha-go.html

2.DeepMindOffical Blog:http://googleresearch.blogspot.sg/2016/01/alphago-mastering-ancient-game-of-go.html

3.《Mastering the game of Go with deep neural networks and treesearch》:http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html,百度云分享:http://pan.baidu.com/s/1nuyNtk1

4.《AlphaGo的分析》:http://zhuanlan.zhihu.com/yuandong/20607684

5.《AlphaGo究竟是如何打败人类“最强围棋大脑”的?一篇论文告诉你答案》:http://mp.weixin.qq.com/s?__biz=MjM5NTU0MTAzNQ==&mid=404106659&idx=1&sn=fb3fa527ab3c9ddac5bc7bba2771e6fb&scene=1&srcid=03139nyzbOCFFr8wEH0seGeA#wechat_redirect

6.《李世石能战胜 AlphaGo 吗?》——李开复的回答:https://www.zhihu.com/question/39906815/answer/89652546

作者简介:Michael282694,知乎互联网领域小V,写得一手好代码,吐得一手好嘈。


转载请以链接形式注明出处:

本篇文章来源于 "xpaper报刊网|蛙盟云平台" :http://www.womtech.net/html/hssy1/index.shtml

更多技术资讯,请访问公司官网http://www.jinostart.com

xpaper数字报刊系统介绍,请访问http://www.jinostart.com/html/comp1/content/newsmedia/2016-07-22/1-40-1.shtml

Xpaper数字报报刊云&蛙盟云 版权与免责声明:

① 凡本网注明“来源:xpaper&蛙盟云”的所有作品,版权均属于xpaper软件版权归金启程科技所有,未经本网授权不得转载、摘编或利用其它方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:金启程科技&蛙盟云”。违反上述声明者,本网将追究其相关法律责任。

② 凡本网注明“来源:XXX(非xpaper&蛙盟云)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

③ 本网部分内容来自互联网,如因作品内容、版权和其它问题需要同本网联系的,请在30日内进行。

※ 联系方式:xpaper数字报报刊云&蛙盟云运营中心 Email:jinostart@126.com

下载womtech蛙盟云app客户端 关注蛙盟云微信公众号
下载womtech蛙盟云app客户端 关注蛙盟云微信公众号
©2015北京金启程科技有限公司 京ICP备15002495号-2