【AlphaGo明日首战柯洁】DeepMind 哈萨比斯传奇:从16岁剑桥神童到AI超级英雄

2017-05-22 17:00:53来源:新智元 热度:
【新智元导读】5月23日起,有AlphaGo之父之称的哈萨比斯将率领DeepMind的数位大将,与谷歌大脑的精英团队一起,在中国乌镇参加围棋人机终极对决,其中最受关注的自然是与柯洁的三场大战。本文综合《卫报》、BI、Wired 等媒体的报道,试图还原“超级英雄”哈萨比斯前半生的传奇经历:其母亲有中国血统,从少年时期哈萨比斯就被赞为“神童”,在数学和棋类游戏上颇有造诣。他的理想,是通用人工智能。
 
 
40 岁的著名人工智能(AI)实验室 DeepMind 的联合创始人戴密斯·哈萨比斯,被世界公认为他所在领域最聪明的思想家之一。
 
哈萨比斯被《卫报》形容为“人工智能超级英雄”,曾经是剑桥和伦敦大学学院计算机科学和认知神经科学的神童。
 
哈萨比斯在17岁的时候就和别人共同制作了电子游戏“Theme Park”,接着他成立了自己的电子游戏公司,并最终于2010 年成立了DeepMind。
 
2014年1月,哈萨比斯将DeepMind 以4亿英镑的价格出售给了Google,这是迄今为止欧洲范围内最大的一笔收购。这家公司的 AlphaGo 去年击败了围棋世界冠军,创造了历史。现在,DeepMind 正在将注意力转向将算法应用于可以使人类受益的领域,包括医疗保健和气候变化等。
 
从小就表现出棋类游戏的天赋,特别是国际象棋
 
哈萨比斯1976 年7 月27 日出生,父亲是塞浦路斯希腊族,母亲是新加坡华人。
 
哈萨比斯是三个兄弟姐妹中最年长的,他的父母是老师。据《卫报》报道,他的妹妹是一名钢琴家和作曲家,而他的弟弟则在学习创意写作。
 
“我的父母不是技术人员,”他在接受卫报采访时说。“他们真的不喜欢计算机,他们有点文艺范,我的妹妹和弟弟都走了艺术路线,没有人进入数学或科学领域...这很奇怪,我不太清楚所有这一切都来自于什么。”
 
哈萨比斯现在有两个儿子。
 
哈萨比斯从小就表现出棋类游戏的天赋,特别是国际象棋。
 
据Wired 报道,哈萨比斯四岁时就看他父亲和叔叔下国际象棋,展现出了浓厚兴趣。两个星期后,哈萨比斯就在比赛中击败了大人。
 
 
左下角的孩子是哈萨比斯
 
五岁以前,他在全国各地比赛,六岁时赢得了伦敦八岁以下组别的冠军。他九岁时已经成为了英格兰11岁以下国际象棋队的队长。
 
 8 岁买了第一台计算机,16岁被剑桥录取
 
八岁时,哈萨比斯买了人生中第一台计算机——ZX Spectrum。
 
 
哈萨比斯用他从国际象棋比赛中赢的200 英镑买了这台机器。
 
“那时计算机的惊人之处在于你可以对其进行编程,”哈萨比斯告诉Wired,“我爸会带我去Foyles(伦敦最大的书店),坐在计算机编程类书籍的区域,学习如何在游戏中无限续命,我从直觉上感到这是一个神奇的设备,你可以释放你的创造力。”
 
13岁时,哈萨比斯成为了国际象棋大师。当时他在14 岁以下组别世界排名第二。 
 
14岁时,他完成了GCSE (类似于中国的中学会考),这比同班同学提前了两年。十五岁时,他达到了数学 A level,16岁时则达到了高等数学、物理学和化学的 A level。
 
他向剑桥大学提出了申请,拿到了一个入学名额,但剑桥没让他真正开始,因为他当时只有16岁,于是他休息了一年。
 
他的事业起步于英国Bullfrog Productions 工作室的电子游戏。当时他 15 岁,还在Amiga Power杂志赢得了一份工作。在Bullfrog,他共同设计并领导了“主题公园(Theme Park)”的编程,游戏挑战玩家建立一个成功的主题公园。
 
哈萨比斯在去年七月告诉PCGamesN :“我从游戏中得到的最大乐趣来自90年代初的职业经历。特别是在 Bullfrog,我当时很幸运地处在英国游戏行业的黄金期,游戏一个接一个地被创造出来。”
 

Peter Molyneux
 
那段时间,他曾在传奇游戏设计师 Peter Molyneux 手下工作,Molyneux 是 Bullfrog Productions 的创始人。
 
“我想我们彼此影响很大,”哈萨比斯告诉PCGamesN,“多年来我们合作密切——很难说谁影响了谁,但这是我生活中非常重要的一部分。”
 
“主题公园”于 1994 年发行,当时哈萨比斯17岁,游戏卖了数百万份。
 
哈萨比斯于1994 年离开了Bullfrog Productions,到剑桥学习计算机科学。
 
据“金融时报”报道,剑桥大学本科生主要学习的内容是“狭义AI ”,狭义 AI 能够学习如何执行具体任务,但哈萨比斯对开发“通用 AI ”更感兴趣。
 
1997年,20岁的哈萨比斯从剑桥皇后学院毕业,他获得了双重一级荣誉学位(a double first-class honours degree)。
 
 “沉迷”于游戏,从游戏公司开始创业
 
1997年毕业后,哈萨比斯再次在Molyneux 手下工作,工作室是 Lionhead。
 
在Lionhead,哈萨比斯为标志性的上帝视角游戏“黑与白”开发了早期的AI 原型版本。
 
一年后,他离开了Lionhead,成立了自己的电子游戏公司。
 
1998年,哈萨比斯创立了Elixir Studios,为全球发型商如Vivendi Universal 和Microsoft 创造了一批屡获殊荣的游戏。
 
 
在高峰期Elixir 雇用了大约60人,制作了AI 模拟游戏如“共和国:革命”和“邪恶天才”,这些都是获BAFTA 提名的。
 
据“金融时报”报道,哈萨比斯将Elixir 的5%股权出售给了创建了Lara Croft“古墓丽影”系列的Eidos。股权售价为60 万英镑,公司估值为1200 万英镑。
 
神经科学博士:寻求在人类大脑中寻找新的AI 算法灵感
 
在电子游戏初创公司里工作了十年之后,哈萨比斯于2005 年回到了伦敦大学学院(UCL),在那里他完成了四年的认知神经科学博士学位。
 
在他读博期间,他开始寻求在人类大脑中寻找新的AI 算法灵感。
 
他关于记忆与想象力的研究被列入 2007 年十大科学突破之列。
 
2009 年,哈萨比斯获得了Henry Wellcome 博士后研究奖学金,继续在 UCL 进行研究。他还在波士顿、哈佛和 MIT 度过了一段研究时光。
 
创建DeepMind,走上巅峰
 
2010年,哈萨比斯成立了自己迄今为止最大的公司:DeepMind。
 
 
DeepMind 是一家位于伦敦的创业公司,希望“解决智能”,并用它来“使世界变得更美好”。
 
该公司正在开发复杂的自学习算法,可以在给定数据集面前自我学习,胜任特定任务。这些算法的创建混合了来自神经科学和机器学习的研究和专业知识。
 
到目前为止,这些算法已经击败了围棋中的世界冠军,帮助Google 削减了巨额的电费。DeepMind 还将其算法应用于许多NHS 项目。
 
哈萨比斯和童年好友 Mustafa Suleyman 共同创立了 DeepMind。
 
 
Suleyman 是 DeepMind 应用AI 的负责人,也是 DeepMind Health 部门的负责人,该部门正在与NHS在许多项目上展开合作。
 
Suleyman 也很聪明,在牛津大学学习哲学和神学,但他第二年就退学了,当时他19岁,创立了穆斯林青年帮助热线。Suleyman 后来担任了伦敦市长KenLivingstone 的政策官。此后,他创立了“变革实验室(Change Labs)”,旨在提供解决复杂问题的咨询服务。
 
另一个创始人是 Shane Legg,新西兰人,他也是 UCL 盖茨比计算神经科学组的博士后。
 
 
Legg 是 DeepMind 首席科学家。他在瑞士 Dalle Molle人工智能研究所(IDSIA)获得博士学位,师从超智能机器理论模型专家 Marcus Hutter 教授。
 
现年43岁的 Legg 与哈萨比斯共同领导 DeepMind 的研究工作。Legg 大部分时间花在招聘人才上,以及对 DeepMind 下一步应该重点关注什么进行决策。更重要的是,Legg 还领导 DeepMind 在 AI 安全方面的工作,包括开发一个巨大的“红色按钮”以在机器失控时按下按钮,中断机器。
 
与 DeepMind 的其他共同创始人相比,Legg 显得更加低调,接受媒体的采访更少。除了少有的曾在去年12月接受彭博社采访外,你很难在有关 DeepMind 的无数报道中找到 Legg 的只言片语。
 
哈萨比斯的早期投资者包括特斯拉亿万富翁 Elon Musk,以及 Skype 联合创始人 Jaan Tallinn。
 
 
马斯克今年早些时候接受《名利场》采访时这样评价 DeepMind:
 
“它让我对事情发展的速度有了更清晰的了解,而且我觉得它们发展的速度正在加快,远远快于人们能够意识到的。主要是因为人们在日常生活中不会看到机器人在到处走,也许你加的 Roomba 或其他什么会走动,但 Roomba 不会接管世界。”
 
但 DeepMind 也不是所有项目都很有名。在被 Google 收购之前,DeepMind 做过一个利用 AI 的时尚网站 KITSEE。
 
KITSEE 使用 AI 技术向用户推荐衣服,然后用户可以继续浏览和购买。这个网站还提供了一系列由 DeepMind 的作家团队操刀的时尚博文。
 
但当 DeepMind 被 Google 收购时,KITSEE 似乎已经被放弃了,Google 这位搜索巨头可能对它不感兴趣。
 
2013年12月,DeepMind 宣布机器在玩 Atari 游戏上超过了人类水平,通过使用屏幕上的原始像素作为输入训练软件。这是 DeepMind 取得的一项突破。
 
 
 DeepMind被谷歌收购,金额4亿英镑,当时只有50名员工
 
DeepMind 于 2014年被 Google 收购,据报道收购金额是 4亿 英镑,当时 DeepMind 有约50名员工。
 
 
如今,DeepMind 属于 Google 母公司 Alphabet 旗下,公司位于伦敦国王十字车展附近,拥有约400名员工。DeepMind 还在加州山景城的 Google 总部有一个小团队,该团队致力于将 DeepMind 的技术应用到 Google 的产品。但它仍然是一个独立的组织。
 
作为 Google 收购协议的一部分,哈萨比斯以及其他联合创始人与 Google 成立了 AI 伦理委员会。不过谁是这个委员会的头,从来没有公开。
 
 
2015年,DeepMind 发表有关学习掌握 Atari 游戏的算法的论文,登上了 Nature 杂志的封面——这是许多科学家梦寐以求的。
 
挑战围棋,闻名全球
 
搞定 Atari 游戏之后,哈萨比斯和他的迅速扩大的团队开始把注意力转移到古老的中国游戏,围棋——一个被广泛认为是 AI 领域的圣杯的游戏。
 
围棋有着3000多年的历史,是一个双人棋盘游戏,玩法表面看起来很简单——每个玩家轮流落一子,目的是用自己的子围住对方的棋子。
 
然而,任何一个落子的动作都意味着很多可能的动作,围棋实际上是人类开发的最复杂的游戏之一,AI 科学家们研究了几十年一直无法突破。
 
AlphaGo 通过玩无数遍游戏,逐渐从错误中学习。
 
2016年3月,DeepMind 让它的围棋算法 “AlphaGo” 和围棋世界冠军李世乭进行了一场比赛。
 
 
这是在韩国首尔的五星级四季酒店举行的,一共五局的比赛。DeepMind 在五局棋中赢了4局,最终取得胜利。
 
 
李世乭可能受到了冲击,但自那以后他还没有输过一场比赛。自从输给 AlphaGo 之后,他一直通过与 AlphaGo 算法交手来提高自己的棋艺。
 
写 AlphaGo 算法的程序员主要是 David Silver,他和哈萨比斯同是在剑桥大学念本科。
 
 
Silver 和哈萨比斯在 DeepMind 创立之前曾一起在 Elixir 工作。
 
哈萨比斯在2016年2月接受《卫报》采访时说:“Dave 和我是多年的老友,我们曾梦想一生都在这个领域工作,所以可以对19岁时的我们说放心了,我们做到了。”
 
DeepMind 在2016年1月第二次登上 Nature 封面,内容是有关 AlphaGo 算法的研究论文。
 
AlphaGo 现在正在前往中国,即将与发明围棋的这个国家的最厉害的棋手们对弈。
 
 
许多 AI 专家,包括牛津大学教授 Nick Bostrom 在内,认为 DeepMind 将在这场 AI 竞赛中赢得头筹,领先于 Facebook 和 Amazon 等公司。
 
 
Nick Bostrom 和哈萨比斯
 
哈萨比斯已经获得许多荣誉,包括今年5月份获得“亚洲奖”年度科技最佳贡献奖。
 
 
2014年,哈萨比斯获得了英国皇家学会颁发的“穆拉德奖”(Mullard Award),然后2016年,他被 Nature 杂志评为“年度十大人物”。
 
2017年,哈萨比斯被《时代》提名为全球最具影响力100人之一。
 
 超级英雄到来,AlphaGo的中国之行即将启幕
 
围棋被看成是一个计算机很难攻克的游戏,因为它严重地依赖于直觉、策略思考,需要在棋盘上赢下多场战役。仅仅是记住所有的棋子位置组合、评估棋局、构造和执行赢棋的策略,对于单台计算机来说,是非常有难度的。
 
但是这些都没能阻止DeepMind 的AlphaGo,它战胜了这一切。AlphaGo的深度神经网络让它能自己学会下棋。程序员们设置了关于围棋的基础启发式(heuristics),给AlphaGo一个数据库,从160,000个现实生活中的围棋对弈游戏中抽取出3000万个棋局, 来进行分析,分解其核心思想,然后,计算机能数百万次地重复游戏,在这一过程中进行学习。
 
这个策略已经有所回报。 2015年10月,AlphaGo以5:0 的比分战胜欧洲冠军樊麾,这是历史上第一次,电脑在一个全面的19x19棋盘上击败了一名专业人士。 2016年3月,它击败了韩国的世界冠军李世石,比分是4比1,而从2016年底到2017年初,AlphaGo(伪装成“Magister”和“Master”)秘密地打了51场在线比赛,对手都是世界上的顶级玩家。
 
现在,最后的对决即将到来:5月23日,AlphaGo和世界排名第一围棋手柯洁将在中国乌镇进行颠覆对决。
 
在围棋上的成就使得AlphaGo成为了聚光灯的焦点,但是,DeepMind 的这一程序还有另外一些东西,也就是智力(Mind)。DeepMind的联合创始人Demis Hassabis表示:“总而言之,我们的工作说明了利用生物学启发机制结合最先进的机器学习技术来创建能够学习和掌握各种挑战性任务的代理人的能力。”
 
而且,如果不断地输给一个近乎完美的机器人对手,这对人类来说也并不是什么有趣的事。AlphaGo的粉丝它在围棋上的统治力是一种解放。人类可以从中进行学习。正如哈萨比斯所指出的那样,完美都希望与更强的对手竞赛,这一才能提升自己。
 
“阿尔法的游戏使我们感到解放,也就是说,没有什么下法是不可能的”,专业的围棋手周瑞羊说。 “现在每个人都试图以一种以前没有尝试过的风格来下棋。”
 
但是,AlphaGo的胜利并不完美。正如李世石曾经说过的那样,“机器人将永远不会像人类一样体会到围棋之美。”
 
他可能是正确。至少目前来看是,人类所感知的世界与机器所“看”到的世界是截然不同的。
 
不过,当我们的目标只是赢得比赛或者解决问题,上面的这些还重要吗?拿无人车来说,也许有人会喜欢驾驶的愉悦,这种心情,机器肯定体会不到。但是,这是否意味着机器就不能更高效地运送乘客、减少交通拥堵、避免事故,消除路怒,甚至在不需要救护车的情况下把病人直接送到医院?
 
并且,如果这件事确实如此重要的话,那么大师李世石所提到的“美”,也确实在AlphaGo中得到了体现。
 
樊麾就曾对AlphaGo与李世石比赛中第二盘的“第37步”念念不忘,“这不是人类会下出来的棋”,樊麾说,“我从来没看到过有人走出这样的棋,太美了。”
 
DeepMind 宣布的乌镇围棋人机对战时间表:
 
 
第一天,5月23日,开幕式、柯洁与DeepMind比赛第一场、媒体会;
第二天,5月24日,未来AI论坛;
第三天,5月25日,柯洁比赛第二场,媒体会;
第四天,5月26日,组合对战,团队比赛,媒体会;
第五天,5月27日,柯洁比赛第三场,闭幕式。

责任编辑:黄焱林