专访谷歌顶级科学家:人工智能离普及还有多远?

2017-01-24 10:09:30来源:财富中文网 热度:
等你下一次不管是用谷歌搜索引擎搜索问题也好,还是在谷歌地图上找一家电影院的位置也罢,请你记住,在你看不见的地方,正有一个巨大的大脑在为你提供相关搜索结果,使你不至于在开车时迷了路。


当然,这里说的并不是人的大脑,而是网络搜索巨头谷歌的“谷歌大脑”(Google Brain)研究团队。《财富》记者罗杰·帕洛夫曾专门撰文揭开了这支团队的神秘面纱。“谷歌大脑”研究团队迄今已经开发了1000多个所谓的“深度学习”项目,它们也是YouTube、谷歌翻译、谷歌照片等近年来谷歌公司多个成功产品背后的大功臣。通过深度学习技术,研究人员能够将海量数据输入“神经元网络”软件系统进行处理,该系统能够以人脑完全无法企及的速度,在海量数据中进行学习和模式分析。

近日,“谷歌大脑”团队的创始人和负责人之一的杰夫·迪恩接受了《财富》杂志专访,并谈到了人工智能领域的研究进展及其带来的挑战,以及人工智能技术在谷歌产品中的应用。出于篇幅考虑,以下采访稿有删节。

问:在推动人工智能领域研究的过程中,科研人员主要面临哪些挑战?

人类的学习有大量内容来自无监督式的学习,也就是说,你只是在观察周围的世界,理解事物的道理。这是机器学习研究的一个非常活跃的领域,但目前研究的进展与监督式学习还是不能比拟的。

也就是说,无监督式学习指的是一个人通过观察和感知进行的学习,如果计算机也能自行进行观察和感知,就能帮助我们解决更复杂的问题了?

是的,人类的洞察力主要是通过无监督式学习训练出来的。你从小就会观察世界,但偶尔你也会得到一些监督式学习的信号,比如有人会告诉你:“那是一只长颈鹿”或“那是一辆小汽车”。你获了这些少量的监督式信息后,你的心智模式就会自然地对其产生回应。

我们需要将监督式和非监督式学习更紧密地结合起来。不过以我们大部分机器学习系统的工作模式来看,我们现在还没有完全进展到那个地步。

你能解释一下什么是“强化学习”技术吗?

“强化学习”背后的理念是,你并不一定理解你可能要采取的行动,所以你会先尝试你应该采取的一系列行动,比如你觉得某个想法很好,就可以先尝试一下,然后观察外界的反应。这就好比玩桌游,你可以针对对手的举动做出回应。最终在一系列的类似行为之后,你就会获得某种奖励信号。

强化学习的理念就是,在你获得奖励信号的同时,可以将功劳或过错分配给你在尝试过程中采取的所有行动。这项技术在今天的某些领域的确非常有效。

我觉得强化学习面临的一些挑战主要集中在当你可以采取的行为状态极为宽泛的时候。在真实世界中,人类在任何给定的时候都可以采取一系列极为宽泛的行为。而在你玩桌游的时候,你能采取的只有有限的一系列行为,因为游戏的规则限制了你,而且奖励信号也要明确得多——不是赢就是输。

如果我的目标是泡一杯咖啡之类的,那我可能采取的潜在行为就相当宽泛了,而奖励信号也没有那么明显了。

不过你们还是可以将步骤分解开,对吧?比如,如果你想泡一杯咖啡,你就可以通过学习得知,如果你在冲泡之前不将咖啡豆充分研磨,泡出来的咖啡就不会好喝。

对。我认为增强学习的一个特点就是它需要探索,所以在物理系统环境下使用它往往有些困难。不过我们已经开始尝试在机器人上使用这种技术了。当机器人要需要采取某些行动中,它在特定一天内可以采取的行为是有限的。但是如果使用计算机模拟的话,就可以轻易地使用大量计算机获得上百万个样本。

谷歌已经开始将强化学习技术用在核心搜索产品上了吗?

我们通过与DeepMind(一家人工智能领域的创业公司,2014年被谷歌收购)和我们的数据中心运营人员的共同努力,已经将强化学习技术应用到了我们的核心产品上。他们还将这项技术运用在了数据中心的空调温控系统上,在大大降低能耗的同时,达到了相同的、安全的冷却效果和运行条件。它能探索温控旋钮的哪种设置是合理的,以及当你改变运行条件时应该如何做出响应。

通过强化学习技术,他们能够探索这18个或者更多个温控旋钮的最优设置,而这可能是连专门负责温控的工作人员都没有做过的。熟悉温控系统的人可能会觉得:“这个设置真奇怪。”然而事实上它的工作效果非常好。

什么样的任务更适合应用强化学习技术?

上面说的数据中心这个案例之所以效果很好,就是因为在一段给定时间内并没有太多不同的行为。温控系统大概有18个温控旋钮,你可以把一个旋钮调高或调低,结果都是很容易衡量的。只要你在可以接受的适当温度范围内运行,你的能耗利用率就会更好。从这个角度看,这几乎是一个理想的强化学习技术的使用案例。

而至于在网络搜索中,我应该显示哪些搜索结果,这应该是强化学习技术的运用效果稍差的一个用例了。针对不同的搜索提问,我可以选择显示的搜索结果的面是很宽的,而且奖励信号也不明确。比方说一名用户看到了搜索结果,至于他心里喜不喜欢这个搜索结果,这是很不明显的。

如果他们不喜欢某一搜索结果,你连衡量它都很难吧?

是的,的确有点棘手。我认为这个例子就能说明强化学习技术可能还不够成熟,在这种奖励信号不够明确、约束条件太少的环境下,还不能真正有效地运行。

你们研究出来的这些技术要想应用到人们日常使用的产品中,还将面临哪些最大的挑战?

首先,很多机器学习解决方案和针对这些解决方案的研究是可以在各个不同领域重复使用的。比如我们与谷歌地图团队就在某些研究上展开了合作。他们希望能够识别出街景图片中的所有商户名称和标志牌,以更深入地了解这个世界——比如确定这究竟是一家披萨店还是别的什么。

事实证明,要想识别这些图像中的文字,你可以对一个机器学习模型进行“训练”,给它一些人们在文字周围画圈或画框的样本数据。这样一来,机器学习模型就会学会分辨图像中的哪些部分包含了文字。

这项能力总体还是很有用的。谷歌团队的另一部分人还将该技术运用到了一项卫星图像分析项目中,主要用来分辨美国和全世界的建筑物的房顶,以估算太阳能电池板在房顶上的安装位置。

我们还发现,同样的模型还能协助我们进行医学影响分析方面的一些初级工作。比如说你有一些医学影响,你想在其中发现一些与临床相关的有趣的部分,你就可以用这个模型来帮忙。

责任编辑:王倩倩

为您推荐

美报业迎倒闭高潮 传媒三巨头痛斥谷歌是寄生虫

互联网似乎正压得美国传统报业走投无路。然而,网上的信息其实高度依赖于传统媒体,网络报纸也无法像纸质报纸一样深层次、多角度地透视社会。因此,假如报纸真的不再重要,网络媒体也将失去价值仿佛是约好的,传统媒体突然对谷歌群起而攻之。4月6日,《华尔街日报》和美联社等著名传统媒体再次攻击谷歌和其他新闻聚合网站是网络寄生虫,并威胁采取法律手段。《华尔街日报》总编罗伯特·汤姆森称:“毫无疑问,有些网站就是互联网大肠中的寄生虫或者科技绦虫。读者已经习惯了互联网上大部分内容免费,而我认为这个认知是错误的,但是谷歌等新闻聚合网站则利用这种错误认知盈利。这些网站几乎没有认识到为他们带来盈利的内容是其他机构创造的。”

谷歌开始调查“内鬼” 给否认退出中国找台阶

路透社18日报道说,熟悉情势的消息人士向路透社透露,谷歌公司在调查是否有公司内鬼参与对谷歌的网络攻击。此前谷歌公司宣布考虑撤出中国时理由之一就是“遭到黑客网络攻击”。路透社称,谷歌公司的一名发言人拒绝“对谣言和猜测置评”,但承认这是正在进行的一项调查。易观国际互联网高级分析师李智接受记者采访时表示,谷歌调查内部员工是否参与所谓的网络攻击,是其找台阶下的表现,是危机公关的一种方式。李智表示,谷歌做出的退出中国的决定本身是冲动的,从一开始表现出的态度强硬,到目前一步步的缓和,说明谷歌意识到了中国市场的重要性。如果谷歌最终没有退出中国,那无疑是它导演的一出闹剧。

传谷歌与卫星电视运营商合作测试 或将介入电视节目搜索服务

电脑商情在线3月9日消息,据国外媒体报道,谷歌正与美国第二大卫星电视运营商DishNetwork合作测试一款电视节目搜索服务。有消息人士称,谷歌通过基于Android系统的电视机顶盒提供这一服务。用户不仅可以通过该服务搜索Dish的节目内容,也可以搜索来自YouTube的内容,并对播放的电视节目进行个性化。分析人士指出,谷歌很可能将这一新服务与电视广告业务结合起来,根据用户数据针对不同家庭投放不同广告。

逐鹿智能电视

韩国三星电子和LG电子通过近几年与日本索尼和夏普的激烈竞争,目前在全球电视市场占有率方面分列前两名。当专家们认为韩国电视产业会在一段时间内领先于日本,占据全球电视霸主地位时,苹果和谷歌加入了电视市场争夺战行列,从而使得全球电视市场格局出现了新变数,市场争夺形势已然进入乱花渐欲迷人眼的状态。染指电视苹果谷歌齐出手苹果公司首席执行官史蒂夫·乔布斯在4月关于“苹果公司非凡新产品”的表态,被外界普遍认为是苹果公司涉足电视市场的强烈信号。Eugene投资证券公司分析师说:“苹果最快可能在今年第四季度,谷歌最快是在今年11月左右推出新的电视。韩国电视生产商如果不能正确应对苹果和谷歌掀起的电视新发展趋势,很