赛前猎豹移动CEO傅盛预测AlphaGo目前版本并未做脱离监督学习,如果能做到,新版本的技术突破其实不亚于第一版AlphaGo的意义。从零开始训练,意味着利用增强学习从零开始演化,纯粹靠对局最后的Reward(胜负)来学习。“用RL模型在初始没有监督的情况下想要收敛到接近最优解还是一个很开放的问题,哪怕对于红白机的一些游戏也不能完全做到。如果AlphaGo 2能够完成从零开始学习,很可能意味着对于增强学习算法本身有比较重大的突破,而这种突破可能不仅用于围棋,也有大量对其他应用的可能,所以意义会不亚于AlphaGo 1的横空出世。”
傅盛的观点在赛后得以认证,AlphaGo的核心作者之一Aja Huang(黄士杰)在首战后声明“此次AlphaGo是单机版,但仍有人类知识的训练。”
“AlphaGo 2.0并没有本质性突破,我们期待的无监督学习并没有到来。Deepmind作为世界最顶尖的深度学习机构,引领着人类在深度学习上的探索。但一年的时间,AlphaGo 2.0本质上只优化了算法,提升了运算能力。这也提醒广大的AI从业者,不要仅仅寄希望于爆炸性的技术突破,落脚当下应该聚焦AI与应用相结合”傅盛说。
而这一AI应用结合论“由来已久”,傅盛曾多次公开指出深度学习的机会在于和应用的集合而不仅仅是技术输出。他认为深度学习是算法革命,本质上降低了技术壁垒。由于基本算法模型的固定化,算法的驱动力已经大大地降低了,算法驱动变成了数据驱动。因此,深度学习的核心是数据驱动,虽然有模型调参的机构会有自己的优势,但更多的数据调参会很快拉平优势。
本质上,虽然AI是一个技术和工具 ,但是由于互联网的加速发展,今天一个独立的技术本身已经很难成为一个完全的行业。很难想像一家公司通过技术输出就能成功,未来深度学习是基础的技术运用,很多公司都会具备深度学习的研发能力。所有的公司都将是科技公司。科技是基础点,需要和应用结合。
而这一论调并非空穴来风,猎豹去年收购了法国一家新闻产品News Republic,把用户的点击行为变成数据的标注部分,神经网络会找到自动的相关新闻进行推送。猎豹还做了直播类应用Live.me,现在是美国最大的第三方直播平台,每天有几十万的美国用户开播,产生几百万、上千万张标准人脸,这个数据使得猎豹能够找到精准的数据。猎豹研发的人脸识别技术,在色情和儿童识别上有大量应用。在最近的 LFW 人脸识别的评测中,猎豹取得了前三名的成绩。
从深蓝到阿法狗,棋牌类游戏一直被用来检验人类与人工智能的差距,追溯原因,一方面棋类历史悠久,人类有足够的积累,围棋拥有的变化足够多,暴力搜索不能解决问题,必须要让AI有"直觉";另一方面在博弈中属于完全信息博弈(Complete information),其实是最方便拿来验证AI能力。傅盛预测,未来AI所扮演的是助手的角色,而不是对抗的角色,将是人机共存的时代。