AI时代,为什么懂语音者得天下

2017-11-29 15:26:16来源:凤凰网科技 热度:
语言是人类重要的交际工具,是人与人之间进行沟通交流的基础表达符号。

无论时代如何进步,世界如何改变,这种人们之间最基础的表达符号是不会改变的。尽管被一些所谓未来学家预言谈论“超级智能”、“奇点”、“人类危机论”的人工智能时代正全面袭来,但语言就像那戈壁滩上的胡杨,永远屹立不倒。

众所周知,人工智能是人类创造的,是人类为了寻求更加智能的社会而创造的工具,既然是工具,那必定没有思想、没有感知和认知,这也是人区别于其它物种的本质。那么如何让人工智能在人类发出指令之后能够正确的接收指令并理解,也就是让人工智能有感知和认知的能力,成为了各大科技公司最主要、也是最终一绝胜负的研究方向,因为一个没有任何感知和认知的人工智能产品,就如同一块镀上了一层金的废铁,好看不中用。

懂语言者、得天下

就像语言是人与人之间交流的符号一样。那么人与人工智能之间的交流语言就是自然语言理解。目前,随着深度学习技术的不断深入的研究,自然语言理解技术也逐渐的成熟。不光是国外,像国内的阿里巴巴,今年的双11期间,人工智能助手“阿里小蜜”在当天承担了95%的客服咨询,“蚂蚁安安”一天可以回答800万个提问,为其整体节省了50%—60%的成本。可以说人工智能助手已经完全有能力达到人工智能客服的水平。

日前,美国国家工程院院士、微软全球执行副总裁沈向洋博士在2017年中国计算机大会上就明确表示:当前人工智能最主要的两个方向是感知和认知,人工智能的下一个突破口在语言理解,懂语言者、得天下,只有我们明白自然语言是怎么回事,才能真正把人工智能这件事情讲清楚。

其实,各大科技公司、巨头比谁都明白“懂语言者、得天下”的道理,像早期我们最为熟悉的Siri就是被苹果收购的基于神经网络算法的语音识别,还有像Google推出的Google Home,Amazon推出的智能家居语音产品Echo。而在国内BAT也同样在打造自己的语音王国,像百度的DuesOS、腾讯才推出的语音助手“腾讯叮当”、阿里的天猫精灵X1。另外还有一些国内垂直类的AI创业公司,比如云知声、声智科技等等。

那么,为什么说的懂语音者、得天下呢?

自然语言理解的本质什么

像笔者开头说的,一个没有任何感知和认知的人工智能产品,就如同镀上了一层金的废铁,表面华丽、实则腐朽,这里笔者把人工智能上的感知和认知统称为认知智能。那么什么是认知智能?微软全球执行副总裁沈向洋是这样解释的,认知智能是解决语言的理解,对用户的理解,知识工程、下棋、问答、解决用户问题、写作、对话、艺术创作。

我们不妨仔细的琢磨琢磨这8个问题,哪一个不需要强的逻辑思维能力、感知和认知能力,其中下棋需要有观全局的能力、写作需要有清晰的逻辑思维能力,而最难的艺术创作,不仅需要有感知和认知的能力,同时还需要具备丰富的想象力和捕捉灵感的能力。当然还有其它我们没有提到的。然而,这些是人类所拥有的特质,也正是人类区别于人工智能最明显的符号。如果人工智能没有这种认知智能的特质,无论其多么智能、多么先进,也只能是人们用来处理人一些简单、重复、高危......工作,其实也就相当于生产车间的一些机器手、自动打包机等等。而像目前人工智能最落地的自动驾驶,AI游戏哪一个不需要认知智能。

自然语言处理有待提升

虽然目前来说,自然语言理解技术实现了可以成功的落地。但仍然存在一些难以解决或有待深入提升的难点。比如口语对话就是自然语言理解技术实现的重要难点之一,口语不像书面语那样正规,语言很随意,并且经常可以遇到本是一个意思,却说了两句话,然后还可以省略、更正、倒叙等等。

那么在这种不正规的语言表达中要通过自然语言识别出来,难免会给其增加相当大的难度。毕竟人类发明语言,是经历过了漫长的生物竞争才净化出的交流符号,而人类的语言文明是经过了5000年历史冲刷才有今天的。因此,「自然语言」的理解和处理,必然不会轻易达到成熟、顶峰。

责任编辑:吴礼得