随着多终端技术以及互联网内容的不断渗入,用户的操控体验成为了许多运营商们所关注的热门话题,语音遥控原本由于用户体验以及噪音干扰等问题,一直处于业内所探索的范围之内。在各方OTT产业链齐聚2012亚太OTTTV峰会之际,DVBCN数字电视中文网有幸邀请到了国内语音识别技术的先驱车音网总经理助理熊淑蕾女士作为专注于语音识别技术的专业代表为我们介绍了她对于未来搜索体验的看法。
“语音”的直接命中要优于传统“层级推进”
车音网是一个基于商用及语音识别技术交互的提供商,最早将语音技术用在了车联网行业,随着互联网节目的越来越多,人们在用touch以及各种遥控器的层次搜索模式变得越来越困难,使电视、手机以及Ipad等终端设备真正拥有了听觉上的智能。而通过这种能力可以使人机之间的交互也变得更为便捷。
“噪音”干扰,已经不是问题
事实上,语音遥控无独有偶,在很久之前就已经得到开发,但用户体验并不完善,由于噪音的存在,使得这种直接的人机交互方式长久以来并不被人所看好。当车音网面对这种疑问时,熊女士认为语音识别在客厅的噪音远小于车载噪音,既然这项技术已经运用于车载,客厅上自然也没有问题。车音网通过噪音模型过滤噪音的同时,也通过手机麦克风、遥控器麦克风点阵序列去过滤噪音,利用硬件上的方式保证语音在麦克风上有明确的指向性。另外,车音网能够通过对噪音语料的分析,去识别用户所说的话。而这些技术均是需要一个长期的探索和积累,车音网从1999年对语音识别技术的研究,历经10余载,一方面需要不断完善算法,另一方面在各行业搜集语料,能够达到行业的商业标准。
缩小引擎,只为“垂直”范围的完美用户体验
在问及和Siri的对比上,车音网熊女士表示,Siri更多的注重机器普适的理解和人工智能,它创造了很大的乐趣体验,但从国内的消费模式上,熊女士也坦率的说,国内很难让这种有趣的体验创造出商业价值,而语音识别真正要落地必须找到行业落地点,要找到语音识别在这个行业中的使命,车音网缩小了语音识别中的引擎能力,但却提供了更多的实惠,既然人工智能无法达到人脑的理解思维能力,那么它就无法商用,车音网的搜索引擎将在垂直领域不断细化精化搜索引擎来真正做到完善用户体验的目的。