【旷视科技】为了人工智能终将创造的所以美好

2018-02-05 20:45:18来源:中国软件网 热度:
作为本次人工智能厂商系列专访的第四期,我们一起走近视觉智能领先厂商旷视科技。作为国内被普遍看好的人工智能创业公司,旷视科技不断得到资本的青睐,融资额度也屡创新高。资本是挑剔的,旷视科技有什么独特的优势在诸多创业公司中脱颖而出,在获得足够的“粮草”后,他们又如何继续将人工智能产业落地推向深入,我想这是大家关心的问题。为此,中国软件网专访了旷视科技的品牌与市场中心VP谢忆楠,通过他来看旷视科技人工智能的商业化逻辑,及其产业落地实践。
 

不同行业场景需求有差异,但降本增效是客户的核心诉求

在谢忆楠看来,人工智能应用落地最主要的是要满足用户的核心诉求。普遍看来,用户采用人工智能解决方案,最重要的诉求就是降本增效。这不难理解,降本增效是企业最基本的商业逻辑,只有通过人工智能应用提高客户的效率、降低运营成本,才能收到比较好的经济效益,这也是推动客户进一步使用智能系统最根本的原因。以安防为例,传统人力的手段,警察抓捕一个逃犯可以获得30万奖金,而通过人脸识别系统,可以不费一兵一卒快速锁定目标,这就显示出巨大的效率和成本优势。

此外,不同行业客户还具有差异化的功能需求,不同业务场景也对人工智能厂商的应用能力有不同的评价标准。以金融和安防为例,人工智能在金融中的重要应用就是准确的身份验证,防止由于假面、模型、照片、视频等欺骗身份验证系统,为此金融领域的智能系统关注攻击成功率、误识率、通过率等;与之相比,在安防领域人们戴个假面或者模型四处走动的概率较低,假体检测的需求不强,其关注的多是首位命中率、漏识率、误识率等。

在进行领域深耕时,不同行业客户的需求就是由共通的降本增效和带有行业特性的需求构成,人工智能厂商最重要的使命就是不断满足这些客户需求,为客户创造价值,带来看得见的经济效益,客户才会为人工智能解决方案买单。

技术与场景应用双轮驱动,构建智能商业闭环

对于科技领域而言,技术的重要性不言而喻,尤其是像人工智能这样的高科技领域,可以说技术领先性是厂商的关键优势。那么,是否只要技术够强就安枕无忧了呢?谢忆楠认为,人工智能是技术与场景应用双轮驱动的,任何单一方面都不能形成良好的商业闭环。

他以旷视科技本身的发展经验为例,刚开始的时候旷视科技的强项在于人脸检测,而人脸检测的一个重要应用领域是美颜,于是他们为一些美颜应用提供服务;然后自然衍生出1:1验证技术,并在金融领域进行推广,通过人脸验证用户身份,作为提供其他金融服务的依据;而后发展出人证一体技术,逐渐具备大规模人证一体能力;再后来,就是更具挑战性的实时1:N动态识别技术,这有助于进一步拓展人脸识别的应用场景,在安防、金融、地产等领域进行推广。在这一过程中我们可以看到,旷视科技并不是单一的专研技术,而是技术与场景应用并重,在场景中对技术价值进行验证的同时,也在进一步提升技术水平。

谢忆楠指出,跟所有商业领域一样,人工智能企业商业化的基本逻辑也是资金循环和数据循环,通过技术与场景应用的双轮驱动,旷视科技形成了一个良性的商业闭环,形成公司可持续的发展能力。

人工智能企业最核心的资产是人才,为了匹配技术与业务场景双轮驱动战略,旷视科技也进行了相应的人才储备。旷视科技要求其员工尤其是核心员工要既懂技术,也要懂不同行业的业务知识;反过来,业务人员也要懂技术,才能判断一项业务可行性和基本的技术实现路径。综合型的人才策略,为旷视科技带来源源不断的人才资源,支撑其双轮驱动战略。

人工智能平台带来的挑战,以及定制化方案与开放平台的权衡

谈到人工智能平台,尤其是免费、开放的人工智能平台,谢忆楠认为这是巨头快速抢占市场份额的战略,这也是巨头快速获取数据和用户,加速其商业循环的重要手段,对于中小型竞争者可能达到降维打击的效果。更多的数据意味着更高的系统性能,这反过来又能形成更强的技术优势和数据优势。一旦一个免费开放平台提供的技术达到其他厂商定制化方案的水平,那么对于提供定制化收费方案的厂商而言,其商业上的存在根基将受到挑战。

另一方面,“天下没有免费的午餐”,巨头提供的服务也不是绝对的免费,超过一定限度也是要收费的;并且,低价甚至免费的服务品质很难得到保障。至少目前看来,定制化的解决方案在性能表现上更强,也更切合客户需求。巨头们在互联网时代通过免费来快速抢占市场,最终通过垄断来实现“赢者通吃”的策略在智能时代是否适用,还有待观察。免费是把双刃剑,要避免因为免费拉低服务品质的现象,不然这是对整个行业的一种伤害。

与任何事务一样,人工智能开放平台有其优势,也有缺点,关键是利弊之间的权衡。谢忆楠指出,旷视科技也在不断寻找这样一个平衡点:哪些是需要通过定制化方案来进行的;哪些适合通过云平台的方式来对外提供服务。至于未来市场走向如何,目前还很难下定论。

云+端方案,解决巨量的计算能力需求

我们知道,人工智能获得发展有三个因素至关重要:以深度学习为核心的机器学习算法;互联网所积累的海量数据;芯片变革以及云计算所带来的巨大计算能力提升。相对于语音识别、语义理解、数据挖掘等领域,视觉智能领域对于计算能力的需求更加强烈,因为图像、视频的数据量远远大于其他信息形式。巨量的数据对于传输也提出了很大的挑战,如果将成千上万个摄像头的视频数据实时上传到云端,那对带宽的要求很高,也比较耗费时间,这不利于实时智能分析的实现。

如何解决这一难题呢?谢忆楠提到,未来必然是云+端的方式,来解决巨量的计算能力需求:智能终端本身可以进行大部分的计算,也就是所谓的“端计算”,未来智能芯片将有巨大的市场需求;智能终端只向云端传输少量主要的数据信息,云端更多的是承载数据训练的任务,通过集中的训练不断提升智能系统性能。基于此,谢忆楠判断,未来对于云端的计算需求依然会有所增加但增速会逐渐放缓,另一方面对于“端计算”的需求呈现加速增长的趋势。


城市大脑的构建路径,先数据化再智能化

谢忆楠指出,未来旷视科技的机器视觉应用将采用4+X的方式:人脸、行人、车辆、文字四类重点应用,加上动作识别、行为判断等其他机器视觉应用,共同构成了旷视科技的产品、应用矩阵。基于机器视觉,有望将整个物理空间数字化,并深入分析物理世界和人类行为的内在规律,获取更全面、细致的信息。以足球比赛为例,在一般人眼中无非是比分,以及脚球、任意球的数量等少量信息。而通过智能系统对视频信息的分析,可以完整的记录左脚次数、右脚次数、跑动动作、跑动速度等,能知道任何一个球员什么时候加速、什么时候减速、什么时候跑的最快,通过更全面的数据掌握,智能系统能分析出更多的信息。

未来通过安防、交通、手机、车载等各个领域的摄像头,我们可以很方便的将物理世界数据化,进而深刻变革安防、零售、教育、地产等领域的商业模式。最终,基于人工智能的城市大脑,将大大提升整个城市的运行效率和管理水平。

把时间尺度再推远一点,如果城市数字化已经实现的比较好了,未来会是什么样子呢?记得电影《速度与激情8》中,有一个叫做“天眼”的系统,通过这个系统人们几乎可以瞬间找到这个世界上的任何一个人。随着机器视觉的发展,上述场景已经不再是科幻了。谢忆楠透露,旷视科技也做了一个系统,巧合的是也叫“天眼”,只要能够接入全世界所有的摄像头,并提供足够的计算力,这个系统就至少能部分实现上述貌似科幻的场景。

当然,瞬间定位世界上的任何一个人,必然涉及到个人隐私。在谢忆楠看来,便捷化和个人隐私本身就是一种利弊权衡,如果你想生活的更加安全、便捷,有些时候适度的牺牲掉一些个人隐私似乎是不可避免的。诚然,绝对的隐私是不存在的。我们是时候好好考虑这一利弊权衡问题了,因为原来看似科幻的东西已经在一点点变成现实。无论如何,我始终坚信人工智能带给我们的必然是一个更加安全、舒适、高效的社会,即使这个过程会异常的艰辛,甚至会经历挫折。借用旷视科技的公司愿景的那句话,“为了人工智能终将创造的所以美好”。

责任编辑:吴礼得