由于算法的演进、大量数据的涌入以及算力的提升,人工智能迎来了最好的时代。同时,从智能手机,到自动驾驶,再到安防,AI 图像视觉技术也正在被应用到越来越多的行业。
但目前落地应用过程中所面临的现实的情况是,受深度学习驱动,云端视觉图像处理技术飞速发展的同时,前端视觉成像技术却依旧裹足不前,无法与之相匹配,成为了限制 AI 视觉发展的严重瓶颈。
比如,2016 年的时候,一辆特斯拉 MODEL S 在自动驾驶时发生车祸,导致驾驶员死亡。究其原因,正是由于在逆光以及反光的情况下,其所配备的摄像头无法识别前方车辆,才酿成了那起事故。
当算法以及超强的计算能力赋予了机器逻辑思维能力之后,想要让它真正能够得以在实际生活、生产中实现落地,拥有一双足够明亮的「眼睛」是必不可少的,这也是接下来在人工智能向前推进的过程中,需要去解决的难题。
成立于 2014 年的眼擎科技(eyemore),是一家从事前端成像引擎的技术公司,通过专业的成像引擎芯片,他们利用自主研发的成像算法,为各个应用场景下的机器视觉公司提供前端成像的一体化解决方案,来解决目前 AI 视觉由于光线差导致识别准确度低以及从图像算法到视觉硬件产品落地周期太长的问题。
CES 2018 展会期间,极客公园举办了「极客之夜」活动,我们为世界各地的企业家和创业者搭建了交流的舞台,希望能在这一舞台,尝试为人们找到科技困惑的答案,发现科技新趋势。
在极客之夜的活动上,我们邀请到了眼擎科技创始人朱继志,来看看在 AI 时代,如何理解视觉成像这件事情,以及他们能够为整个行业的发展带来哪些意义。
以下为眼擎科技创始人朱继志演讲实录。
大家知道现在 AI 芯片很热门,讲到 AI 芯片,大部分都是用来处理图像和视觉的。今天我们换一个角度,从成像的角度来看一看 AI 芯片。
成像的历史分成三个阶段。最早是胶卷时代,比较有代表性的企业是柯达;从 80 年代开始进入数码时代,产品转移到了日本,今天大家看到的所有的图像、相机工业里面的视觉都是源自于 80 年代日本数码成像的体系;现在我们正处于 AI 视觉时代。
到了 AI 时代以后,整个成像技术有了一个本质的变化。最大的变化就是以前的图像是给人看的,现在是给机器看的。给人看的时候大家关注的是多少像素,给机器看的时候,则更多的关注于识别的结果。对于整个成像产业而言,这是一个很大的历史变化,这个变化会比从胶卷时代到数码时代的升级更大。
眼擎科技是一家创业公司,做了有四年多的时间。我们的目标是要做超越人眼识别能力的成像技术,同时,我们也是做芯片的,19 号在北京极客公园 IF 大会上,会发布我们 eyemore 成像芯片。
它会是第一颗专门面向 AI 视觉来开发的成像芯片,针对 AI 成像,我们做了一个全新的架构,基于超大规模运算和很多新型的成像算法,我们客户的应用主要包括自动驾驶、安防、人脸识别、医疗视觉、工业检测等各种和 AI 视觉相关的领域。
随着我们算法的不断的提升,计算能力不断的提高,以及场景数据量的不断增加,我们相信,在更多方面,机器的成像能力都能够超越人眼的视觉能力。
我认为视觉在 AI 里边是最快能够实现落地变成产业的一个应用,从我们接触到的很多客户来看,2018 年我认为会有很多落地的 AI 视觉的产品,不管是在安防领域、医疗领域,还是在自动驾驶领域。
由于深度学习带来的 AI 算法有了一个大的突破,很快会传递到整个产业链条的上游,换句话说,AI 的算法其实具备很强的工业赋能的能力。我认为,未来在很多的设备里边,可能都会带来视觉功能的升级需求,因为视觉功能实际上是设备走向智能非常重要的一步。
有关产品落地的问题,实际上我们所有接触过的客户都会碰到一个问题:在实验室训练数据的时候,效果很好,但是到实际场景去部署的时候,因为各种各样环境的问题,比如弱光、逆光、反光这些的复杂环境下,效果就不行了,有点类似于卖家秀很丰满,但是买家秀却很骨感。
他们做训练的数据可能从网上来的非常清晰的高品质图像,但在实际场景当中,因为环境影响导致成像品质不好,非常影响后端 AI 识别的效率和准确率。我们的产品正是帮助这些 AI 客户去解决在产品从算法到实际场景落地过程中所遇到的这个难点。