3月22日下午,“新智能时代论坛”在北京机械工业出版社举行。爱奇艺公司CTO汤兴作为演讲嘉宾,为“新智能时代论坛”做了主题为《视频进化》的演讲。
以下为汤兴演讲全文:
刚才听了各位来宾的演讲感觉压力很大的,感觉我讲的太接地气了,各位讲得高大上,做个调查,在座的各位看网络视频的请举手,会看爱奇艺的举手。基本上差不多90%。
我今天会给大家回到现实的生活中,讲了那么多的人工智能,那么多智能化的时代,今天的现实生活中,视频领域发生着怎样的变化,或者我们怎么样利用智能改变我们的生活。我会先回顾一下视频整个的发展史,很短,不到200年,爱奇艺只有5年,爱奇艺的发展史浓缩了视频的发展阶段,可以看一下基本是六大阶段。
从18世纪,视觉才有理论发现之后,电影诞生,从无声的电影,黑白的电影,到后面高清的,3D的,4D,5D的影院,开始黑白的电影电视是不清楚的,我们希望清楚,后来发现光有图象没有声音,和日常的沟通相背的,又加了声音。后来声音感觉不够动听,开始出现了立体声,杜比公司作出了巨大的贡献,开始有混绕立体声,家庭影院。传说的改变,从你只能到电影院里看电影,变成了可以用无线电波看电视,后来可以看到高清电影,物联网的出现,把电影和电视搬到了互联网上,才有了在线视频。大家在看在线视频和TV的主要区别,是可以互动,TV上只能选台,互联网上可以快进,评论,点赞。爱奇艺是最近一二年开始做云计算,2013年启动爱奇艺的自动化的项目,发展了两年的时间,今年最火的方向是虚实结合,这是一个大概的整个在线视频的发展的简史。
看一下现在我们做了什么。这是视和听的演进,在线视频出现的时候都是SD的,320*240的,当时爱奇艺上线的时候,第一次搬到了网上,回来推1080P,去年1月份全往推出4K,去年春节之后,在业界有一个很小的轰动,因为当时在爱奇艺网页上出了小的视频,只有3分钟《叶落知秋》是第一次一个影片从拍摄到后期、上传、在线的编写码、播放,完全的4K,如果有4K显示器可以看一下,品质感非常强,以后4K电影流行之后,明星会非常的难办,因为所有的化妆,毛孔会看得一清二楚。原来只是在网上看立体声、双通道,去年和杜比合作推出环绕立体声,我们把电影的发展阶段,快速的推向中国的互联网,今天在互联网上,几乎可以享受到所有的画纸和音效的结果。最早在电影院看电影,后来又了无线电,在家里看电视,小时候谁家有18寸的彩色电视机,大家都会去他家看电视,现在各家有线电视都快被拆掉了,好处是可以随时随地的看,可以挑选不同的清晰度,可以互动,我们看一下未来,互动是在视频上了互联网之后才有的,最早人们可以在视频上发现拖拽行为,可以点赞,进行评论,最早是人和视频之间简单的互动。后来是人和人之间的慢慢的开始有了互动,因为大家都在评论同一个视频,一个人可以恢复另外一个人的点赞和评论,现在的趋势是说人在和服务通过互联网做进一步的连接,我们也看到了在互联网整个的平台上会发现在看电影的时候,或者看视频的时候会卖电影票,推荐不同的游戏,推荐不同的商品。从互动的角度在把现实生活中的商业搬到线上,推动服务进行连接。
回到今天讲的话题,智能化,我认为这是水到渠成的事情,不是点状的东西,前面嘉宾也讲到这是逐步发展的过程,所谓的智能存在是因为云计算和大数据的发展,没有数据,没有计算能力的时候,智能化是无法发展的,记得我还上大学的时候,我的师兄研究神经网络,八几年,九几年的时候,有一个思潮大家认为神经网络是彻底的忽悠,是伪科学,是不可实现的。十几年之后他卷土重来,因为我们大量的数据,有海量的计算能力,没有这亮点是无从道起的,最早的智能化是可以看到的。互联网的视频是看不完的,一个人每天看2小时的视频,看一辈子,看60年,最后可以看到3%的视频,其他97%的视频连看的时间都没有,这样怎么找到喜欢的,靠自己是很难的,通常是靠机器的计算,学习你的兴趣,这是个性化推荐做的事情。
很多人有手机,调查的结果,80%的人会把手机里面应用程序的推送关掉,认为那个通知很干扰他们的日常生活,不知道在座的各位多少人会关掉,很多时候希望得到你感兴趣的东西的通知,你喜欢体育节目的时候,希望知道体育比赛的结果,希望知道体育直播的开始时间,个性化推送,个性化通知在利用智能化提供个性化的服务,个性化的广告和大家的关系可能没有前面两个感觉更深,总体来说消费者总是讨厌广告的,广告主总是希望到达消费者,而视频平台总是两边都要讨好的。中间讨好的解决方式就是个性化推送,让人觉得感兴趣,又不会觉得厌烦,比如说2月14日,以前我们投过一个广告,比如投玫瑰花。广告主、广告平台和整个的用户会得到一个大家三方面的满足。回过来,我知道大家会追剧,不知道有没有注意到,整个互联网平台爱奇艺追剧是最快的,任何一个电视台播放完了2分钟之内爱奇艺会上线,任何一个直播结束之后爱奇艺会上线,任何一家网站做不到这个速度,通常最后的是30分钟,而我们可以做到一两分钟,为什么可以做到,是靠智能化的视频内容和分析。我们知道传统的互联网是图文时代,慢慢的快速进入了视频时代,我们对视频的了解还是基于只是文本描述信息,我们是并不了视频里面的内容,为什么那么慢,因为流程需要在电视台录制信号,编辑要进行处理,去掉不要的广告和台标,加上自己的描述,重新转马上线,我们现在把整个的流程全部自动化。也就是说一个视频在从电视台录制信号进来之后,我们自动跟进常年的分割,片断的分割,以及广告自动的识别,会自动的进行卡段,会自动的进入后台。原来需要编辑输入标题和介绍,现在百分之八九十以上工作自动化完成的,很多的字幕是自动识别的,语音是自动识别的,语音的截图,每个视频的截图不一样,对点击率的影响是非常大的,尤其是用户上传的视频,用户不知道哪一节的哪一张图影响会大,我们会挑吸引用户的进行推荐。大量的视频有盗版和黄色,大量的用户喜欢上传这种视频,以前非常的痛苦,编辑在几千上万的视频里面找到并且删掉,这是非常痛苦的视频,很多时候就加一段,比如加了科比的名字,就会被说这里加了盗版视频,靠人力是解决不了,后来智能化的做,准确率超过了99.9%,远超过人的操作。视频的生产,上线,审核流程完全的智能化。
这是很多互联网公司在做的事情,谷歌做过,视频行业是特别烧钱的事情,早上醒来,拿打火机烧100块钱,没有我们烧钱的速度快,今天是加一个鼓风机都没有我们烧的速度快,对我们来说最大的成本是版权,买一部剧,一部电影的时候,根本不知道有多大的票房,收视率,播放量,也无法知道RY是什么,我们以前花了4000万买了一部电影,放下来收益只有800万。很多时候拿到剧本就要决定买还是不买,这个行业的竞争是非常残酷的。我们做了一件什么事情,在这个行业为了节省我们的资金,为了给广大的用户更多的内容来看,我们要猜测到哪些是我们网络视频用户感兴趣的东西,我们做了这个模型。左上角是《来自星星的你》,这部剧掀起了韩剧疯涨的热潮,那之前韩剧大概一部剧集最多1万美金,之后涨到20多万美金,原因是这部剧非常火,去年初红遍大江南北,习总书记都提到《来自星星的你》。左下角是《战神》提前半年预测的,准确率达到95%,右下角是爱奇艺的电影指数,电影是更南预测的东西,会受到各方面的影响,电影靠广告是不可能收回成本的,更多的要靠收费,决定了到底有多少用户会对他感兴趣,我们做了电影指数,红色是预估的结果,最近在做一个有意思的事情,《极地雄师》,正在放映的电影,我们的内容部门在打赌,说不可能票房过7亿,计算机算是7.5到8亿之间,我现在问了一下现在票房是7.4亿,这个角度来说利用智能,让电脑不只是搜集信息,分析信息,而是一定要帮助我们预测未来,这种与是靠人脑做不到的。
下一步我们做什么,视频的发展史到了后来会发现,光了解是表相已经不够了,光了解信息不够了,我们开始改变现有的视频,要让视频里面和真实的已经不够了,要从制作到上线都要提供,我们在海量的视频里面加入虚拟的物体,从二维到三维,左边加了图,右边是加了可乐罐,看起来是一个技术,以后看到的视频是没有广告的,但广告已经投入到整个场景里面,所有的这些制作是后期的,而且可以实时的在线做。
虚实结合的产品,Video out,看到一个明星的衣服不知道是什么牌子,要到百度进行搜索,我们自动识别场景知道用了什么包,戴的项链,我们和电商结合,以后可以一边看,一边买东西。现在识别的精确度到了85%以上,对TOP5的商品类别,经过深度的识别,进行精准的标签匹配。
结论,经过前面的从音质,画质传出,到互动的发展,视频行业,娱乐行业进入了智能化和虚实结合的时代,爱奇艺从2013年开始投入,我们相信这种变化,智能时代会在视频行业会更早地感觉到。谢谢大家。
以下为观众提问:
提问:讲得非常有意思,转变了我对爱奇艺的看法,感觉在线视频对未来的展望,提到了虚实融合,看起来是往影片里面植入真实的物体,看起来会对未来的广告产生新的空间,这个本身不会对原来的节目本身的完整形态产生破坏,这个度摆在哪里?
汤兴:电脑会自动的对场景进行识别,之后会找出来对用户来说干扰最小的场景,后面会有人工的复合的流程,结果是希望在相对静止的场景,相对空旷的区域,对用户没有太大干扰,这并不只是对广告,对视频制作,春晚已经开始用虚实现实,全息做制作,我们的节目也在进行改变,以前做一个综艺节目,后面都是绿幕,再替换其他的场景,未来都是动态的,主持人可以随时的身处不同的场景里。