一 问题的提出
自从中国有了MAM,特别是有了《广播电视节目资料分类法》的广电行业指导性技术文件(GY/Z 199-2004),在广电的内容归档和检索方面有了重大突破。然而,当依据GY/Z 199建成MAM系统以后,运行的经验说明:工作流出现了拥塞。这不仅表现在按照“图书馆学”和“档案学”原理,在人工录入“资料分类”的编目上耗人耗力,同时,也表现在为了使用而全方位占有视频资料的检索中,索取的资料还不能完整地表达创意者的构思意图。这是因为,“图书馆学”或“档案学”对于内容的描述和刻画远没有视频图像那样深刻,比如依据视觉整合原理,对图像的纹理结构、色彩分布、运动轨迹、GOP序列、图像标识等等实现深层描述,而这些内容却在视觉效果和内容描述中充当了极为重要的元素,同时,也是极具视频特征的数据信息。因而,只能认为“图书馆学”或“档案学”的分类归档是关于视频图像内容描述的子集。
再从IT的“整合之路”看,从IT的信息整合到内容整合,至少走过了10年的历程。1993年哈佛出版了迈克尔·哈默(Michael Hammer)与担任CSC Index管理顾问公司董事长的James Champy博士合著的《再造企业(Reengineering the Corporation)》,并以“管理革命的宣言”作为副标题,掀起了研究世界性企业信息整合的浪潮。随后,IBM在业务流程重组(Business Process Reengineering,BPR)上寻找突破口,以5大品牌整合工具、6大“粒度”精细化的整合价值,提供了从信息整合,到内容整合,再到流程整合的一系列企业信息化原则与理念。当“富媒体”概念进入数字视频,并以“辛迪加(Syndicate)”产业平台再造新媒体的时候,虽然全国广电开始认同了新媒体内容整合的概念,频频谈论内容整合之大计。但是,叫响“整合”的毕竟是IT,而IT毕竟还是针对文件级数据整合的研究,所提出的内容管理系统(Content Management Systems,CMS),还只能从广义上适应企业营销的内容需求。即便是影响整个图像检索界的IBM QBIC(Query By Image Content,IBM)系列商用产品,也不能深入到视频流内部,以跨媒体的思路去理解视频流级的VA内容整合。而理论界的研究成果,如哥伦比亚大学的Visual SEEK查询系统以及麻省理工学院媒体实验室开发的PhotoBook检索系统等,虽然是面向视频、基于流样本的研究,但还未能进入面向新媒体业务(对象)的实际应用,难以适应新媒体时代内容整合的应用需求。
因此,一方面研究新媒体内容整合不仅十分迫切,而且极为现实(全球都在行动),另一方面仅仅依靠IT的整合概念还不够,还需将其精髓通过“概念移植(Concept Implantation)”,产生适用于广电流程的内容整合概念和理念,以至整合成为整套的视频数字序列。
二 面向视频的整合概念
当迈克尔·哈默的信息整合飓风刮到视频领域的时候,已经进入了21世纪。不管现在如何,当之无愧的AV领军人SONY率先以“改革工作流程”的口号,推出了视频归档存储系统,接着打出了 “Work Smart,Work Sony!”的横幅,预示着视频BPR开始了实质性应用。可是,当依据BPR流程设计基本原则的ESIA(Eliminate、Simplify、Integrate、Automate),去看SONY的“流程改革”时,“清除、简化、整合、自动化”的连续性还是被隔裂了。一方面当时的电视媒体还没能进入依托网络“再造传媒信息化”的愿望和现实,另一方面即便是硬件的归档存储Sony也不擅长(已经停产),就更不必去谈充分表现软体结构的内容整合了。而今天,“网络的力量”已经把传统电视媒体推向了新媒体,今非昔比的“成本、质量、服务、速度”,为广电再造媒体、再造流程、直至再造视频整合,产生了前所未有的巨大推动力。
信息整合是将业务应用系统的信息数据进行有机的整合集成,从而实现对业务应用信息的数据共享过程;AV的内容整合是将广播服务多种业务应用系统的核心数据进行有机的整合集成,从而对广电所拥有的根本优势——视频节目内容,实现核心数据的共享过程;更为具体化的视觉整合是指将电视媒体的文化产品通过一致的视觉设计,达到内容整合和信息传达的意象形态,使公众产生一致的认同感和价值观,从而创造最佳经营环境的一种创作和经营策略;而数据整合则是基于数据的内容整合。因而,就整合的定义而言,其外延特征应该是:信息整合≥内容整合≥视觉整合≥数据整合。由此而构成视频整合的完整定义。
解决视频整合问题的基本方法有两种:面向需求的设计和面向对象的设计。面向需求的特征是“一事一议”,无穷尽的功能需求既包括能够预测到的功能,也包括未来不可预测的功能,那么,必然将流程的路径变得越来越不清晰,而系统则越来越复杂,并不可操控;面向对象的特征是“一群(类)一议”,如果把业务作为基础对象,将出现很有限的宏对象类,特别是把视频作为对象研究时,不仅量级更低,而且所使用规范与标准也就随之变得更简明,更清晰。这就是出现面向对象的MPEG-7标准的根本原因。更为重要的是:对象类的收敛将轻松地找到约束条件,并在关联性约束条件的引领下,向对象目标收敛。
图1是视频内容整合的“金字塔”概念模型,它表达了视频内容整合的层次化结构,以及向目标方向上经整合运动所发生的收敛趋势。虽然在各个不同层次上收敛的约束条件不尽相同,但总的收敛过[FS:Page]程是一致的,从而使内容整合更加趋向逻辑化和商业化。
需要说明的是,传统的模拟电视体系没有“金字塔”的基座(第四层),如果一定要说它有,那就是传统录像带。因为录像带是封闭的介质,只能形成离散的“沙丘”,不可能成为坚实的“基座”;即便采用了封闭网络的共享编辑,也只是基于视频文件的素材层整合,既没有数据整合与数据挖掘的深度,也没有辛迪加产业平台的广度。至于面向业务的最终收敛条件,因为没有EPG的电子文本,以模拟形态出现的“电视报”频道节目表显现的频道整合,结果是松散收敛,显然约束度偏低。所以,传统模拟电视的内容整合不可能达到数字媒体的深度,更不可能达到“金字塔”的稳定度。这也是数字化无可比拟的优越性。
在新媒体中,前3层“EPG、串联单、脚本”的收敛条件类似,多表现于表层的视觉整合多重性,见长于文化色彩、内容创意和商业价值的视觉整合。但在技术层面,仍能透过视觉整合表达对内容整合的充分约束条件。但作为基础的元素层,不可视性决定了视觉整合趋向弱化,导致目标收敛不仅在于视觉整合,更侧重内容整合的数据整合。而且,在元素层单纯依据《分类法》的收敛并不趋向国际最新流行的“栅格(Grid)”检索,起码也只能称其为“二维栅格”,而栅格技术是三维的网格矩阵,不仅含有时间轴,还含有纵向的面向方向检索;它包含不可视的数据内容,以标准化的模式语言描述和标引,实现基础层的数据整合模式化。
三 视频整合的逻辑分析
对照图1的“金字塔”模型,图2进一步演绎了新媒体多业务内容整合的4个基本逻辑层次结构。它表达了新媒体在不同内容层次实现内容整合的内在联系。
如图2所示,面向视频的内容整合应由频道层、节目层、素材(片段)层、元素层所组成。对4者的逻辑关系有两种看法,一种是面向业务的,一种是面向数据的。面向业务的认为频道是业务的最高层,所有的相关数据为其服务而形成“金字塔”的塔尖,这种看法更近乎于商业化;而面向数据的认为元素层是任何内容的基础,没有“金字塔”的基础,就没有稳固的“金字塔”,当然既包括塔尖,也包括业务的子项节目类。而笔者更倾心于对前者的修正,虽然这一点与IT的数据整合有悖,没能把数据整合归属于CMS,但把注意力集中于数据整合,而把目标归结于视频业务,恰恰符合了BPR的再造原则。因此,有必要进一步细化内容整合的逻辑层定义,以寻求各层次之间的关联性关系。
1. 频道层
通过节目频道的内容整合,集成为一个分众群体所需要的节目包,既容易推销,也容易操作。比如在全国频道集成运营平台上、在有线城域接入网前端服务平台上、在网络电视“友情”链接的互联网服务平台上、在IPTV组播的内容配送网络(Content Delivery Network,CDN)集成平台上,都集中体现了频道内容的业务整合,使之成为市场容易接受的内容商品。其中电子节目指南(Electronic Program Guide,EPG)是引导市场消费,反馈市场信息,直至调整内容整合策略的纽带;是EPG捆绑了内容,也是EPG约束了整合,成为最初的、也是最常见的内容整合充要收敛条件。
2. 节目层
通过不同的个性化节目采购和交换,编排成为专业化频道或集中服务的时段,它可以是电视剧,也可以是电影,还可以是侧重分众群体的娱乐栏目。由于节目层的业务应用极为广泛,不仅能够成为广播式内容的中坚,也可以成为交互式内容的骨干,还可以成为媒体贸易的实物性商品。因而,它将成为下一轮面向多业务内容整合的“围城”,在市场与技术的共同夹击下取得重大突破。在由节目层构成频道的关联性取决于播出串联单(Planned Order,PO),PO兼有配送资源计划(Distribution Resource Planning,DRP)中内容计划订单和内容领料单(Picking List)的功能,在DRP条件下的整合逻辑,是将配送链上的节目内容库、节目及附件购入单、销售用户订单等进行数据整合,同时引入利润、订户、物流等诸方面的生产链,以整合后的逻辑流程驱动生产流程。然而,这一层次的内容整合通常是由媒体自身发起,而网络公司与网络服务商没有资质。不被国家认可的内容播出机构则不在“围城”之内。
3. 素材(片段)层
片段、场景、镜头、分镜头和素材虽然没有严格内容区分,但为避免以偏概全的外延过小趋势,还是依据国际标准定义为素材较为中肯。素材层是以享有版权节目的内容片段,以及媒体自拍节目的素材,通过归档存储,实现内容的再编辑,组合成为新主题、新观点的新节目。而且,由片段所形成的内容将取决于MAM的积累程度,积累得越多,新节目也就越多。从理论上看,素材层内容整合是生产节目的基础,如果能够管理并准确检索n个片段,就能再造出n!个节目。可见,在MAM的支持下,面向对象个性化服务是新媒体内容整合必须达到、也能够达到的基本目标。素材层的收敛条件在于节目脚本(Film Script,FS),FS表达了节目内容的创意性思维和视觉整合的意象形态,而内容管理的素材检索,以其最小粒度(直至分镜头与图像帧)的检索内容实现回调,成为创意和整合的快捷工具,同时,也成为“辛迪加”节目制作工厂流水线上,原料配送的出库物料清单(Item Record,IR),依据IR向DRP过渡,收敛成为独立节目而跨入节目层。
4. 元素层
这一层次是媒体内容整合的新课题,因其复杂且抽象而被认为是超级的内容整合。能称其为数字媒体的,就存在内容已表现为数据形态的根本标志;而这些数据有静态的,也有动态的;有存活的,也有休眠的。那么,通过对视频内容的专用标识,就有可能扩展成为包含更多媒体数据的模式化描述。不仅包括频道、节目、片段、素材、关键帧、文稿、语音、人物、外景、数字等等的描述,也包括用于描述各种媒体的数据,如静止图像、图形、3D模型、音频、视频等等,以[FS:Page]及这些元素如何在内容中表现为数据组合的信息。进而通过描述子(Descriptor,D)与描述模式(Description Scheme,DS),对与内容关联的数据仓库进行标引和归档,以便快速搜索并有效合成为节目片段。MPEG-7标准所规范的内容描述模式,即“描述定义语言”(Description Definition Language,DDL),为实现超级的内容整合奠定了基础。它以标准化的语言描述元数据和数据仓库,使得异构、异质、异形、异流等的不可再生数据,经规范化编码描述(Coded Description,CD)成为节目深加工与再编辑的元素。特别值得注意的是图2中红色剪头所示方向,它将前三者的内容整合进一步抽象,以描述值(Descriptor Value,DV)对逻辑层内容数据实现再描述,进而把它们激活,在逻辑层扩大为元素集合,而在物理层却不过多占用空间。这样一来,虚拟制作、仿真制作、动态制作、在线制作就拥有了更多的元素,使元素层的内容整合具有更为宽泛、更为严格的整合条件,继而产生新的收敛条件,以再构模式的电子编辑,创作无限空间思维的新节目。而且,元素层的收敛条件除了《分类法》外,还针对“栅格法”进行标准化,依据国际视频数据聚合的相关交换标准,实现超级内容整合。
还应该看到,经过前三者的内容整合,即便依据《分类法》的逻辑,也可以将媒体资产演绎成为新内容和新业务,还可以融合艺术与技术,把“低成本编辑”推向新高,得心应手地实现逻辑再造与内容再构。但是,对于新媒体而言,仅仅停留在前三层的内容整合,资源的优化配置还不能极大化,如人工干预过繁、面向业务过窄、工作流拥塞、粒度不细而遗漏回调等等,因而出现被全球新媒体推向边缘化的总趋势。由此可见,超级的内容整合不仅是以实践为目标的核心技术,也是追踪未来开发的远景目标。
四 元素层数据整合原理
元素层数据整合的关键是寻求收敛条件与适配方法。目前国际上拥有丰富的标准化信息交换规则,为收敛条件打下了良好基础。特别是前面已经提到的MPEG-7“多媒体信息内容描述接口(Multimedia Content Description Interface)”,不仅提供了在内容整合中面向对象适配条件的方法学,更重要的是规范了相关内容的DDL描述语言。但它自1996年9月开始研究,到2001年10月正式成为MPEG的标准以来,为什么实际应用那么困难?其中重要原因是D与DV具有不可读性,它不仅需要以另一种标准语言描述实体,而且即便通过这种可以认为是CD编码格式,来实现数据的可读性与可操作性,还是不能认为已经能够读取的数据就可以通过模式化语言,简单描述并准确反映视频实体。因此,还需要应用其它相关数据整合和交换的国际标准。
图3描述了视频内容整合的全结构序列(请特别注意“数字媒体元素整合层”的数据结构)。很明显,其中除了物理元数据(场景符、镜头符、GPS定位、时码等等)外,在MXF(Meida eXchange File format,媒体数据交换格式)的基础上,引入了UMID(Unique Material Identifier,素材识别码)、XML(Extensible Markup Language,可扩展标记语言)和RSS(Really Simple Syndication,实体信息聚合),其中UMID和XML构成重要的元数据。
UMID是由电影电视工程师协会(SMPTE)在2000年进行了国际标准化,成为全球惟一的视音频素材识别码。UMID不仅能提供数字媒体的检索应用,还兼容视频制作环境。在数字媒体中,大多数元数据由指定的数据库分别存储和管理,但还有一小部分元数据可以直接植入素材本身,以支持高效元数据的应用需求。为了将元数据为基础的离散条件,在元素层与素材层之间转化为收敛条件,并从本地网络中准确地检索并输出,就必须拥有全球惟一的识别码,而现存的视音频素材或内容的识别码,如ISAN/V-ISAN(ISO)、CRID(TV Anytime Forum)、CID(Content ID Forum)等等,分别是针对制作环境的识别方式,只有UMID是面向素材本身的。因而,通过UMID植入素材,虽然并不过多占用物理空间(只占用128个字节),却为面向对象的高效检索提供了纵向逻辑思维和检索的可能性。
在DEMO系统应用中,首先将D与DV置于上层数据,以DS进行实体校验,以承认CD变换模式的可靠性,由此成为视频数据包的搜索引擎。实际应用中需要以统计规律寻找对应关系,通过对视频图像的采集与分析,衍生物理元数据的描述标准(受控词汇库),以准确表达视频实体。图4说明了这种关系建立的对应关系和演化过程,当逐项分析并在视频显示中得到准确赋值和校验后,这种收敛关系也就确立了。当然,还需要在应用过程中模拟运动预测的差值补偿,逐步将误差调整归零,当被编辑的实际应用认可以后,就可以实现全自动的赋值及标引。
当上述模式建立以后,经过数据变换已经成为MXF格式的可读数据,即可遵照SMPTE 336M KLV数据编码协议,提供专业广播电视视频环境的一种外壳格式,一方面包装MPEG-2数据流、DV数据流、YUV数据流以及PCM音频文件,另一方面装载多种媒体格式的数据库文件(同步或非同步模式),以MPEG-7编码描述元数据和描述子。这样,不仅提供了在更深层次上数据整合的载体和可读、可视的数据,也为“富媒体”时代准备了内容管理与内容整合的兼容性,还突破了在网络环境下因缺乏标准视频文件格式而受阻的窘境。
对于“富媒体”互联互通对象的应用,DEMO系统侧重解析和扩展XML。XML是SGML(Standard Generalized Markup Language,标准规范化标记语言)的一种压缩形式,其特点是比早期的超文本标识语言(HTML)在组织和表现信息的能力等方面具有更大的灵活性。因而被称为“允许创作者设计标记语言的元语言”。在XML基础上,DEMO系统建立规范的自定义标签,主要包括:NewsML(新闻型标记语言)、PRISM(Publishing Requirements for Industry Standard Metadata,工业标准元数据发布需求)和ICE(Information Content and Exchange,信息内容和交换)等。N[FS:Page]ewsML是国际新闻通信委员会(IPTC)在2000年10月批准的全球最新新闻语言标准,它对XML扩展成为描述和(或)包装多媒体新闻资源的一种文法,在多媒体新闻结构之上,以元素层的合理描述,定义新闻型标记语言的新闻条目,以多个URLs(Uniform Resource Identifiers,统一资源定位器)表达信息资源,并以URN(Uniform Resource Name,统一资源名)分配物理名称空间,但URN必须是唯一的,以确保检索资源名字的准确性。这样,对于网络资源的采集和标引就能够方便地使用一个服务代理,直接受理NewsML的有效载荷。而NewsML的元素,如典型的在线新闻、新闻视频和多媒体数据等,也就能遵照IPTC为NewsML所创建的文档类型定义(DTD),自动将XML元数据装载到NewsML的文档中,最终给客户提供想到何处访问及访问何种消息的极大选择空间。
针对属于平面媒体和电子出版物的内容整合,DEMO系统向PRISM和ICE协议扩展XML。PRISM涵盖了从目录到内容,包括各种形式电子出版物和印刷出版物在内的各种媒体内容整合,再加上出版界早就支持SGML(XML的前身),并至今用于指导应用,使得XML的覆盖面从数据整合拓展到内容整合,将“富媒体”的内容划为共享的多库资源。而PRISM是通过提供标准化特性、受控词汇集和支持用户定义受控词汇集实现扩展机制,通过对内容及相关资源进行规范描述,定义基础元数据使用Dublin Core词汇表的RDF/XML文档,不仅扩展了XML和RDF(Resource Description Framework,资源描述框架),而且与纯RDF和日益流行的Dublin Core元素集相一致。实践证明,PRISM可以与大部分RDF工具以及NewsML工具包很好配合,以提供一个基于Java的工具集,既为他人定义自己的受控词汇表提供了方便,也为应用ICE协议指导RDF/XML文档向各个检索对象分发内容,并为网络条件下实现元数据管理和内容检索提供了前提。
ICE最早出现于1998年,但它的缺憾是没能提供一种可行的多媒体内容描述模式。作为主要电子出版物XML的内容与交换标准之一,只要它采用了合理的、规范的描述模式,就可以把平面媒体与电子出版物的内容一并纳入内容整合。而MXF外壳恰恰就可以担当此任,再借助MPEG-7的模式化语言描述,当初并不“吃香”的ICE协议,如今却能涵盖“富媒体”的内容资源,以至标准化的识别和检索。
另外,DEMO系统还利用RSS的内容整合能力,在P2P模式的支持下,以点对点的需求将数据“拉入”多库模式的媒体内容库,再以分布式资产库的内容元数据交换和检索机制,在XML系列扩展标准的支持下进一步分类编目,一方面使服务对象顺利浏览这些资料,并通过内容整合占有这些资料,同时再构新节目和再造新业务;另一方面还可依据规范的目录信息采集,将特定的MXL及其扩展数据转换为标引条目,大大提高了针对《分类法》文档自动录入条目的编目效率。
图5绘出了内容整合的全系统原理,其中桔色部分表达了元素层数据整合的DEMO系统位置。虽然图中多表达的是逻辑流程,但考虑到以上4张图均侧重逻辑分析,故在此图中扩展了部分物理结构。如图所示,全系统构成面向多业务的新媒体内容服务,其中元素层内容整合的DEMO系统充当了系统的核心,从而建立了“传媒辛迪加”BPR的多业务服务平台。图中还能看到,在MAM的基础上,当应用系统能够将有限物理空间的内容管理库,拓展成为无限虚拟空间的“富媒体”资源库时,分布全球的多库共享,就是新媒体内容整合“取之不尽,用之不竭”的源泉。
五 结束语
辽宁电视台基于上述原理对于AV内容整合的研究和应用,不仅取得了突破性进展,而且在DEMO版的应用中,令人耳目一新。实践过后的反思,进一步理解了迈克尔·哈默先生“流程再造”的实质,那是对新媒体业务流程的根本性思考,以内容整合原理再造媒体工程,最大限度地适应数字经济时代——“顾客(Customer)、竞争(Competition)、变化(Change)”的经营意识与经营环境。同时,在信息和信息化技术的推动下,也为视频领域再谈内容整合奠定了基础。
摘自《现代电视技术》
为您推荐
据国外媒体报道,美国年度消费电子大展(CES)将于新年第一个星期在拉斯维加斯拉开帷幕,屇时下一代DVD标准的两大阵营,由索尼牵头蓝光和东芝为首的HD将展开新一轮厮杀。然而,在这场未来DVD标准王者之争中,消费者却渐行渐远,有线网络服务商的高清视频点播服务成了最大的赢家。蓝光与HD阵营自自坚持的标准基于对消费者需求的不同理解,由东芝牵头的HD阵营认为,消费者不可能为下一代DVD光盘和播放器出高价,因此HD标准基于对现有DVD技术的升级,并且相互兼容;而索尼为首的蓝光阵营却认为,消费者只对新技术感兴趣,因此蓝光标准更多考虑了未来的创新应用,与目前的DVD技术不兼容,价格极高。两大阵营的争斗目前仍处
中国媒体行业监管部门修改了关于海外公司进入受严格控制的卫星电视行业的规定,但没有放宽在受众范围方面的限制。虽然将于8月1日起实施的新规定明确了一些申请卫星电视频道落地的程序,但其中必须在提交申请的同时附上一份评估报告的规定令人产生了一些困惑。Paul,Weiss,Rifkind,Wharton&Garrison中国地区业务负责人JeanetteChan表示,她不清楚上述评估报告指的到底是什么。希望在中国开播卫星电视频道的海外公司必须先同指定机构中国中央电视台(ChinaCentralTelevision)旗下的中国国际电视总公司(ChinaInternationalTelevisionCorp
美国GenesisMicrochip公司是全球领先的视频处理技术提供商,该公司的视频处理技术在LCD显示器中得到广泛的应用。据Genesis公司CEOElieAntoun透露,2004年全球液晶显示器出货量预计超过1500万,Genesis的视频处理芯片将占近50%的份额。然而,按照iSpulli公司的预测,到2008年全球数字电视市场容量将超过8,500万台。无疑,数字电视将是视频技术应用的主要市场。Genesis在主导传统显示器视频处理技术的同时,在高端电视市场中已经取得不俗的业绩,全球主要的彩电厂商已经有很多产品采用了该公司的先进视频处理器。然而,数字电视巨大的市场机会正在加剧半导体厂商
-已覆盖43个大中城市-每月收费120元据新华社北京1月3日电经过4个月的试播,中央电视台高清影视频道于2006年1月1日正式向用户推出。频道有关负责人3日透露,截至目前,央视高清影视频道已在上海、杭州等43个大中城市推广,春节前将覆盖到北京、天津等城市。据介绍,这些城市的有线电视用户可向当地有线电视网络公司申请订购高清影视频道,费用统一是每户每月120元。央视高清影视频道正式播出后,节目增加到每天19个小时;伴音也从1月1日起改为5.1环绕声,完全可以发挥家庭影院的功能。