行业资讯 2006.03.09

基于MPEG-7内容整合的应用研究

赵季伟魏洪波依马狮网

    【内容提要】本文试图通过信息整合向内容整合延伸的逻辑分析，寻求基于MPEG-7标准语言的数据逻辑，以构建面向视频对象的描述模型，进而打通数据检索与视频检索的逻辑通道，并在媒体资产管理系统中得到应用。
    【关键词】辛迪加　视频BPR　元素层整合　元数据　描述子
　　
    一. 问题的提出
    随着媒体资产管理被广泛接受，信息整合的关键技术——面向对象的检索机制受到普遍关注。特别是新媒体，迫切期待以方便快捷的方式，占有极大丰富的内容资源。
    自从有了《广播电视节目资料分类法》的广电行业指导性技术文件（GY/Z 199－2004），在广电的内容归档和检索方面有了重大突破。然而，当依据GY/Z 199建成媒体资产管理系统以后，运行的经验告诉人们：工作流出现了拥塞。这不仅表现在按照“图书馆学”和“档案学”原理，在人工录入“资料分类”的编目上耗人耗力，同时，也表现在为了使用而全方位占有视频资料的检索中，索取的资料还不能完整地表达创意者的构思意图。这是因为，“图书馆学”或“档案学”对于内容的描述和刻画远没有视频图像那样深刻，比如在“图书馆学”或“档案学”上，并没有依据视觉整合原理，对图像的纹理结构、色彩分布、运动轨迹、GOP序列、图像标识等等实现深层描述，而这些内容却在视觉效果和内容描述中充当了极为重要的元素，也是极具视频特征的数据信息。因而，只能认为“图书馆学”或“档案学”的分类归档是关于视频图像内容描述的子集。
    再从IT的“整合之路”看，从信息整合到内容整合的历程经过了10多年。1993年哈佛出版了迈克尔·哈默（Michael Hammer）与担任CSC Index管理顾问公司董事长的James Champy博士合著的《再造企业（Reengineering the Corporation）》，并以“管理革命的宣言”作为副标题，掀起了研究世界性企业信息整合的浪潮。随后，IBM在业务流程重组（Business Process Reengineering，BPR）上寻找突破口，以5大品牌整合工具、6大“粒度”精细化的整合价值，提供了从信息整合，到内容整合，再到流程整合的一系列企业信息化原则与理念。当“富媒体”概念进入数字视频，并以“辛迪加（Syndicate）”产业平台再造新媒体的时候，虽然全国广电开始认同了数字媒体内容整合的概念，频频谈论内容整合之大计。但是，叫响“整合”的毕竟是IT，而IT毕竟还是面对文件级数据整合的研究，所提出的内容管理系统（Content Management Systems，CMS），还只能从广义上适应企业营销的内容需求。即便是影响整个图像检索界的IBM QBIC（Query By Image Content，IBM）系列商用产品，也不能深入到视频流内部，以跨媒体的思路去理解视频流级的VA内容整合。而理论界的研究成果，如哥伦比亚大学的Visual SEEK查询系统以及麻省理工学院媒体实验室开发的PhotoBook检索系统等，虽然是面向视频、基于流样本的研究，但还未能进入面向新媒体业务（对象）的实际应用。
    还有进入千禧年的视频领域前沿，当时的领军人Sony率先以“改革工作流程”的口号，推出了视频归档存储系统，接着又有了“Work Smart，Work Sony!”此刻，迈克尔·哈默的信息整合飓风终于刮到了视频领域，开始了BPR的实质性应用。然而，BPR的“清除、简化、整合、自动化”（Eliminate、Simplify、Integrate、Automate，ESIA）的流程原则，是基于信息化的内容整合，一方面当时的电视媒体还没能进入依托网络“再造传媒信息化”的愿望和现实，另一方面即便是硬件的归档存储Sony也不擅长（已经停产），就更不必谈充分表现软体结构的内容整合了。而今天，“网络的力量”已经把传统电视媒体推向了数字新媒体，今非昔比的“成本、质量、服务、速度”，为广电再造媒体、再造流程、直至再造视频整合，产生了前所未有的巨大推动力。
    因此，一方面研究跨媒体内容整合不仅十分迫切，而且极为现实（全球都在行动），另一方面仅仅依靠IT的整合概念还不够，还需将其精髓通过“概念移植”，产生适用于广电流程的媒体内容整合的概念和理念，以至整合成为整套的视频数字序列和P2P的检索机制。

    二. 视频内容整合基本概念
    信息整合是将业务应用系统的信息数据进行有机的整合集成，从而实现对业务应用信息的数据共享过程；AV的内容整合是将广播服务多种业务应用系统的核心数据进行有机的整合集成，从而对广电所拥有的根本优势——视频节目内容，实现核心数据的共享过程；更为具体化的视觉整合是指将电视媒体的文化产品通过统一的视觉设计，以达到内容整合和信息传达的意象形态，使公众产生一致的认同感和价值观，从而创造最佳经营环境的一种创作和经营策略；而数据整合则是基于数据的内容整合。因而，就整合的定义而言，其外延特征应该是：信息整合≥内容整合≥视觉整合≥数据整合。由此而构成视频整合的完整定义。
    解决视频整合问题的基本方法有两种：面向功能的设计和面向对象的设计。面向功能的特征是“一事一议”，无穷尽的功能既包括能够预测到的功能，也包括未来不可预测的功能，那么，必然将流程的路径变得越来越不清晰，而系统则越来越复杂，并不可操控；面向对象的特征是“一群（类）一议”，如果把业务作为基础对象，将出现很有限的对象类，特别是把视频作为对象研究时，不仅量级更低，而且所使用规范与标准也就随之变得更简明，更清晰。这就是出现面向对象MPEG-7标准的根本原因。更为重要的是：对象类的收敛将轻松地找到约束条件，并在关联性约束条件的引领下，向对象目标收敛。

图1 面向视频内容整合的“金字塔”概念模型

    图1是“视频内容整合金字塔”的概念模型，它表达了视频内容整合的层次化结构，以及向目标方向上经整合运动所发生的收敛趋势。虽然在各个不同层次上收敛的约束条件不尽相同，但总的收敛过程是一致的，从而使内容整合更加趋向逻辑化和商业化。
    在数字媒体中，前3层“EPG、串联单、脚本”的收敛条件类似，多表现于视觉整合的多重性，见长于文化色彩、内容创意和商业价值的视觉设计，但在技术层面，仍能透过视觉整合表达对内容整合的充分约束条件：
    电子节目指南（Electronic Program Guide，EPG）——频道层的EPG引导了市场消费，还能通过上行通道反馈市场信息，直至调整频道规划的经营策略。同时，要使EPG准确引导收视，就必须与频道播出串联单（PO）同步，通过二者的数据整合，准时（指时间准）、准确（指内容描述准）地引导消费，才能提高视频QoS。因而，是EPG捆绑了内容，整合了频道，使频道成为内容商品的收敛条件。
    播出串联单（Planned Order，PO）——节目层的PO整合了内容构成频道，而且PO还整合了节目请领清单（Picking List，PL）、物料（节目、素材）出库清单（Item Record，IR）和配送资源计划（Distribution Resource Planning，DRP）的逻辑关系，同时引入利润、订户、物（节目）流等诸方面的生产链，使配送链上的节目内容库、节目实体购入单、销售用户订单等等数据，整合集成为指令集的工作流程驱动，包括采集、存储、制作、转码、迁移、上载、服务等的连续工作流程。
    节目脚本（Film Script，FS）——素材层的收敛条件在于FS，它在创意性思维的支持下，通过媒体资产管理系统的素材检索，以其最小粒度（直至场景、镜头、分镜头与图像帧）的内容检索实现片段的回调，既以FS共享丰富的素材资源，创作多样化的内容艺术，也以FS关联PL与IR，在“辛迪加”节目制作工厂BPR流水线上预置原料的配送，加速收敛成为独立节目，从而进入节目层的媒体贸易。
    最后的元素层可视为“视频内容整合金字塔”的“基座”，在此之上构建了前3层，从而使元素层成为视频整合的基础之基础。而面向对象的应用没有“金字塔”的基础，就没有稳固的“金字塔”，既包括塔尖的业务对象，