微博

QQ

网格存储给媒体资产管理带来新的契机

2005-05-12 王简政 丁建英 依马狮网


【摘  要】 文中对网格技术进行了简要介绍,概述了网格存储的功能和特性,提出在媒体资产管理中将发挥不可替代的作用,并介绍了网格数据传输协议。
【关键词】 媒体资产管理 网格技术 网格存储 网格数据传输协议

    在广播电视界关注的一个热点是媒体资产管理,如今有许多方案和新技术。这里关键技术是海量媒体的压缩存储,动态管理与交互传输,为统一调度,各媒体要将素材和相关的元数据组成媒体工作流。这么大的容量和即时的处理速度谁来承担?主要侯选者可能要由第三代Internet技术网格存储,否则难以实现。信息产业界的大公司已相继公布了与网格存储目标一致的研发计划:IBM的“兰色巨人”正在构筑一项名为“Grid Computing”计划;并用它的WebSphere平台和一系列中间件实现万维网服务。惠普推出了eSpeak万维网服务平台。微软通过其.Net计划和C#语言实现万维网服务。

    一. 网格技术(Grid Technology)
    1992年在处理大量科学计算时提出了元计算(Metacomputing)的概念。①1997年定义了元计算系统。②1998年美国Argonne国家实验室Globus项目领导人Ian Foster在1998年出版的《网格:21世纪信息技术基础设施的蓝图》一书中指出:“网格是构筑在互联网上的一组新兴技术,它将高速互联网、高性能计算机、大型数据库、传感器、远程设备等融为一体,为科技人员和普通老百姓提供更多的资源、功能和交互性。互联网主要为人们提供电子邮件、网页浏览等通信功能,而网格功能则更多更强,让人们透明地使用计算、存储等其他资源。”网格技术是多种技术的融合,包括高性能的计算机技术、宽带高速网络技术、中间件技术、Web Service等。它将是21世纪信息处理的基础设施。2002年7月,他在《什么是网格?判断是否网格的三个标准》一文中,限定网格必须同时满足三个条件:(1)在非集中控制的环境中协同使用资源;(2)使用标准的、开放的和通用的协议和接口;(3)提供非平凡的服务。这三个条件非常严格,像P2P(Peer to Peer)、SUN Grid Engine、Condor、Entropia、MultiCluster等都被排除在网格之外。可以讲,巨大的全球网格GGG(Great Global Grid),包括了计算网格、数据网格(即存储网格)、信息网格、知识网格等;其目标是利用互联网把分散在不同地理位置的电脑组织成一台“虚拟的超级计算机”,实现计算资源、存储资源、通信资源、软件资源、知识资源、专家资源等的全面共享和协同。传统的互联网实现了计算机硬件的连通;Web实现了网页的连通;而网格要实现互联网上所有资源的连通,特别是应用层面的互通互连,消除信息资源孤岛,实现全面共享。所谓协同,就是很多网格节点可以共同处理同一个项目。
    网格的拓扑结构十分复杂,且网格资源交互又是动态的,为将不同资源的交互操作,网格必须建在标准接口及协议之上。目前,国际开放的网格技术标准,仅有2002年2月发布的开放的网格服务架构OGSA(Open Grid Services Architecture)(见图)。它建在互联网TCP/IP协议之上,分为四个主要层:(1)物理资源(含服务器、存储器和网络)和逻辑资源层(通用中间件如:文件系统、数据库、目录、通信、安全性、工作流管理员等);(2)Web服务层,其中OGSI规范(Open Grid Services Infrastructure)是网格服务架构的核心,它包括网格核心服务、网格程序执行服务、网格数据服务和特定领域的服务;它提供了动态的、有状态的和可管理的Web服务;(3)基于OGSA架构的网格服务层,在OGSA中,所有网格资源都被建摸为服务;(4)应用(程序)层。2004年1月20日Globus联盟,IBM和HP等又联合发布了新的网格标准草案WSRF(Web Services Resource Framework),把OGSI转换成6个用于扩展Web服务规范,网格服务与Web服务完全融合一体了。

网格存储给媒体资产管理带来新的契机
OGSA开放的网格服务架构图


    二. 网格存储(Grid Storage)
    网格存储是网格技术发展的重要组成部分,它将存储和存储引擎整合成内部相连的网格。它是通过网络以一种灵活的、透明的方式分配资源,依照单位的存储策略和程序,高效的管理资源,以保护大容量信息资产的安全。
    网格存储是以节点之间的备份为基础,可以在多重节点上进行内容管理与储存;也可以在存储环境上的多重节点进行资料转移与传输,统称为网格存储。正因为这样,它可以将网络连接存储(NAS)和存储局域网(SAN)两种不同的技术、不同的管理工具、不同的存储应用融合在一起。网格存储使存储简单化,兼容不同的网络协议,支持不同的系统平台,在各个分布系统上运行而且同步。NetApp收购了Spinnaker Network公司的专利技术Global NameSpace,可以大大简化存储系统的管理,无论存储资源部署在那里,用户都可以通过统一的卷标和域名进行访问。2004年11月16日,NetAPP在中国发布了存储架构最新软件Data ONTAP 7G,据讲它是首个动态虚拟化引擎,可将各存储部件整合成智能的、自动分配和利用存储资源、自我优化的存储池。Yahoo网站,采用了NetApp存储方案之后,仅用5人,就胜任400TB数据的维护工作。日立数据系统公司于今年5月推出了LightningNAS刀片解决方案,用户采用了日立高扩展性、高可靠的存储设备,可以把SAN和NAS的数据放在同一存储池中,将SAN和NAS整合在一起。
    在网格存储技术中,容量的增加可以通过添加更多存储设备来实现,其好处是可以采用更便宜的部件以达到更大的存储容量。惠普公司去年底收购Persist Technologies公司获得这一技术。整个结构通过一系列单元被清晰地分为存储、索引、搜索、恢复等任务。每个任务都拥有独立的X86处理器、搜索引擎、数据库、索引和管理层,以及IDE存储。这些智能单元是存储处理刀片,刀片可以联合起来产生冗余的、标准的、类似网格的计算能力和存储容量。刀片可以按需增加,系统可以随时扩展。添加的刀片会自动识别和系统化,之后被加入到总体存储池中。Persist技术包含自动恢复单元,并能实现内部镜像和刀片镜像,以及本地及远程复制,这表明系统故障可以自动恢复。
    网格存储具有以下特点:(1)模块化存储数组;(2)共通管理,可以处理所有节点上数据资源,包括数据保护、资料行动化与移植,以及供应与需求的分配;(3)共通虚拟层,这是逻辑资源池,可支持用户的各种动态交互服务;(4)简化平台与管理架构。总之,网格存储能很好的解决各类资源的自动优化,自动配置,自我保护和自动恢复等功能。这显然是媒体资产管理中所追求的目标。

    三. 网格数据传输协议
    许多地理上分布的应用程序或用户需要访问的大量数据,要求各种存储系统之间能快速而有效的传输大量的数据,一种简单的解决办法是通过建立一个客户层或网关,给用户提供统一的接口以打破由相互不匹配的存储系统协议所造成的分区。为此Globus提出了GridFTP机制,它基于标准FTP协议并对其进行了全面扩展,可实现支持多种存储系统,并提供了统一的用户访问界面。
    GridFTP建立在标准FTP协议之上,有坚实的技术基础且易于理解,易于扩展体系结构,支持一些扩展的动态发现;除了支持客户/服务器传输,还支持由第三方用户控制的二个服务器间的直接传送;由于数据及控制信道在不同套接字上相分离,这使并行及条状传输等特征更容易扩展。
    经过测试,GridFTP在二工作站通过ES-Net连接,运行Linux操作系统,具有数据读写速度达60Mb/s的RAID存储系统,最慢的网络部分是千兆以太网。当并行TCP流达7-10条时,GridFTP的通信性能可达200Mb/s。有时,当传输过程出现不同的网络时,传输性能会陡降。当网络恢复时,数据传

视听科技视频号 广告
发表评论