依马狮视听工场
依马狮原创

能产生显著影响的人工智能:生成式人工智能提升可发现性

埃里克·张 依马狮视听工场

尽管AI工具因生成惊艳的视频而备受瞩目,但真正的机遇在于将AI应用于摄取点,元数据可在此点结构化,进入系统准备就绪状态,并能立即应用于制作、编辑及资产管理系统。

能产生显著影响的人工智能:生成式人工智能提升可发现性

 

我们一致认为,内容只有在可被使用时才具备价值,而当今(乃至可预见的未来)内容使用几乎完全依赖元数据。尽管AI工具因生成惊艳的视频而备受瞩目,但真正的机遇在于将AI应用于摄取点,元数据可在此点结构化,进入系统准备就绪状态,并能立即应用于制作、编辑及资产管理系统。

对于那些管理着包含诸如Avid等老牌公司到如Iconik和Mimir等新公司系统的混合环境的机构而言,面临的挑战是一致的:如何一次性生成可操作的元数据,并使其在每个地方都能使用。

答案不仅需要转录处理,更需要精心安排具备系统感知能力、支持自动化的元数据处理管道。

 

摄取时元数据挑战

如今的摄取工作流程必须能够适应各种不同的格式和信号类型,包括SDI、SRT、ST 2110以及基于文件的分发。这些输入信号到来时往往没有标准化的元数据,甚至更糟糕的是,其携带的元数据与它所进入的制作环境不兼容。

当您的制作、编辑或资产管理系统无法解释这些元数据时,资产就会变得不可见。它们可能存在于共享存储器或数据库中,但实际上那些依靠搜索、标签和分类开展工作的同事是无法使用它们的。

这不仅仅是一个可用性问题;它更是一个系统瓶颈——一个导致重复工作、不必要的存储膨胀以及从未用过的资源。手动更新元数据可能会拖慢创作过程,而其最大的弊端在于会丧失未利用资源所带来的盈利机会。

 

现实是混合的逻辑体系

设想这样一个媒体运作模式:编辑团队在Avid Media Composer中制作长报道,数字发布团队使用iconik进行简报和社交内容制作,而管理层正计划转到像Mimir这样的云原生媒体资产管理系统。若缺乏元数据的互操作性,这些系统就会成为孤岛,各自为政。

工程师在这个环境中面临下面的挑战:

  • 如何在具有不同数据结构的系统之间标准化元数据格式?
  • 如何不将敏感数据暴露给外部AI服务的条件下自动化标记?
  • 如何构建一个能够在平台迁移中继续存在的元数据层?

解决这些问题始于摄取阶段。在摄取过程中,若能利用一个受控制、可定制的AI引擎生成元数据,那么就有可能为编辑和资产管理系统预填充结构化、经过验证且一致的元数据。

 

隐私须知

对于每一家专业的媒体公司而言,安全与隐私都是至关重要的。他们需要的是能够在本地运行、专门针对媒体的能够生成多种类型的基于文本的元数据的AI引擎,这些元数据如:

  • 用于全文索引与搜索的转录文本
  • 用于特定节目时段背景的子素材摘要
  • 用于编目与归档标记的文件级摘要
  • 用于编辑筛选的情感标签
  • 用于命名实体与事件的关键词提取

由于这类AI完全运行于本地基础设施中,因此无需云访问,也不会泄露敏感内容,而且也不会产生基于使用情况的不可预测成本。输出可以按照您系统的摄取要求进行格式化,不会存在您的数据被扫描或用于训练公共数据集的风险。

结果是一种摄取工作流程——不仅能提供转码的媒体,还能提供一个完整且零风险的元数据包,可即时跨平台使用。

 

构建一个系统感知的元数据管道

关键的工程任务不仅仅是创建元数据。而是要实现元数据的一致性。AI生成的元数据必须:

  • 符合标准,确保各种摄取和编辑系统上的兼容性
  • 场景感知,从而使摘要和标签能够反映资产的预期用途
  • 映射到特定系统的格式,包括Avid所用AAF或基于云的资产管理器所用的JSON/XML格式
  • 通过持久标识符链接,确保在编辑过程和平台迁移过程中具有可追溯性

如果操作得当,将带来诸多效率提升。编辑团队可以按短语或关键词进行搜索,无需手动转录。数字团队能够找到与气氛、事件或主题相匹配的内容。工程师可集成新平台,迁移后无需更新元数据。

最为重要的是,内容一经摄取就能立即被发现和使用,而不是休眠于存储器中等待被人工处理(甚至可能永不被处理)。

 

可发现性工程

从工程的角度来看,这涉及到将元数据从后期处理任务转变为摄取原生功能。当AI被直接嵌入到摄取工作流程时,元数据的生成会变得确定、可重复且安全。这种流水线处理不仅分发媒体资产,还能分发遍布整个制作栈的有索引、可搜索且分类的内容。

这不仅仅是智能自动化之举。它是为实现高速、规模化和跨平台利用在媒体工作流程工程设计方面的一个根本性变革。在可发现性驱动内容再利用、播出速度和盈利的行业背景下,元数据已不再是可有可无的基础资料,而是系统设计的核心要素。

原创声明 本篇内容为依马狮视听工场原创文章,未经授权禁止转载。详情见 转载须知
Related Video 视听微视频