微博

QQ

媒体智能——将AI与恰当的人力投入相结合

2025-06-16 马尔滕·沃维斯特 依马狮视听工场


你可能认为,人工智能(AI)将预示着媒体和娱乐行业一股热潮的来临。而当娱乐业专业人士试图尝试生成式AI或传统AI时,他们面临着极大的阻力。

如此,为什么娱乐行业的大牌没有在积极拥抱AI呢?如何将其转化为机遇?

 

媒体智能——将AI与恰当的人力投入相结合

 

人工智能的问题是什么?

市场上大多数交钥匙AI解决方案开发时都没有考虑到专业目的,并且可能表现出差的峰值信噪比(PSNR)值。通俗地说,被错误识别的图像和文字的数量太高,以至于该技术无法以这种方式使用。纠正结果的后期编辑有时比一开始就手动处理转录要更多的时间。

实施AI的一种简单质朴的方法是使用裸机算法进行图像识别或自动语音转录。即使是目前最好的自动语音识别(ASR)引擎也会犯错误,原因是自然语言是不断发展的(当新的概念和词语诞生时,引擎必须在它们被识别之前受到训练),而且自然语言有同义词和同音亦义词。当使用图像识别时,情况往往会变得更糟、更复杂。

更具体地说,当今大多数交钥匙AI解决方案的问题在于,它们提供的结果既不准确又不完整。这个问题对要求高准确度的记者和纪录片制作者来说尤其痛苦,因为输出的内容往往缺乏必要的细节和准确性。低总峰值信噪比(PSNR)意味着预期的输出被大量的误判所掩盖,从而导致非相关搜索结果过载和搜索效率低下。相关的结果一出现,记者和编辑制作人(在纪录片的背景下)就不得不花费数小时的手工工作,试图找到合适的相关镜头。

这一问题的根源在于AI系统的设计并没有专门考虑到媒体制作的严格要求。因此,它们缺乏这种专业任务所需的稳健性和精细的准确度。虽然AI模型更多更好的训练对于提高性能是必要的,但这并不是一个完整的解决方案。

由于现实世界数据的复杂性和不可预测性,无论训练技术如何进步,AI仍然天生易出错。一种包括极其明确的训练、上下文理解和纠错机制的更智能方法,对于在高风险环境中实现所需的可靠性和准确性至关重要。

 

什么是“媒体智能”?

当试图解决与AI相关的问题时,最好的建议是“切忌好高骛远,试图一次解决所有问题”。潜在目标(图像或文字)的数据集越大,就越有可能在结果集内发现误判。因此,最好尝试限制潜在目标集(当使用人脸识别、动物分类检测、语言识别等时)。利用来自制作的任何可用的预先存在数据,例如,你可以从剧本中提取的演员或人员列表、任何制作简报或摄制日程表,考虑可能目标的尽可能小的数据集。

当涉及到图像识别时,应该考虑到任何(!)媒体制作过程都将包含大量有价值和丰富的信息,这些信息以来自计划或前期制作、日志数据或制作报告的制作文档的形式存在。将这些数据与图像相结合,创建图像中人物的准确描述,比使用AI改造这些数据更便宜、更准确。

如果您执行一个流程,在这个流程中,您回收利用来自前期制作的任何可用的数据,通过您的数据模型以一个或多个允许值表或主题词表的形式解析这些数据,并将此数据集用作语音或图像识别的输入,那么结果的识别率或完整性将会高得多。通过随后剔除置信度较低的条目,误判的数量将接近于零。

我们建议在单一时间线上协调结果,并建立多模态索引。不只是一些词语编索引,而是要确保区分说话人、面孔、地点、主题参考等,并根据场景变化或镜头切换将这些内容组织在一条时间线上。结果现形,作为一个搜索引擎,以前所未有的效率支持编辑决策过程。

 

它实际上是如何工作的?

每个媒体制作环境都包含大量可自由获取的信息,这些信息可用于提高AI系统输出的质量。想想包含关键名和短语的制作文件(脚本或剧本、摄制日程表、制作简报、制作报告等)。在有剧本的娱乐活动中,包括电影、电视剧和连续剧,剧本,顾名思义,包含了所有重要的参考资料。

在恰当的AI实施中,这些预先存在的信息被用作AI系统的输入,它将优先查找上述的关键名和短语。此外,关键是要考虑用户的意图,并使用这些信息来过滤和协调AI系统的输出。因此,输出可以同时调至百分百完整和准确。

这种方法让您可以建立一个迭代法,系统地进一步增加结果的相关性和可用性。这就是概念主题词表发挥关键作用的地方。通过微调您的命名约定(以档案管理员、编辑制作人、字幕员或类似人员的身份),您正在创建一个思维导图或本体,它被以其最简单的形式扩展为分类标准或主题词表。相应地这将被用于第一阶段,通过操作搜索引擎(如使用标签来定义高级搜索查询),通过用户界面进行内容导航,和/或创建您库中内容分组,过滤AI产生的输出。

 

有什么好处?

在媒体制作中恰当利用AI(或“媒体智能”)有两个重要优点。

  • 它使原创内容制作者(如记者、编辑制作者)能够以与使用传统方法同样的成本更快地处理更多的材料,在传统方法中,一旦你试图处理大量的原材料,成本就会上涨。
  • 过程自动化帮助广播公司或分销商以边际成本创建多个版本,即在复制同一母版的若干编辑场合,媒体智能接管编辑助理的角色。

 

这将如何影响知识工作者?

恰当使用AI不仅不会使知识工作者的作用过时,而是会给他们带来明显的竞争优势。此优势就是可信的实现、可靠的输出和结果的总体可用性。

例如,世界上不少新闻编辑部采用AI平台自动为新闻报道创建字幕。这些新闻通常是简短的内容,一个典型的新闻编辑部每月要处理多达10000条新闻。从组织的角度来看,依靠字幕公司来完成这么大的数量是不可能的。现在,由于事实内容相对容易用作AI字幕的输入,因此几乎不需要后期编辑,这些新闻编辑部可以腾出20到30名全职员工,他们现在可以创建更多内容,而不是花时间手动创建字幕。

AI 人工智能 媒体智能

视听科技视频号 广告
发表评论