依马狮视听工场
依马狮原创

流媒体公司大胆尝试生成式AI

格雷厄姆·洛芙莱斯 依马狮视听工场

长期以来,流媒体一直与机器学习保持着卓有成效的关系,机器学习是AI的一个分支,通过预测结果执行任务。

流媒体公司大胆尝试生成式AI

 

长期以来,流媒体一直与机器学习保持着卓有成效的关系,机器学习是AI的一个分支,通过预测结果执行任务。我们都很熟悉的一个例子是观众推荐。我们家一直在通过Sky Stream在亚马逊Prime上看《行尸走肉》的原版系列剧。通过点赞按钮,我们告知亚马逊和天空电视台,我们喜欢这部剧。现在我们已经接近这个庞大的观看体验的尾声(很快我们就将看完全部11季的177集,并见证无数僵尸最终结束他们的生命),我们看到了衍生剧和类似剧集的建议。但是,说实话,我们需要从黑暗的反乌托邦中解脱出来,在新的一年开始时渴望一些更令人振奋的东西!

机器学习几乎触及了流媒体业务的方方面面,从观众体验(包括个性化建议和基于语音的搜索)到更高效的视频编码和压缩,以及优化的传输。AI以人类无法做到的方式分析用户参与度指标,在数据中寻找线索,并在用户可能离开时触发留住他们的策略。客户分析还用于根据观看行为投放有针对性的广告。AI时代的另一个好处是自动生成元数据。AI驱动标记远远超出手动标记的限制,实时记录关键时刻,并实现更精确的编目。

虽然这些创新意义重大,但机器学习同胞的生成式AI将为流媒体公司提供全新的机会,为观众提供全新的体验。现在你应该知道,生成式AI是AI的一种特殊形式,它可以生成内容:文本、图像、视频和音乐。生成式模型在大量数据上(如字幕、提要和剧本以及艺术品、照片和视频这样的基于词汇的信息)被训练,以便做这些工作。他们分析词汇和像素之间的联系,建立不可思议的庞大而复杂的统计相关性集,并根据一个特定词汇或一组像素将跟随另一词汇或另一组像素的概率,利用它们来创建句子、图像和视频片段。

去年,流媒体领域的三个生成式AI用例引起了我的注意,并将在2025年出现在我的关注列表上。首先是Prime Video对X-Ray的生成式增强,这是一项非常有用的功能,可以为用户提供更多出现在你刚刚暂停的屏幕上的演员阵容成员信息。现在,有了X-Ray Recaps,你将能够访问一个系列剧、一集或或一个片段中发生的事情的简短摘要,所以如果你错过了什么,你不需要倒回。它的聪明之处在于,虽然它总结了直到你按需暂停键的重要的情节转折点,但它不会剧透——至少,这是它的计划。生成式AI有产生幻觉的习惯,因此亚马逊需要密切关注如何避免低级错误。

 

流媒体公司大胆尝试生成式AI

 

第二个用例涉及一家智能电视机制造商,它正在做自联网电视机出现以来所有竞争对手都在做的事情:创造一次性低利润销售之外额外的经常性收入。中国TCL是全球第二大电视制造商,拥有一个流媒体服务。这并不奇怪,除了这个:TCLtv+,它的广告支持免费平台,正在使用生成式AI创建内容。TCL的内容加速器——TCL电影机(TCL Film Machine)上月上线了5部短片,这是TCL利用原创内容推动精准广告收入战略的一部分。

值得注意的是,对最初片子的评论并不友好,主要是针对该技术的缺点:角色会随着场景的变化而改变外貌,他们说话时把头转开,以避免对口型问题。但TCL还是在毫无顾忌地大步前进,颂扬生成式AI的怪异美学。

第三个用例是来自旧金山初创公司Fable Studio的Showrunner。它也将播放AI生成的节目,但它还为观众提供了一些额外的东西:创造自己内容的机会,控制对话和方向,并有可能自己充当角色。“我们的愿景是成为AI的Netflix,”Fable首席执行官爱德华·萨奇表示,“也许你结束正在看的电视剧的全部剧集,然后点击按钮想再制作一集。你可以说它应该是什么样,或者你可以让AI自己做。”这听起来是幻想,但有望在2025年成为现实。观众是否愿意以更个性化的东西交换大众观看体验,还有待观察。

原创声明 本篇内容为依马狮视听工场原创文章,未经授权禁止转载。详情见 转载须知
Related Video 视听微视频