在英国广播公司(BBC)今年的“春日观察”’(Springwatch)节目期间,BBC的研发团队用AI来监控用于拍摄野生动物明星的远程摄像机。
该研发团队在“春日观察”’摄像机拍摄的视频中用上了一个物体识别系统。它基于运行在Darknet开源机器学习框架上的YOLO神经网络,探测和定位场景中的动物。

团队训练了一个识别鸟类和哺乳类动物的网络,它能够以足够快的速度运行,找到并实时跟踪现场视频中的动物。该工具生成的数据意味着团队确信场景中出现了动物,而不是其它移动物体。使用这种机器学习方法,该研发团队能够从知道“场景中发生了什么事”变成“动物在场景中做了什么”。
在一篇博文中,该研发团队表示,将动作和动物探测工具结合起来,可以让他们探测视频中动物进入或在场景中移动的“事件”。BBC研发部的高级研究工程师罗伯特·道斯说:“我们存储了与事件发生的时序及内容相关的数据,我们将此作为提供给制作团队成员的时间线。”

制作团队然后可以使用这个时间线浏览某一摄像机的视频中的活动。“我们还提供活动的剪辑视频,其中一个是便于查看内容的小预览,另一个是以原始质量记录的,有几秒钟的活动两端的额外视频。它可以作为视频立即下载,观看、共享,并导入到编辑包中,”道斯补充道。
图像也从视频中提取出来,呈现事件中被探测到的动物,并提供给用户。这些图像还会被传送到另一个机器学习系统,该系统试图对动物的种类进行分类。“此图像分类系统使用卷积神经网络(CNN),明确地说是Inception V3模型。如果该系统确信某一动物的种类,它就会给照片贴上标签,并将标签添加到用户界面。添加这一额外的信息层是为了让用户更容易找到他们想要寻找的视频——特别是如果一台摄像机可以捕捉到多个不同的物种的话,”道斯说道。
该研发团队表示,他们正在努力使该系统更加智能,以便它能提供更多有关其产生的视频片段的有用信息。它打算在今年晚些时候的“秋日观察”(Autumnwatch)中再次测试该系统。