行业资讯 2025.11.13

重大研究发现：AI生成的新闻摘要中存在大量错误

依马狮视听工场

英国广播公司（BBC）与欧洲广播联盟（EBU）联合开展的一项开创性研究发现，由AI助理生成的新闻摘要存在严重问题。

英国广播公司（BBC）与欧洲广播联盟（EBU）联合开展的一项开创性研究发现，由AI助理生成的新闻摘要存在严重问题。

研究人员发现，在近一半（45%）的AI生成的新闻摘要中，至少存在一个重大错误。此外，一些AI工具的表现甚至更差，尽管所有工具都存在明显的问题。谷歌的Gemini表现最差，在76%的响应中都存在严重问题，这一比例是其它助理的两倍多，主要是因为其信息来源方面的表现不佳。

这一发现引发了人们对消费者广泛使用由AI生成的新闻摘要以及新闻机构计划使用这些摘要这一做法的严重质疑。

像谷歌、脸书和亚马逊这样的科技巨头一直在投巨资于AI，部分原因在于AI生成的摘要有可能取代现有的搜索工具，并为他们提供谷歌目前所享有的那种巨大的广告收入。

该研究还因其研究的规模和范围而备受关注，它由EBU协调，由BBC牵头。

该研究涉及18个国家的22家公共服务媒体机构。来自参与公共服务媒体的专业记者对来自ChatGPT、Copilot、Gemini和 Perplexity的超过3000份回复按照关键标准进行了评估，这些标准包括准确性、信息来源、观点与事实的不同以及背景信息等。

该研究还发现，AI助理助手的表现实际上比此前BBC的一项研究要稍好一些。

在第二个重要结论中，该研究指出：“尽管在BBC与BBC的对比测试中有所改善，但多市场研究显示错误仍普遍存在，而且这些错误是系统性的，涵盖了所有语言、助理和相关组织。总体而言，45% 的响应至少包含了一项任何类型的严重问题。信息来源是导致严重问题的最主要因素（占 31%）。”

该研究指出：“对于发布商而言，尤为令人担忧的是那些导致歪曲报道的来源错误。在此最新的多市场研究中，Gemini在来源方面的错误率尤其高：其响应中有72% 存在严重的来源问题。而其它助理的这一比例均低于 25%。”