
在全球无障碍宣传日(GAAD)期间,Audinate 公布了一项引人关注的合作成果:荷兰国家剧院(Het Nationale Theater)与 XRAI 推出的 AI 字幕智能眼镜LiveText,将在今年秋季正式用于现场演出。在这项跨领域合作中,Dante 扮演着关键的底层音频角色,为系统的实时性与可靠性提供技术支撑。

注:图片来源XRAI Glass 博客
本文将从技术视角出发,简要梳理 LiveText 项目背后的 Dante 音频链路逻辑,提炼关键要点,帮助您快速理解 Dante 在实时字幕场景中的作用,包括多路音频采集、低时延传输与时钟同步等核心能力,为类似的现场语音处理与无障碍应用提供参考。
01 实时字幕的核心难点——音频链路
在实时字幕场景中,音频链路是系统顺利运行的重要基础。为了让 AI 能识别不同演员的语音并及时生成字幕,系统需要:
- 获得多路独立的演员音频。
- 将音频稳定传输至 AI 处理端。
- 保持声道间的一致性和时间精度。
在 LiveText 项目中,Dante 为这些环节提供了可依赖的网络化音频传输能力,使整体流程更具稳定性,为字幕的实时呈现打下基础。
02 Dante 提供可靠的实时音频基础
在 LiveText 系统中,Dante 的作用主要体现在三个方面:
每位演员都有独立声道,AI 需要分辨“谁在说话”。Dante 可以在现有网络中传输大量独立通道,适配不同规模的演出需求。
现场演出对延迟非常敏感,Dante 能在标准 IP 网络中提供可预期的低延迟传输,使 AI 生成字幕更接近“实时体验”。
要让字幕对上演员,音频时间线必须一致。Dante 的时钟同步机制确保各设备的音频通道保持稳定一致性。这些特性构成了字幕系统的基础条件,使 AI 转写与翻译可以在现场环境中更平稳地运行。

03 为何这次合作值得关注?
LiveText 是一次典型的“音频 + AI + 显示设备”的跨界应用。Dante 在其中的价值并不是“独占性的”,而是“稳定提供基础能力”。
- 让系统能够处理多路独立音频输入。
- 让字幕服务接近实时。
- 让角色标注更准确。
这意味着 Dante 正从传统的音频传输场景,延伸到新的可访问性服务、AI 助理和多语言现场体验中。
04 可拓展到更多现场场景
基于 LiveText 项目所呈现的技术路径,类似的实时语音处理方案在未来具备应用潜力的领域包括:
- 多语言会议与交流活动
- 无障碍与辅助类演出服务
- 展览馆、公共设施的语音说明
- 教学、演示等需要同步语音信息的场景
随着实时语音处理与 AI 技术的使用逐渐增多,专业场景对稳定、高质量音频输入的关注度也在提升。在此类工作流程中,Dante 能够提供一致、网络化的音频传输基础,有助于系统更高效地完成语音采集与后续处理。

这份技术本身越隐蔽,体验就越自然,在 LiveText 项目中,观众只看到字幕的效果;但在幕后稳定的音频流、清晰的声道管理、可靠的低延迟传输,都来自 Dante 作为底层架构的支持。我们关注的正是这一点:
让更多前沿体验在看不见 Dante 的地方,被 Dante 悄悄推动。
附件 | 点击下载