
汪晓琦
深圳市雅乐实业有限公司副总经理/技术总监
汪晓琦,深圳雅乐音响技术总监、副总经理。90年代初步入音频行业,长期致力于音频技术发展的研究,至今从事扩声领域相关工作二十余年。在多家企业任职技术顾问。长期关注音频领域最先进的技术发展,重视前沿技术的理论研究及应用。连续多年保持与国际领先的数字音频企业间的技术交流,参与相关数字音频技术的学习交流,目前正在主持设计国内最先进最大型的全AVB(音视频桥)架构会议系统。
演讲题目:第五代数字化音频云技术AVB的特点及应用
演讲提纲
音频系统自诞生到现在,自最原始的纯模拟技术,逐步发展,到现在已经经历了:纯模拟——数模混合——纯数字——网络化——云技术等五个阶段。从封闭的纯音频领域已经扩展到了IT行业,成为了一个开放的技术。音频扩声领域的云技术必然会改变行业的发展。同时,随着时代的发展,终端用户对音频产品的相关要求也在改变。这些改变所影响到的将不仅仅是音频产品的制造业,其下游的工程公司,用户工作模式也将受到其影响。本演讲内容将通过对第五代数字化音频AVB云技术的应用讲解,来展望与探讨未来数年音频行业的发展动向。
演讲词:
汪晓琦:大家好,我是深圳雅乐汪晓琦,先跟大家做一个简单的交流,我们公司的名字一种是雅乐(le),一种是雅乐(yue),两种都对。这两个都跟声音有关。我们公司做的也是声音的事情。我今天跟大家交流的主题是“第五代数字化音频云技术AVB的特点及应用”。音频系统自从诞生到现在,从单机版到网络化,经历了好几五代的变革,目前正在朝云发展。云这个东西离我们好像很遥远,其实已经到了我们身边。音频从过去的纯音频走向(IP),随着时代的发展,音频领域对各个环节的要求也各不相同了,从制造厂商从用户各自的理解都不一样,甚至于我们未来的工作模式,人员管理模式都讲受它的影响。今天我再次抛砖引玉,跟大家一起来分享一下我们音频行业的发展。
首先我们回顾一下我们现有的音频技术能做一些什么。人民大会堂更是历史悠久,那么我们可以把它归归为统一类,它都是在一个房间内完成的。可是,当一个大型的系统出现的时候,这种技术就难以应对了,比如我的系统需要跨越一栋楼一个小区甚至更远的地方,这个时候我们必然会引进网络的概念或者叫远程传输。那远程传输的概念和我们的…哪个更悠久呢?其实也不相上下。最早的是什么呢?电压广播,几乎所有的农村都曾经经历过这个时代。但是这个是不是我们未来持续要使用的技术?它能否应对我们未来一直发展的需求呢?我们在这里举了一个案例。这个案例跟大家一起交流一下,看看能否用这些现有的技术来满足。第一条有多用户扩生藏所,有多个会议中心几多功能环境;跨区域、范围广,这个网络技术早就解决了。各分会场之间存在的信号交互,这个就于上面一个多了一个问题。为什么呢?因为交互来交互去品质会下降。为了保证交互的质量,就只能用数字化传输。与其他系统的交叉工作,这个是在第三个的基础上引入了外乎信号。第四个,存在部分项目停机维护但是与它关联的项目还要继续运行,在第三条就讲了,如果要高品质的保证传输,我们自订数字化,但是数字化在过去的案例中有一个特点,整个系统是联在一起的,如果某一个停机就意味着其他的受影响。假如说一栋楼甚至两栋楼连在一起,当中一个坏了怎么办?你要等到晚上之后第二天再使用。你既然有临时的,我就做一套预备的管完了。已建成的项目需要增加更复杂的功能,包括独立功能和交互功能,系统资源远远超过原先配置设备的DSP资源。假如我在原始设计的时候已经固化了,我还想再增加,唯一的办法就是增加设备。第八个开始出现难点了,我多个项目都在用,但是没有那么多专业的人,假设我现在有50间会场,像我们这间会场那边好几个兄弟在工作,我每个会场派三四个人去,那得多少人。最麻烦的是最后一条,我们希望对成本进行总量控制。总量控制的概念我们可以拆借开,可以包含第一次建设投入的成本,可以包含未来维护的成本。可以包含我们将来运行时候的人力成本,甚至还要包含在使用过程中的学习成本。早上的演讲过程中提到关于人力成本这块。这个问题我们暂时抛开。作为我们最后的解答。
现在我们回顾一下我们音频发展的历程。我们大概可以把技术分为几个代,第一代是纯模拟架构。在过去模拟时代,均衡器压缩器,往往可能是你调好被人摸了几下就还不了原了。优点是有的,操作非常直观,缺点就是容易误操作。到了第二代的时候出现了数模混合,一直到现在很多场合都在使用。表面上数字化了,但是只是一部分数字化,在使用的过程中还有很多连接是采用模拟的。它就适合很多专业的场所。它的优点是在模拟设备的直观融合数字设备的便利化。但是它的拓展有局限性,无法进行更多的通道传输。当然大家有很多专家说音频扩展很容易的,无非多一些光感,这些是可以,但是这些可以的同时会造成其他的问题,比如你所增加的接口内部的大小还是无法调和的。我们比较清晰的看到,在这一代技术当中已经出现了一些智能化的征兆。到了第三代技术我们认为是属于全数字化了。它是从设备的起点到终端完全是用数字化,除了话筒转进来是AD,带来的好处是我们所有的处理全部集中在设备的核心当中,而且可以进行大量的逻辑化功能,而这种逻辑化功能是过去第二代甚至第一代绝对无法形成的。当然这个用了很多年,正是因为用了很多年,我们在它的应用过程中可以发现它可以带来一些我们第二代技术完全做不到的项目。给大家带来一个案例。这个是全国最大的一个交通指挥中心,当中的宽度就达到30米,高度6米。它是深圳、珠海、惠州和香港的海、陆、空的交通监管。在这个指挥中心最重要的信息标准不是视频不是图象,而是指挥着的内容是最关键的。那么怎么样做到呢?就需要我们数字化的结构和智能化的结构。关于智能化,我们可能不太更多的结合在一起。在音频领域的智能化,我们可能想到更多的是ADC、ANC等等,它是对语言声音的一个判断,这么一个过程,如果是按照过去的传统来说,可能很简单,接上一个调音台,但是自动化的功能就无法完成了。在这里我简单的把这个系统的后台剪切了一部分的模块给大家看看,在这个图片上每一台模块,这个是一小部分,整个系统。这个系统它就能真正做到一个智能化,当然这个也不是我们今天讨论的重点。再往后刚才说的第三代技术我们认为可以放在一个网络时代,前面我们所设想,假如这个会场50个会议室,我每个会议室都安排一套设备,这个成本非常高,很多酒店开始做中央系统的概念,前台只是负责一些应用,它的优点很明显。但是缺点也很明显,你的DSP的前期规划做不到,你的后期不可想象。它的传输品质会下降,但是在数字里面是有延时的,这种技术它的瓶颈越来越导致我们觉得它的拓展受到一定限制。还有一个就是数字化便利的各自为政。在后面我们将会有列表来做对比。随着后面我们更希望的技术就出现了,是AVB云,AVB大家听过很多年了。但是这么多年,只闻其声不见其云,到底什么是AVB什么是云,我有幸目前在设置一个大型的AVB云的系统,AVB本身我认为它是一个高速桥梁,它负责把我们所有的系统送到云的核心,比如我们现在的传输技术当中有,其他的技术有些非公开的协议,可能做得更多或者更少,但是总体来说大概都是有一定的限制。AVB更重要的是它的延时,这样结合我们原先的中央系统的概念,完全不需要考虑延时的问题了。AVB是一项比较新的技术。可以告诉大家一个消息,我刚刚得知的,大概在三周之前AVB的协会已经正式通过了AVB的协议。这个协议是什么概念呢?协议就是我们的一个语言,好象说我们现在讲普通话,那我们之间的通讯就是畅通的,假如说在座的只能听英语或者日语,对不起,我们的协议就不通。AVB最早起源是在IT行业,它是由IT行业提出来的。我所听到的一个故事是跟汽车有关的,比如说无人驾驶这个概念大家也听到过很多年,那么要做到无人驾驶需要什么条件?需要一堆传感器一堆摄象头,按照过去的方式。更好的标准是我们尽量少的线路来获得更好的驾驶。在这个情况下有关的企业推出了这么一个技术,也就是我们的SHURE等等大家都来支持AVB,比如我们原来讲的…是一个封闭的东西,它封闭的好处是它的兼容性,不管是谁家的…都是提高产品。但是正是因为它的不兼容,所以导致它的发展受局限,到目前为止也有50来家支持,它的发展感觉没有太好。在AVB之前,有很多家协议,每家协议都有自己的特点,但是有一个共同的有点就是封闭。封闭的结果是什么呢?我们想象一个问题,我们现在用的电脑,用的最多的系统就是W…S,音频系统的数字传播,用户在选择的时候只能要么全是A的产品,要么是B的产品。我们现在希望未来的发展就是有能够结合起来,把大家的优点共同发展起来。我们回顾一下CobraNet,它的特点双向32路音频,,每一级5.33ms延时,CAT5接口。我把这些协议做了一个简单的对比,可能数字不一定完整。在传输内容上,过去的协议是支持音频,而AVB是支持音频加视频的,在连接上过去的专业协议只支持自己的设备对等设备的连接,而AVB走交换机,在传输上我们希望是做到更远的传输,否则只在一个机房内只是把两台或者多台及其合并在一起。传输延时和传输距离结合起来,在这个表上我们很容易看到AVB是远远优于其他的技术,他可以在10级设备之间只有两毫秒的延时。比如说CobraNet就不能穿过陆游。未来AVB的发展一定是走路由,走路由以为着什么?深圳和广州可以同时召开AVB的会议。刚才是拿几个网络和专业网络做对比,现在我想把CobraNet和AVB作对比更有意义,AVB能做到一个实实的传输,但是CobraNet做不到。还有一个很大的发展空间是视频这一块,有视频厂家开始支持AVB,也就是在未来的发展中,我们的传输技术可以用一根网络把所有的东西传完。就像早期提到2.0,在AVB这一块这个问题会很容易解决,最关键的问题是最后两项,版税的成本。前不久我看到一些资料,我认为它可以把专业和我们在我们整个系统中,我们过去一致认为在演艺行业如果用AVB的设备可能会导致品质下降,在AVB的工作中,如果用专业设备调音台可能会导致操作繁琐,但是结合在一起会多一些选择,当然AVB是未来更加优秀的选择。在版税这一块是这样的,我们可以想象一个问题,假如我们的苹果手机不是做一个底价而是高高在上,比如它卖到2万台,仍然很多人买,但是没有现在购买的人多。以我们CobraNet或者是…我想从技术上是肯定可以的,但是为什么不做这么多呢?他做多会导致他的接口成本上升,它的成本上升会导致他的工程上它的下游用户不愿意接受,不愿意接受推广就受到阻塞,它现在就是让更多的人更容易接受它,AVB是什么概念?是一个通讯的基础软件,无论是你的话筒还是什么都可以在这个基础上做。比如香港大学就有一个李昂(音),他的印象就是AVB的印象,在这个中我只需要在中央系统那一个网线就可以了。CobraNet的短版它也是我们过去一些网络协议的短版,延时、版税、通道、视频,现在我们可以想象一下,我们刚刚提到的案例,假如我们又要保证高品质的信息,我们只能用数字,如果我们把全部的设备装在中央机房,经过处理再回到这里,那这个延时量肯定超过我们演讲着的延时。用AVB技术,它能够保证你最多不超过2毫秒,我觉得这个是很好的。
现在我回到我们前面案例的一个解答,我这里给大家演示了一个基本的电路。这里是我们的DSP的核心,这个接口卡可以满足演出或者更大型的项目,在这个项目中,比如这个酒店,现在我们开这个会的时候,我们不需要这么辛苦,假如我们需要用专业演说,同样的道理,我们可以把调音台接到这里,当然有人会问我们有这个调控台了我要这个干嘛。这个差一点点,我们知道经常出现火灾,出现很多大家不愿意看到的结果,那么那些问题究竟怎么产生的?难道他们真的没有消防吗?我认为不是这样。实际上他们在出现事故的时候有一个共同的情况,他们在做商业演出或者大型的汇报,消防的信号的喇叭根本不足以覆盖我们的音响的。利用我们的主音响来控制。这个就是说我们的传输必须进入这个系统,当然我们有更大型的,还有另外一种选择,就是我们在这里加上一个带DSP的主机,这个主机可以很它之间做交换,为什么要做交换?这就是我们关于云的问题,刚才讲这么多,讲的都是AVB,我认为它只是一个桥梁,它是搭建我们的起点和终点之间的高速公路。真正的云是什么?云是一个资源共享。在这个系统当中,如果这里是一个接口,它的资源来自于DSP,如果我们这个系统当中的DSP需要扩大我们的功能,它从哪里来?在云的概念里面告诉大家,它的资源是由这个来提供的。也就是说前端服务器和DSP不够的时候,它无所谓,它从后端来取,我的前端只需要知道你要干什么事,我们前端的任何应用,你只需要知道你想做什么就可以了,你不需要考虑资源的多少。而且在云的技术里面,我的资源可以无限增加。我现在是在设计的一个项目当中就用到30多台这种核心服务器,这种核心服务器相当于多少呢?一台这种服务器相当于普通的四台,30台的意思就相当于100台普通服务器,如果加上云的技术以后,我们多数情况下可能有一半甚至三分之一在用,我的资源也就用到一半,当我的DSP用到100台,那么我的云就相当于200、300台DSP,换句话说我们同样功能的情况下,我们的投入也是过去的二分之一到三分之一。在我们这个系统中,因为AVB可以传输420度音频,所以我们任何的信号传输只需要一条网络就够了,同时因为我们云的资源是无限量配置的,所以我们可以预先或者后期补偿。比如说我现在需要一个AC,比如说我们现在在一个场所,当我讲话的时候我希望这个音乐声自动降下来,我讲完之后音乐声再涨上去,安全智能化的技术它可以自动提升,在云这里,你不用担心,我有足够的后台来满足你的需求。我们最终的愿景是我们所有的终端全部连接到云里面来,在云里面我们可以进行任何的数据,无论是音频还是控制,我们所需要的仅仅是一条网络,由此可见我们的音频技术可以这样简单划分,纯模拟——数模混合——纯数字——网络化和云。在我们未来的发展中,云可以改变我们生活。
现在回到我们前面的题目,一到四条是我们过去的技术很容易解决的,第五条可能要增加某些临时的扩声项目,这个网络可以是有限的。但是因为我们可以穿透路由,所以AVB的未来是无线的,也可以做到。第六个,我们后台有云,你只管提出你的要求,我的DSP无限量共享给你。第七个,我需要专人监管,怎么办?我们的一条网线可以传420,我不需要到前台去。而且你没有太多专业人员的情况下,这时候需要真正的音频的智能化,比如说在我们现在这个会议室,我完全可以做到用AO来运用,我们到时间灯光音响可以自动开启。当我们演讲结束,比如15分钟或者半个小时,没有人讲话,系统可以认为会议结束,自动关机了。而且跟我们的灯光完全结合在一起。我们现在最强调的就是人的作用,我在后面有一个成本的换算。我们在进行这种级别的设定的时候,大家可能会考虑到一个问题,你既然提到无人守,你既然提到那么复杂,我没有专业人员怎么办?你既然提出道路规划区域,那我区域太远怎么办?我们第一个是用户体,用户体就是我们在现场使用和操作的工作人员所需要的级别,比如我现在在这里讲话,我就属于用户,在用户级别可以非常有限的操作设备,这个技术是第三代技术就可以实现的。监控级指的是我们现场的服务人员,他可以了解到,但是不会去干涉。管理级是我们的设备级别。工程师级是我们系统顶层的编程人员,它可以设定我们所有的权限。我们有时候有些重要的会议,如果你底层有了某些工程师知道之后,会不会导致我们的某些信息泄露。假如我们现在做的一个项目,里面有一个会议室是需要绝对保密的,我们这时候涉及到一个核心工程师级,是我们对于某些功能模块进行加工处理,处理完之后,所有的人员只能应用,而不能对它进行改变,包括工程师级。有了这五个级别之后,我们未来的系统搭建可以保证万无一失。现在回过头来看看我们对音频的概念,我们过去的音频发展历程中,最早是以专业扩声技术,那个年代我们所追求的声音品质是最重要的,所有的专业本领都是取决于调音台上的工夫,在他们的眼里可能是精益求精。我们可以大概把他们划分为专业中的专业。这种场所现在用得多不多?我认为逐渐减少,比如演播厅、电视台。但是到了我们这个环节,我们属于固定安装了,也就是所谓AVB的领域,在我们这个环节当中话筒的声音略微差一点,我认为是可以接受的,我不需要做到歌唱家的品质。对于多数用户来说,功能、稳定性、学习成本、智能化是最重要的。刚刚讲到学习成本,学习成本的代价远远大于我们的使用成本。早上的演讲就讲过,可能一个项目下来,可能他们的会议准备了,计划好了,但是由于AVB准备,我们会浪费一些时间,比如像今天这种活动,我们需要花很多时间做准备,这种成本是不可忽略的,它是非常高昂的。讲到这里,我回忆一下我曾经看过的一个广告,我非常欣赏。当时广告的幅面是一个非常漂亮的女孩子,她要准备一个演讲活动,按照过去的方法是需要一对壮汉来台设备,当时的广告是一个女孩子轻轻拉着这个设备就完了,那个广告到现在为止,我的印象非常深刻。当时的广告告诉我,我们需要专业的品质但是我们不需要专业的学习过程和应用过程。对于我们的终端用户来说,应用成本简便利于维护是最重要的。我在这里给大家举一个例子,我们公司刚刚完工的一个项目,大家可以参观深圳中心书城,它有两个公开的大讲台,每天每周都有很多的演讲活动。它过去在南区大概是在四年前,就这么一个结构,它的核心是一个调音台,所以无论大型演出或者是小型讲话一定要通过调音台,所以每次搞活动工作人员不胜其烦,除此之外至少要通过一段时间的培训,要熟悉调音台的东西。我们最近给它做成了一个项目它的北区,同时满足了它的两种方案,第一种普通的音频直接就出台了,他们所需要做的事情就是拿一把钥匙拿出话筒开机就可以了。当你需要专业演出的时候怎么办呢?按照过去可能需要一堆的跳线器,现在也不需要了。我们的话筒就转移到调音台上,由调音台控制。专业的模式我们也坚固了,无人指使的时候就智能化。这其中一个最大的问题可能还不是品质,最大的问题是人力成本。人力成本到底高到什么程度?我们进行了换算,假如是一个普通不得调音员,底薪按3年计算,连续十年,这十年之间他没有跳槽,也没有别的奖金的情况下,你支付给这个人的成本是45万。假如说我这个设备再复杂一点,我需要工程师级的或者更高一级的管理人员,是什么样的结果?估计5000,每四年一次升职加薪,他的人力成本最少110万。在一个大型系统中,我少用一个这样的人,我就少投入110万,我少用一个普通的音频人员就是45万。假如说我这个项目需要50个人操作,怎么办?这个人力成本很大。在这个时候你的智能化就非常有必要。未来的AVB,对于生产厂家来说,它是一个简单的标准,这个标准给大家提供一个更好的机会,这个机会会给大家提供一个更好的市场,市场应用越不多数就导致成本越低。一个简单的标准带来的是效率。就好象我前面提到的W…我们现在程序大家只考虑用就可以了,不需要考虑兼容器。一个简单的标准意味着是兼容器,每个厂家都有自己的优势,我们只要做到兼容,我们可以为一个项目提供最好的性价比。对于工程商来说,未来的云和数字化技术也有更好的用处。现在的工程商可能在发展过程中碰到的最大瓶颈就是人的问题,特别是人才是可遇不可求求的。特别是从基础建设到软件设计到管理,全方位贯穿的人才更是可遇不可求求。我们在寻找人才的时候,你如果把你的项目寄托在人上,你可以两层规划,你负责施工的人按图施工,所有的系统建设都有一个标准化,那么我们把人划分之后,我们这个人力成本就下降了。除此之外,我们未来卖的是什么呢?我们很多企业到现在为止还在局限于卖产品,卖劳动力,这种企业在竞争过程中觉得非常累,因为它经常会讲到我这个品牌在投标过程中能不能去卡住别人。未来的竞争当中我希望我们的企业可以晋升到卖技术卖概念。我们这种编程的结果会导致我们的音频系统可以玩出给别人完全不一样的花样来。或者音频这部分大家现在感受还不深,那么在公共领域,不同的编程人员编的项目是截然不同的。大家未来可以升级到卖概念,卖技术。开车是一件非常不容易的事情,在我们小的时候一个企业的汽车司机是一个很不错的职业。到了30年代汽车的应用得到很大的发展,到了40年代汽车应用得到更快的发展,到现在为止70岁的老人家都可以开车,当年的福特肯定不知道现在汽车技术的后台变得这么进步。我们也相信我们的音频技术未来的发展一定可以寻着汽车发展的道路做得越来越好,今后我们也一定会跨越汽车领域所要跨越的坎。数字领域的云是新时代的起点,让我们用户感觉不到技术的存在,同时享受到我们技术的优点,这才是我们的价值所在。我们认为一个新的舞台正在升起。大展宏图的时代正在升起。我期待与大家共同创造未来。
谢谢大家。