浅谈2021 总台春晚新媒体三维声 音频直播制作系统

本文对首次在新媒体端直播的三维声春晚音频制作系统进行解析,包括三维声的监听环境与主系统搭建、主要 话筒介绍、三维声制作等,全面展现了在新媒体端提升观众沉浸式体验的制作过程。

摘要

除夕夜当晚,广大观众从多平台多角度多渠道享受到了一场视听盛宴——2021 年中央广播电视总台春节联欢晚会。为了提升观众的沉浸式体验,总台首次尝试春晚在新媒体客户端(央视文艺)采用三维声的直播方式。下面,笔者主要介绍临时搭建在中央广播电视总台复兴路办公区360 平米音乐录音棚内的春晚新媒体三维声直播制作系统。

目前,三维声在业界中的制作方法较为多样,如Dolby Atmos、Auro-3D、DTS:X 等等。本次2021 春晚新媒体三维声节目,是参照我们自己的三维声监听标准(5.1+4H)进行制作的。

组合 1.jpg

一 系统搭建

1. 搭建监听环境

在扬声器的布局方面,我们严格按照《中华人民共和国广播电影电视行业标准GY/T 316—2018 用于节目制作的先进声音系统》为标准。在监听方面,本次三维声制作相比5.1 环绕声制作增加了顶部的Ltf(左上前)、Rtf(右上前)、Ltr(左上后)、Rtr(右上后) 4 个声道。为此,需要建立好标准的监听环境。我们先搭建起监听环境所需的支撑框架,再由专业工程师精准计算定位监听音箱的位置与角度。

扬声器布局具体数值如下:

◆左扬声器(L):水平角为30°;

◆右扬声器(R):水平角为-30°;

◆中置扬声器(C):水平角为0°;

◆低频效果扬声器(LFE):无需角度;

◆左环扬声器(Ls)水平角为+110°;

◆右环扬声器(Rs)水平角为-110°;

◆左上前扬声器(Ltf)水平角为:30°,俯仰角为:30°;

◆右上前扬声器(Rtf)水平角为:-30°,俯仰角为:30°;

◆左上后扬声器(Ltr)水平角为:110°,俯仰角为:30°;

◆右上后扬声器(Rtr)水平角为:-110°,俯仰角为30°;扬声器的监听半径为:1.9 米。

除低频效果外的所有扬声器型号均为Genelec8341,低频效果扬声器型号为Genelec 7360。

2. 搭建制作主系统

在搭建监听环境的同时,调音台及周边系统也在规划好的位置进行安装调试。本次系统的主调音台为LAWO MC256,备调音台为LAWO MC236,音频系统还包含了两台核心交换机、核心处理机箱及接口机箱。

春晚的主制作区位于中央广播电视总台复兴路办公区的一号演播厅(以下简称一号厅)。在音频方面,一号厅承担着立体声、环绕声的制作、播出、分发信号的任务。同时,本次三维声播出信号也经由一号厅加嵌器送至总控。因此本系统信号传输分成两个部分进行介绍:第一部分是三维声制作区系统内部路由,第二部分是三维声制作区与一号厅之间的路由。第一部分:三维声制作系统内部路由,从一号厅送来的2 路主备MADI 信号分别送入主备MADI 矩阵,再由主备MADI 矩阵分别送至主备调音台。这样保证了主备调音台能同时接收到主备MADI 信号,任何单一链路出现问题都不会对制作造成大的影响。主备调音台制作完成后的三维声PGM 播出信号也同时送回主备MADI 矩阵,因为主备MADI 矩阵具备快速选择输入信号源送至输出端的功能,所以通过控制页面可对矩阵输出信号进行切换选择,从而实现主备调音台任何单一设备出现问题时,可以迅速恢复主备路的三维声PGM 输出。以上系统的备份方案基本避免了三维声制作区单点故障带来的隐患,但因为春晚的特殊性,我们还制定了灾备措施。考虑了当整个三维声制作系统无法正常工作时,将一号厅主系统的1 组环绕声PGM 信号送至主编码器,恢复主路PGM 输出。

第二部分:三维声制作区与一号厅立柜机房之间铺设了主、备光端传输通路。主通路光端机为2 台Riedel Compact PRO,备通路光端机为2 台LAWOV_remote 4, 共传输了2 路主备MADI 信号、1 路SDI PGM 信号(在三维声制作区解码后实时监测三维声PGM 播出信号)、1 路SDI 监看信号、2 路主备BB 同步信号以及通话信号。MADI 信号输入部分取自一号厅(主会场)音频系统的核心机箱,其中包括:主备环绕声播出PGM 信号、一号厅内架设的1 支Schoeps ORTF-3D 话筒8 路信号和4 对SchoepsORTF 立体声话筒群信号、一号厅主备EVS 播放器信号,经由光端机送至主备MADI 矩阵,再分配给主备调音台。MADI 信号输出部分为三维声制作区制作完成的三维声PGM 信号,经由主备MADI 矩阵送至光端机,传输到一号厅立柜机房后接入主备实时编码设备进行高效压缩编码(EAC3 格式),之后嵌入一号厅主备PGM 加嵌器的CH9/10 声道(CH1-8 声道为环绕声+ 立体声),再经由总控IPDM 分发到新媒体集成发布平台,最后传输至用户端即央视文艺App。

image.png

在搭建系统这部分的最后,有一些朋友不太了解电视音频技术工作者的工作内容。看到他们满身大汗地在搬运设备,看到他们也会在设备机房举着各种线缆进行安装,还会看到彩排前站到舞台中间一会发出高音一会发出低音的奇怪行为等等,不能了解他们除了操作调音台之外工作的重要性。其实电视音频工作者要做很多种类细致的工作。比如:了解节目的形式内容,规划需使用话筒的种类和数量,细致计算传输线缆种类和数量,设计信号的路由,考虑系统的冗余,科学地结合环境来测试现场的声场情况,测试现场其他无线设备频率对无线话筒传输的影响等工程类的工作。


二 节目制作

系统搭建完成后具体的节目制作就要倚仗调音台、话筒及周边设备了。简单来说,我们使用环绕声PGM 信号,混合现场的三维声话筒信号进行制作。现场架设的三维声话筒有两种类型,一是SchoepsORTF-3D(如图5),它由两组四个超心形话筒组成,分别为一组Schoeps CCM 41×4,和一组SchoepsCCM 41V×4。这八只话筒分别拾取的是L、R、Ls、Rs、Ltf、Rtf、Ltr、Rtr 8 个方位的效果声,构建了春晚直播现场的三维声基础声场。

image.png

image.png

二是两组ORTF 话筒群(如图6),它是由4 只Schoeps ORTF 组成,拾取的是Ltf、Rtf、Ltr 、Rtr 4个方位的效果声。

image.png

image.png

调音台上图形式3D PAN(如图7),能对每一路信号实时调整X、Y、Z 轴,直观地显示出它在声场中的位置。播出时,我们使用三维声矢量表来监看信号情况(如图8),利用它包含的电平表、响度表、下层和上层的声像表和相位表来把握播出标准。周边系统中,还有以下两台辅助设备:

image.png

image.png

◆ WAVES 插件服务器(如图9),与调音台核心机箱通过MADI 连接,再由一台笔记本通过网络访问并进行控制。在三维声制作时,我们把需要添加效果的通路发送至服务器,进行内部运算后返回调音台。按照这样的方式,利用了它对部分信号进行各类处理,例如:降噪、均衡等。在降噪处理时,我们利用X-Noise 插件,对现场一些持续的噪声进行采样,并以此建立噪声样本,再通过调节阈值、衰减量等参数进行适度的降噪处理。

image.png

◆ Linear Acoustic 三维声上混处理器( 如图10),同样使用MADI 与主调音台连接,利用网络对其进行操作控制。在输入源为立体声、5.1 环绕声时,可以通过它实时上混成5.1.4 的三维声。在运算上混的过程中,有多种上混参数可调,比如低音的分频点、声场前与后的比例系数、梳状滤波器等等。每一项参数我们都进行了仔细的比较监听,最终找到了合适的参数组合,对春晚节目中的插播短片进行了上混处理。

image.png

在制作这一层面上说,音频工作者还要发挥艺术层面的特长,一架钢琴、一把吉他、一组人声等等,不但要考虑声源本身的物理特性,而且要顾忌声源与声源本身的艺术特性,最后还要把握好声源混合后带来不同的艺术感。所以对进入调音台每一路声音要进行均衡、压缩、扩展、效果等一系列的操作。对整体来说,要满足现场观众的耳朵,要迁就台上演员的耳朵,更要充分考虑电视机前的耳朵,这都需要专业的科学理论和庞大的技术系统做支撑。其实音频工作涉及了工程类与艺术类两个类别的领域,实属不易。

最后,我们来看看终端用户的实际体验。在这里,就不能不提到头部相关的传递函数(Head-ResponseTransfer Function)。简单地来说,在日常生活中当人的双耳听到某个声源发出的声音时,是可以判断声源来自空间的哪个方位的,那是依靠人耳对声音信号的分析系统。如果把分析系统里的这组可以描述空间信息的滤波器计算出来,那么就能还原来自空间这个方位的声音信号。如果我们有空间所有方位到达双耳的滤波器组,就能得到一个滤波矩阵,从而还原来自整个空间方位的声音信号。回讲到本次的终端央视文艺App 中,当三维声PGM 音频编码信号传输到央视文艺App 时,客户端会自动检测用户的耳机状态,当检测到未使用耳机时将通过手机外放播放立体声;当检测到使用耳机并在App 播放界面中点选三维声按键图标时,App 会将三维声音频编码进行实时解码、渲染重放,利用上述提到的头部相关的传递函数(HRTF),通过普通立体声耳机来模拟各声道的声音从不同方位传达到耳朵,包括水平层声道和顶部声道,从而实现具有沉浸式包围感的三维声听音体验。

image.png


三 总结

本次新媒体端的春晚三维声直播体现了传统广电与新媒体的融合,赋予观众全新的体验。比起视觉的绚丽多彩,三维声的呈现能给人更深度沉浸感。从1983 年第一届春晚开始,从单声道起步,立体声、环绕声,直至今年的首次三维声直播,30 多年来我们的脚步从未停歇。在未来的三维声制作中,笔者相信会有更丰富的声音元素加入其中,例如:在一场武术的节目中,声音会跟随威亚上演员在空中的不同位置变化而变化,从听感上与视觉感官上保持逻辑上的一致。虽然,电视音频制作与电影后期的声音制作有着很大的区别,比如前者是有实时制作的需求、信号分配等多环节流程等等。这些都是客观存在的因素,那么就会导致两者在制作效果上有着一定差异。不过,为了能给观众提升沉浸式体验,在条件允许的情况,可以从节目制作的前期着手做准备,能提前制作出符合节目逻辑的丰富声音元素等方法。虽然这样的工作流程需要考虑到声画统一、与节目导演进行前期的沟通、多次排练等一系列的工作,但这也是我们要发展三维声播出中需要克服的困难。在电视端的三维声制作正处在初级阶段,研究学习的路还很长,希望我们音频工作者在不断的努力和学习下,能给广大的观众带来更加美妙的声音。

转载请注明来源:《现代电视技术》 作者:中央广播电视总台 郝志雨