Audition已经为你设置好一些常用的数据
了,包括提取人声和抓取人声:
但预置的参数并不是通用的,我们来看看各参数的含义:Extract From Audio是选择所提取/抓取的声像参数,Pan为0%时就是提取/抓取中间通道,100%是极右通道,有时人声并不是在正正中间(某些Jazz),这时可以偏左或偏右一点点;Phase Degree是相位,180度为反相,此时你会现抓取人声完全没有效果。Delay是效果器起作用的延迟,可以调到-5ms。Frequency Range是选取要处理的频段,这是处理中最重要的步骤,等一下我们会讲如何来选择频段。Center Channel Level 是选择对该通道进行衰减/提升的多少,默认是衰减模式,如果消人声我们可以调到左边,即降低中间通道的音量,调到右边可以降低伴奏的音量,下面的Volume BoostMode是提升模式,调到左边以增加伴奏音量,右边增加人声音量。以上参数都是粗调,一般来说已经能得到比较满意的效果,如果还要做得更细一些我们可以继续进行下列细调:Crossover,中间通道与非中间通道的交互程度,简单的说就是中间通道的范围大小,调到100%是只处理绝对中间声像的信号,但是现在的人声一般加了混响和Delay之后会稍微宽一点点,所以我们可以调到80%~90%,让我们的中间通道宽一点点;Phase Discrimination,相位分辨,一般来说提取人声时可以调高些,消人声时可以调低些,数值在2~7之间;AmplitudeDiscrimination与AmplitudeBandwidth,这两个数值是Audition用来计算两边通道谱的平均值,然后会把该平均值做一个反相再放到中间通道,用来代替被相近的频率,调得低时Audition更多依赖频率与像位来进行抓取,调得高时更多依赖相位(Phase相位,不是像位)来抓取,如果乐器比较少,可以调得高一些,Amplitude Discrimination在1~10之间,Amplitude Bandwidth在1~20之间都可以;Spectral Decay Rate,处理信号的延迟,CPU够强可以调到零,如果暴音可以调高些。FFT Size,采样精度,当然是越高越好,不过越高占用CPU越大,我的AMD 4400+双核最多就实时跑8192,CPU与声卡ASIO性能好的朋友可以试试16384,如果你觉得调得满意了,导出时还可以选择更高。Overlays,简单的来说,越高越圆滑,占用CPU也越多,如果上面的精度够高,差别并不大。Interval Size和Windows Width会根据以上两个参数自动选择,无需细究。
三、人声分析
了解完参数之后我们进入实际应用阶段,记住要对症下药,没有万金油。拿《Venus》这首歌
来看,我们先要确定其人声的特征,然后才能对症下药,先打开Audition自带的参量频谱器(插件-->Filters-->Graphic Equalizer)进行分析(注意该频谱器的音质并不太理想,只能用来做分析,不建议用来做信号处理)。在这首歌里孙燕姿唱得比较高,凭经验可以初步判断出人声在250Hz~13000Hz之间,不过还是要细听进行分析,我们先把Graphic Equalizer里的段数调到30段,然后把右下角的Range调到最大(120dB,也就是正负60dB),把其他频段全部降下来,然后单独提升一个频段,以听取该频段有没有人声(起码能听到歌词):
经过分析,我们发现最低在315Hz时能听到人声的低频,最高在12.5kHz时能听到人声(隐隐约
约),这个人声的频段范围已经被我们确定下来了。但并不是说在Center Channel Extractor里面输入的就是该频段,一般来说要稍微收敛一点,理由:
1. 消人声会不可避免地消除其他乐器的频段,尽量给其他乐器留出空间,别做得太绝,否则很假;
2.在一堆乐器里对人声两端的频谱调整可能对人声影响并不大,但对伴奏可能效果比较明显;3.如果是做伴奏,虽然最后还是会留有一点人声,但卡拉OK时加入新人声时原来的人声几乎就被盖掉了,听不出来,甚至还可以当作人声的“叠加”效果,显得人声厚一些;
4.如果是提取人声做DJ的Remix,留有一点伴奏就更没有关系了,加入强节拍的鼓点和PAD之后,原来那么一点点伴奏就完全被盖掉了。