胡斯乱羽吧 关注:8贴子:741
  • 3回复贴,共1

【AA】消音-保留干音去掉BGM

只看楼主收藏回复


一、 消音/抓音原理
作为专业人士,吃了鸡蛋后除了要知道母鸡长什么样,还要知道母鸡的名字,已达到举一反三的目的。我们能从一首歌里将人声消掉或提取出来,主要是因为
1.人声具有一定的频段
女歌手一般是2 0 0 H z ~ 1 2 k H z , 男歌手80Hz~10kHz左右,主要的响度集中在1kHz~3kHz
左右,这个数值并不固定,男歌手里有唱得高的,如张信哲和张雨生;女歌手有唱的低的,如蔡琴和周迅;另外同一个歌手在不同的歌里有不同表现,如孙燕姿在《Venus》里会唱得比较高,《遇见》里就唱得很低。另外根据伴奏的配器不同,消音/抓音参数也不同,因此绝对没有通用的消音/抓音方法。做伴奏之前我们首先就是要确认该歌手在该歌曲里的人声频段。
2.人声一般都放在中间
这样我们消音的时候就好办了,把中间的声部降低就OK了,两边都是伴奏(没有人把主唱放在极左或极右吧?),这时会影响到同样在中间的乐器,一般是军鼓、地鼓等,这没有办法。另外有一些人声发烧碟会把人声做得很宽(如蔡琴),这类型的歌适合抓人声,不适合消伴奏。一般来说,乐器多的歌曲比较好消人声,乐器少的歌曲适合抓取人声。总而言之,消人声就是把中间像位的某一定频段给消掉;而提取人声就是把中间像位的某一定频段给提取出来。该法还可以用来消某些乐器,我们在最后会顺便提到。
二、 消音白骨爪
无论是消音还是抓音,都是对单轨进行细调,这时我们的Sonar、Cubase、Sam等多轨混音软件就力不从心了,要用到Audition或SoundForge这类以单轨编辑为主的软件。下面来介绍一个Audition里面一个比较简便同时也很强大的插件——Center Channel Extractor(中间通道提__取器)——专为消音与抓音准备的。我们在Auditio插件列表的Filters目录下找到这款插件:





1楼2012-10-05 22:38回复

    Audition已经为你设置好一些常用的数据
    了,包括提取人声和抓取人声:
    但预置的参数并不是通用的,我们来看看各参数的含义:Extract From Audio是选择所提取/抓取的声像参数,Pan为0%时就是提取/抓取中间通道,100%是极右通道,有时人声并不是在正正中间(某些Jazz),这时可以偏左或偏右一点点;Phase Degree是相位,180度为反相,此时你会现抓取人声完全没有效果。Delay是效果器起作用的延迟,可以调到-5ms。Frequency Range是选取要处理的频段,这是处理中最重要的步骤,等一下我们会讲如何来选择频段。Center Channel Level 是选择对该通道进行衰减/提升的多少,默认是衰减模式,如果消人声我们可以调到左边,即降低中间通道的音量,调到右边可以降低伴奏的音量,下面的Volume BoostMode是提升模式,调到左边以增加伴奏音量,右边增加人声音量。以上参数都是粗调,一般来说已经能得到比较满意的效果,如果还要做得更细一些我们可以继续进行下列细调:Crossover,中间通道与非中间通道的交互程度,简单的说就是中间通道的范围大小,调到100%是只处理绝对中间声像的信号,但是现在的人声一般加了混响和Delay之后会稍微宽一点点,所以我们可以调到80%~90%,让我们的中间通道宽一点点;Phase Discrimination,相位分辨,一般来说提取人声时可以调高些,消人声时可以调低些,数值在2~7之间;AmplitudeDiscrimination与AmplitudeBandwidth,这两个数值是Audition用来计算两边通道谱的平均值,然后会把该平均值做一个反相再放到中间通道,用来代替被相近的频率,调得低时Audition更多依赖频率与像位来进行抓取,调得高时更多依赖相位(Phase相位,不是像位)来抓取,如果乐器比较少,可以调得高一些,Amplitude Discrimination在1~10之间,Amplitude Bandwidth在1~20之间都可以;Spectral Decay Rate,处理信号的延迟,CPU够强可以调到零,如果暴音可以调高些。FFT Size,采样精度,当然是越高越好,不过越高占用CPU越大,我的AMD 4400+双核最多就实时跑8192,CPU与声卡ASIO性能好的朋友可以试试16384,如果你觉得调得满意了,导出时还可以选择更高。Overlays,简单的来说,越高越圆滑,占用CPU也越多,如果上面的精度够高,差别并不大。Interval Size和Windows Width会根据以上两个参数自动选择,无需细究。


    2楼2012-10-05 22:45
    回复
      三、人声分析
      了解完参数之后我们进入实际应用阶段,记住要对症下药,没有万金油。拿《Venus》这首歌
      来看,我们先要确定其人声的特征,然后才能对症下药,先打开Audition自带的参量频谱器(插件-->Filters-->Graphic Equalizer)进行分析(注意该频谱器的音质并不太理想,只能用来做分析,不建议用来做信号处理)。在这首歌里孙燕姿唱得比较高,凭经验可以初步判断出人声在250Hz~13000Hz之间,不过还是要细听进行分析,我们先把Graphic Equalizer里的段数调到30段,然后把右下角的Range调到最大(120dB,也就是正负60dB),把其他频段全部降下来,然后单独提升一个频段,以听取该频段有没有人声(起码能听到歌词):
      经过分析,我们发现最低在315Hz时能听到人声的低频,最高在12.5kHz时能听到人声(隐隐约
      约),这个人声的频段范围已经被我们确定下来了。但并不是说在Center Channel Extractor里面输入的就是该频段,一般来说要稍微收敛一点,理由:
      1. 消人声会不可避免地消除其他乐器的频段,尽量给其他乐器留出空间,别做得太绝,否则很假;
      2.在一堆乐器里对人声两端的频谱调整可能对人声影响并不大,但对伴奏可能效果比较明显;3.如果是做伴奏,虽然最后还是会留有一点人声,但卡拉OK时加入新人声时原来的人声几乎就被盖掉了,听不出来,甚至还可以当作人声的“叠加”效果,显得人声厚一些;
      4.如果是提取人声做DJ的Remix,留有一点伴奏就更没有关系了,加入强节拍的鼓点和PAD之后,原来那么一点点伴奏就完全被盖掉了。
      


      3楼2012-10-05 22:45
      回复
        转:
        http://tieba.baidu.com/p/1272913036


        5楼2012-10-05 22:46
        回复