UTAU（ボーカル）のエフェクト処理

　ボーカルは目立たせなければならず、広い周波数帯域で様々な成分が変化しながら重なる等の特徴に応じた処理も必要です。UTAUは特にエフェクターの掛け方で印象が変わると思います。UTAU（ボーカル）に必要な基本的エフェクト処理を実例で解説します。

UTAU（ボーカル）の基本的なエフェクト処理

　ボーカルは他の楽器の音に埋もれないように音圧をある程度上げておく必要があるでしょうし、周波数帯域が広いのでEQでの処理で印象が変わります。また、場合によっては気になる成分をディエッサー等で除去する必要もあるかも知れません。
　これらのリミッターとコンプレッサーでの音圧上げ・不要な成分の抑制・イコライジングはUTAUのミキシング時に大体いつも行う必要のある基本的なエフェクト処理といえるかと思います。

リミッターとコンプレッサー

　UTAUであれ、普通のボーカルであれ、歌として仕上がっていれば当然、表現として声の強弱がついている筈です。しかし意図した音楽的な強弱以外にも意外と、子音を発声する時の特に強い音圧を持った一部の成分等が突出していたりします。

　波形図で見るとそういった一瞬だけ強い部分がひげの様に飛び出していたりします。それが過剰なダイナミクスとなって平均音圧を下げてしまいます。ですから過剰なダイナミクスを削減して音圧を上げる必要があります。

　しかし音楽的に必要なダイナミクスまで削減してしまうと、のっぺりしたつまらない歌になってしまうので注意が必要です。ボーカルのトラック単体で処理した後マスタリングで全体の音圧も調整するでしょうから、その辺も考慮して行います。

　どの程度ダイナミクスを抑えるかは機械的な数値に頼るよりその都度自分の感覚で調整するべきだと思いますが、一応の目安として書いておくと、コンプレッサーは圧縮率を2.0：1くらいで最大でも－6ｄB以内程度のリダクションにとどめて、アタックとリリースで不自然さを感じない様に調整します。リミッターはピークの先端だけを少し抑える感じで。

　以前にUTAUの入力方法の記事で作ったサンプルを実際にリミッターとコンプレッサーで音圧を上げたのがこちらになります。

ディエッサーまたはバンドコンプレッサー

　ボーカルには歯擦音と呼ばれる音が混ざっている事があります。歯擦音いうのはサ行、あるいはタ行やカ行でも出たりしますが、これらの子音を発声する時に歯の間を空気が抜ける「シュッ」という音で、あまり強く聞こえると耳障りだったりします。これを抑える為のディエッサーというエフェクターもあります。

　以前のVSTエフェクターの記事で紹介した中だと、win64が無いのですが、「the fish filtets」に含まれる「SPITFISH」がそうです。win64の方なら私自身使ってみた事が無いのですがフリーでは「Dead Duck Software」というデベロッパーの「Free Effect Bundle」にディエッサーが含まれているみたいです。ダウンロードはDead Duck Softwareのページ　で。

　ただ、ディエッサーは上記の通り歯擦音等の高域周波数にある耳障りな成分を抑えるエフェクターですが、仕組みとしては特定の周波数帯域だけに掛けるコンプレッサーです。ですからマルチバンドのコンプレッサーでも代用出来ます。以前紹介したTDR NOVAがマルチバンドコンプレッサーとして使えて結構便利です。

TDR　NOVAでの不要成分抑制のやり方

　TDR NOVAで（ディエッサーの場合も考え方は同じですが）気になる成分をカットするやり方としては、まずパラメトリックEQのQ値を調整して狭くしたピークバンドで部分的にブーストし、それを再生しながら左右に動かしてみます。そうやって抑えたい成分が何Hzくらいにあるかを探して、そこを圧縮します。

　歯擦音は人によって何Hzくらいかは違いますが概ね4～8kHzのどこかに有り、男性ボーカルは女性ボーカルよりも低めの周波数にあります。ちなみに先のサンプルでやってみた設定が下の画像になります。

　7kHzくらいのⅣが歯擦音を抑えるコンプレッサー設定です。歯擦音は子音の一部ですので短時間で突出していますのでコンプレッサーで抑えますが歯擦音以外のこの帯域の声の倍音はあまり抑えたくないので少しだけゲインを持ち上げて戻してます。４kHz付近のⅢは部分的に声に混ざるビリビリした感じの音を抑えるための設定です。これはEQで抑えるだけでも良いのですがこの方がスッキリするのでこうしてます。

　個人的な感覚ですがこの４kHz付近の成分はボーカルに限らず他の楽器、例えばシンバルとかでも４kHz付近が強調されると同じ様なビリビリ感があってやや耳障りな印象になります。特に根拠は無く私が何となくそう思っているだけなのですが、UTAU化すると高域が少し強調されてこの４kHz付近の成分が気になる事があるのかなぁと考えています。

　先の音声に画像の設定で処理をしたのがこちらになります。

　ここでは高域の耳障りな成分を抑える為だけにNOVAの2バンドを使い、EQやコンプレッサーは別に処理していますが、可能であれば他のバンドも使ってコンプレッサーやEQと兼ねても良いです。

EQ

　人の声は広い周波数帯域の倍音を含んでいますので、どの辺りの成分をカットし、どこを強めるのか、によって印象が変わってきます。

　上の画像は今回のサンプルに対してのEQ処理ですが、人によって、特に男性ボーカルか女性ボーカルかによって対象成分の周波数が変わってきたりはするでしょうが、ある程度一般的な参考になると思います。

　先の不要成分をカットした音声に上の画像の調整でEQ処理したのがこちらになります。

では、各成分を順に解説していきます。

超低域（150Hz未満）

　人の声の成分として意味が有るのは200Hｚ付近からで150Hzより下は声に何かが被さった様な感じに聞こえ、無い方がすっきりします。他の楽器との兼ね合いを考えても、バスドラやベースの邪魔になるだけなので、150Hz未満の成分が入っていた場合は余程特殊な理由が無い限り、ハイパスフィルターを置いてカットする方向で考えた方が良いと思います。

200Hz付近

　男性ボーカルだとどうか分かりませんが、今回のサンプルをスペアナで見ても、最も低いピークが300～400Hzくらいにあって200Hz付近はその裾野といった所で、元々あまり強くは入っていません。しかしこの200Hｚ付近を持ち上げると声が太くなった感じがします。

　上げるかどうかは意図次第ですが、私の場合は安定感が増す気がして画像の様にハイパスフィルターのレゾナンスで上げる事が多いです。

300～400Hz

　先にも書きましたが、今回の場合も最も低いピークが300～400Hｚにあって、一般的にもこの辺の成分は割と強めである事が多いと思います。ここがあまり強すぎるとごちゃごちゃして濁った感じに聞こえますので、少しカットするとスッキリする場合が多いです。

500～650Hz

　低域の上の方という位置づけかと思います。上げれば落ち着きのあるやや重い感じの声でカットすると軽くなるといったところでしょうか。上の1～1.5kHzくらいの成分との対比でバランスをとる感じで調整すると分かりやすいと思います。

1～1.5kHzくらい

　ラジオボイスという言葉を聞いた事が有るでしょうか？安いラジオの小さいスピーカーで鳴らした様な音の意味です。再生できる周波数帯域が狭く低域・高域の再生が弱いとそういう音になるのですが、意図してそういう風に調整する場合もあります。この1～1.5kHz付近を残して周辺を弱めるとそのラジオボイスになり、この辺の成分が強すぎるだけでもラジオボイスっぽく聞こえます。それを意図するのなら良いのですが、そうでない場合は広がりのない安っぽい声という事になってしまうので、適度にカットして調整してください。

　また、声質によって鼻にかかったような声に聞こえる場合もこの辺の成分をカットすると緩和される時があります。

2～3kHz

　今回の調整では弄っていませんが、声のアグレッシブな強さみたいなのがこの2～3kHz付近の強さで決まってきます。ですから穏やかなしっとりした声にしたいなら抑え気味に、周囲の楽器の音に埋もれそうだったり、強い声にしたいなら上げると良いです。

4ｋHz付近

　不要成分カットの所でも書いたように、金属的なビリビリ感が気になったらカットして下さい。その場合4kHz丁度か少し下くらいで、範囲は狭くて大丈夫だと思います。

6～8kHz

　6～8kHzくらいの高めの倍音は声の艶というか、伸びやかな感じがして適度に上げると綺麗に聞こえる事が多いです。

10kHz以上

　ちなみに健康診断のヘッドホンで音を聞く聴力検査の高い方のピーという音が10kHzで、この辺まで聞こえたら日常生活は問題ないそうです。ですから年齢にもよりますが大体の人は10kHzまでは聞こえるでしょうが10kHｚを超えてどの辺まで聞こえるかは人によって違います。いずれにしても10kHz以上というのは聞こえる限界近くになってきますので、強すぎると聞いていて疲れるが無いと寂しいといった感じでしょうか。

その他のエフェクト処理

　以上のリミッターとコンプレッサーでの音圧上げ・不要な成分の抑制・イコライジングがボーカルの基本的なエフェクト処理だと思いますが、その他にボーカルに掛ける一般的というか汎用性の高いエフェクトはディレイとリバーブでしょうか。

　空間系のリバーブは他の楽器と一緒にセンドリターンで掛けると思いますが、それ以上に余韻の膨らみが欲しければ更にプレートリバーブを挿して掛けるか、ディレイを150～200msくらいのディレイタイムで微かに掛けるかです。

　ディレイの使い方にはもう一つ30～50msのディレイタイムでロングディレイより少し強めに掛けるショートディレイがありますが、これは声に厚みを持たせる為で少し目的が違う様な気がします。そして同じ目的の延長線上に歪み系やモジュレーション系があると思うのですが、この辺りは汎用的というよりも曲調やアレンジに合わせた演出的な感じでしょうか。

最後に

　実は今回の記事を書き始めた当初は最後に少し書いた歪み系とモジュレーション系まで書くつもりだったのですが、長くなってきたので2回に分けて次回に回します。今回の記事と合わせて次回も読んで頂ければうれしいです。