2018年07月30日
映像作品において、そのグレードを決定づける大きな要素となるのが「音声」だ。ノイズを除いたり、人の声を聴きやすくしたり、音を極めるための機材選びやテクニックを、映像作家/音楽家の大須賀淳氏が解説。
「音」は怖くない
大須賀淳氏(映像作家/音楽家)
CP+という写真のイベントにも関わらず、映像の、なかでも音に関するセミナーという、不思議な場所においでいただきありがとうございます。写真の話はほとんどしませんが、皆さんにはできるだけ多くのものを持って帰っていただけたらと思っています。
さて、この中にすでに仕事で動画を撮っているという方はどれくらいいらっしゃるのでしょうか。 かなり多いですね。ではその中で、「音」は苦手だ、「音」の収録はちょっと怖いと感じている方はどれくらいいらっしゃるのでしょう? なるほど、やはり多いですね。
今日はそういった皆さんのために、これだけ知っておけば、音が怖くなくなる、さらには楽しむことができるようになるお話をしていこうと思います。というわけで今回は、「音を整えて一眼ムービーのクオリティアップ」というお題でお話をさせていただきます。
申し遅れました。私はスタジオねこやなぎを主宰し、映像作家・音楽家をやっております大須賀淳と申します。普段は企業などのコンテンツ制作、雑誌や書籍の執筆、そして音に関する講師業、さらには映像作品制作などをしております。
本題に入る前に、本日のセミナーでどんな知識が得られるのか、という点をまとめてみました。
まずは少規模スタッフでの収録についてです。デジタル一眼ムービーは小規模のスタッフでクオリティの高い映像を撮影できますが、音に関してもそれができるようになるというわけです。2つ目はさまざまな音の中でも、とくに「人の声」をきれいに収録する方法を紹介します。そして3つ目は、その声とBGMをどうすればいい感じにミックスできるのか、というところを学んでいただければと思っています。
話の流れは3部構成になっていまして、まず最初に「整音」をテーマに音に関する基礎的な話を、次に収録についてを、そして最後にアドビの「Premiere Pro」や「Audition」といったアプリを使いながら実際の作業の仕方について紹介していきたいと思います。
「整音」の目的とは
ではまず「整音」についてお話ししたいと思います。整音というのはその文字の通り、音を整えるということなんですが、それを理解する前に、“音とは何か”というところからです。音は空気の振動が伝わって、耳に届いた時点で音と認識されるものです。叩いたらその振動が音になるわけです。物理的にはそれが音の正体ですが、もう少し掘り下げると、音は3つの要素でできているということができます。「音量」「音高」「音色」です。
まず「音量」は、音の大きさですね。先程、音は振動だとお話ししましたが、その波の振幅の大きさによって大小が決まります。2つ目の「音高」は音の高さのことで、音程などと呼ぶこともありますね。では音の高い低いは何と関係しているのかというと、これは波の周期の幅になります。周波数とも呼び、細かい波になるほど高い音になります。3つ目の「音色」は、音のキャラクターのことです。同じ歌でも人によって違ったものに聴こえますよね。これは音色が違うからです。音がどんな周波数成分で構成されているかで決まります。
ちなみに音声を扱うソフトには波の形(波形)を表示する機能があり、そこでこれら3つの要素を見ることができます。
整音のポイントとは?
整音についてお話しする前に、まず「視覚」の情報と「聴覚」の情報では何が違うのか、というところを考えてみたいと思います。今日会場にいらっしゃる皆さんは、写真や映像などビジュアルに関心のある方が多いと思います。ビジュアルイメージに関しては、静止しているものと動いているものの両方が存在していますよね。スチルとムービーのことです。しかし音は止まってしまうと存在することができません。音は時間の流れと一体で存在しているからなんですね。
人間が得ている情報の8割くらいが目から、という話がありますが、人間の目は時間の経過に対して鈍いところがあります。その証拠に、動画は1秒間に30コマでも成り立ちます。これは目に残像が残るためなんです。その残像のおかげで、30コマのうち1コマくらい抜けてもなめらかに見えてしまう。しかし音はそうはいきません。もし1/30秒止まってしまったら、ブツッと切れた感じがします。
実は、人間の耳はわずか1/1000秒ほどのズレも感知し、違和感を感じます。人間の聴覚は、時間の流れに対して非常に敏感なんですね。つまり、動画において、音が与える作用というのは思っている以上に大きいものなんです。映像作品においては、それら意図しないノイズや違和感をなくすことが非常に大事になります。
もしちょっとでも音がおかしいと、それだけで映像の方にも問題があるということになってしまうんですね。クオリティが落ちたように見えてしまうんです。つまり、音の違和感、ノイズを取り除くことが、映像のクオリティを高めることにつながるというわけなんです。
整音で行なう3つの作業とは?
では、整音とは何をするのかというと、この3つになります。
まず「不要な成分のカット」ですが、不要な成分とはいわゆるノイズのことです。これは機械的に入るものもありますし、例えば隣の部屋から漏れ聴こえてくる会話のように、当人にとっては必要な情報でも、こちらにとってはノイズであるといったケースもあります。これを排除しようというわけです。次に「質感の調整」ですが、これは同じ音でも、より心地よく、聴く人の耳に届くようにしようということになります。3つ目の「ミックスバランスの調整」とは、BGMなどの音を加え、整える作業を言います。
整音を料理に例えてみましょうか。不要な成分のカットが野菜の皮を剥く作業だとすれば、質感の調整が調理に当たり、そして最後にきれいに皿に盛り付けるのがミックスバランスの調整になります。
では具体的にどんな作業をするのか。それを考える前に、この写真を見てください。何に見えますか?
もちろん、トマトと唐辛子とパセリですよね。ただし、同時に「笑った顔」にも見えるでしょう。これは視覚の例ですが、人間は単なる野菜でも人の顔のように並んでいると、意識がそちらにいってしまう。音もそうなんです。例えばこの会場で、ぺちゃくちゃ話している方がいたら 今はいらっしゃいませんが ものすごく気になりますよね。
実は人間の声も、人間の耳にとって、大変気になるものなんです。脳がそうするようにできているんですね。ですからその特別な人間の声をきれいにするのが、整音の最も重要なポイントになります。
インタビュー収録の実践
ではここからは収録した素材をもとに進めていきます。テーマはインタビューです。まず機材ですが、電車で移動できる範囲の機材で行なっています。私はこの「電車移動できるのか」という点を1つのポイントと考えています。2台のカメラ、照明機材、そして音収録のための機材。これらを持ち運べる範囲でまとめようというわけです。もちろん、映像も音もクオリティを保って、というのが条件になります。なお、撮影にはアシスタントにも同行してもらいましたが、基本的には私1人で作業をしています。
ではさっそく収録した音を聴いていただきましょうか。まずは、一眼カメラだけ、撮影しながら収録した音を聴いてみてください。声がはっきりしないし、ノイズも多いですね。カメラ内蔵のマイクでは、クオリティを上げるのは難しいということがわかるかと思います。
カメラ内蔵マイクは、機械としての性能も高くないんですが、もっと大きな問題は距離なんです。音の振幅は距離に反比例して小さくなりますから、音の大きさは距離に大きく左右されるのです。しかし、カメラ内蔵マイクでは適切な位置にマイクをセットするのがとても難しいんです。
そこで感度を上げて声を大きく録ろうとすると、今度は余計な音がたくさん入ってきます。その結果として声は小さく、ノイズが多くなるのです。
外付けレコーダーを使うメリット
ではどう対策するのかというと、1つにはマイクを人の口の近くにセットする方法があります。カメラのミニプラグから線を伸ばしてマイクをセットします。ただし、ここで注意すべきは、ミニプラグには距離的な限界があるという点です。そこで本格的な端子を使ってマイクを接続します。これがXLR端子(キャノン端子)と呼ばれるものです。端子そのものがガッチリとしていますし、ノイズにも強い。またケーブルを数珠つなぎにして伸ばすこともできます。さまざまなケースに対応できるんですね。
ただし、カメラ側がXLR端子に対応していないケースが多いというのが難点です。カメラによって、例えばGH5は、XLR端子を増設するためのオプション機器が用意されていますので、それを使う方法があります。
そこでおすすめなのは、外付けのレコーダーを使うという方法です。コストパフォーマンスがよく、三脚にも接続でき、音質的にもよい。しかもメリットはそれだけではありません。
例えばマイクを複数つけられること。入力端子が多いため、多くのマイクを使った撮影にも対応できます。さらにはトラブル時のリスク分散になるという点も大きなメリットです。映像もそうですが、データが全滅してしまっては最悪です。カメラ純正のユニットだと、たいていカメラ側の音声入力がオフになり、1箇所でしか音を録れません。それが外付けユニットを使うとレコーダーが独立していますから、最悪のケースでもカメラマイクの音を使うことができます。
トラブルといってもいろいろです。完全に音が録れないようなケースだけでなく、例えば指がマイクに当たって、大きなノイズが乗ってしまうようなケースもあります。外付けレコーダーを使って複数の音源を録音しておけば、そういったトラブルにも対応することができます。複数の音を録る場合、音合わせが大変だと思う方もいらっしゃるかもしれませんが、別々に収録した音を合わせるのは簡単です。これについてはあとで説明をしたいと思います。
ちなみに、今回使ったのはタスカムの「DR-701D」というレコーダーです。三脚穴があって設置も簡単、端子も4つあって、それぞれの音を独立して収録することができます。マイクを4本使った撮影も可能です。しかも電源をUSBから取ることができますから、モバイルバッテリーを利用でき、長時間収録も問題なく行なうことができます。
このDR-701Dを使うメリットはもう1つあります。それは長時間録音をした場合の音ズレを防ぐことができるというメリットです。実は、デジカメもレコーダーも長時間録音をしていると、次第に音のズレが生じます。これは、機器のクロックが微妙に異なることから起きるものです。短時間であれば気になりませんが、1時間、2時間と録音を続けていくと、大きなズレが生じるんですね。それが、DR-701DとカメラをHDMI接続しておくと、カメラのクロックを拾って、同期してくれるようになるんです。
私が検証したところ、あるレコーダーでは1時間の収録で、カメラの動画との間に3ミリ秒ほどの音ズレが生じました。これは見ていて気になるレベルです。それがDR-701D接続をしておくことで、そのズレは数万分の一秒に収まります。長時間のセミナーなどの収録でも音ズレは発生しなくなります。こうしたメリットが大きいので、ぜひ活用してほしいと思います。
どんなマイクを利用するか
さて、荷物を広げ、照明を立て、ガンマイクを近づけて収録します。ガンマイクは指向性が鋭いマイクです。交換レンズに例えると望遠レンズに相当するものです。
ただし、望遠レンズの場合は、光の回り込みさえなければ距離が遠くてもきれいに撮影できますが、マイクの場合は距離が開くとどうしてもノイズが入り込んでしまいます。そこでマイクを、声を発する人の口元に近づけるということが大事になります。音声さんがいれば、口元を狙ってマイクの位置を調整してもらうことができますが、1人で撮影をしているケースではこうしてスタンドを立てるのがいいと思います。
私が使用しているのはロードの「NTG-1」です。ロードは、それまで数十万円していたクラスのマイクを数万円で提供した価格破壊メーカーです。このマイクは指向性がそこまで強いわけではないのですが、その分、多少ですが横の音も拾ってくれます。人の位置は多少ずれることがあるので、これくらいのほうが都合がいいというケースも多いんです。
このガンマイクはコンデンサー式と呼ばれる、48ボルトの電源を使うマイクで、非常に細かい音を拾ってくれます。こうしたマイクを使う場合は、マイクに振動が伝わりにくいようにショックマウントを利用するのがいいでしょう。また、エアコンの風などが当たると風切り音のようなノイズが入りますので、ウインドウジャマーを使った対策も必要です。
インタビューの場合は、ラベリアマイクを使う場合もあります。ピンマイクとも呼ぶマイクです。小型のものを襟元などにつけると、一定の音で収録ができます。
ではどう使い分けるか。声が安定して録れるのはラベリアマイクなんですが、息が当たってしまったり、顔の向きが変わると音が小さくなってしまうということがあります。また、女性がワンピースなどを着用している場合に取り付けが難しかったり、衣擦れの音やアクセサリーのカチャカチャした音を拾ってしまうこともあります。また、ワイヤレスタイプですと微妙に音が遅れたり、音質に差があるものもあります。また、周囲の電波が混線することもある。注意点がいろいろとあるんですね。
今回は、小型のレコーダーであるタスカムの「DR-10L」にラベリアマイクをつけて収録しました。DR-10Lのいいところは、マイクは1つでも2つの入力端子から同時に音を録ることができるんです。これをどう使うのかというと、1つの端子からは大きめの音で、もう1つの端子からは小さめの音で収録します。こうすることでトラブルの回避になるんです。例えば、取材相手がずっと穏やかに小さな声で話していたのに、急に「ガハハ」と大笑いしたりすると、音が割れてしまうことがあったりします。そういった場合に、音の小さな方を使うといった使い方ができるんです。消費電力も小さいので非常に便利です。
収録時の設定をどうするか
さて、今度はオーディオの設定について見ていくことにしましょう。まず「サンプリング周波数」「ビット数」という言葉がよく出てきます。最近よく聞くハイレゾオーディオというのは、これらの数値が高いものを言います。
サンプリング周波数は、画像に例えると色数に当たるものだと考えるといいと思います。階調がどれくらいあるのかを示す数値に近い。一方、ビット数は画素数、解像度です。
例えばCDは44.1KHzですので、一般にはそれ以上に設定すれば音質的に十分です。48KHzあたりでいいでしょう。一方、ビット数は24bitで録っておくのがおすすめです。このくらいに設定しておけば、編集して多少音質が劣化しても問題のないレベルだと言えると思います。
整音作業に適した環境とは
次に、作業環境について触れておきましょう。これはモニター用のスピーカーとかヘッドホンがありますよね。モニター用というのは、どんな音でもきれいに聴こえるのではなくて、NGの音をNGだとわかるように聴こえることが大事なんです。モニター用ヘッドホンの定番は、ソニーの「CD900ST」。音楽を楽しむのには向いていませんが、モニター用には適しています。小型のスピーカーでは、例えばタスカムの「VL-S3」。こういったものがあると判断がしやすい。
もしも、こうしたモニター用の機器がない場合はどうすればいいかというと、手持ちのヘッドホンやスピーカーなど複数の環境で、比較しながら聴いてみるのがいいでしょう。なお、それぞれの機器の特徴を掴むためには、それぞれの環境で普段聴いているCDを聴いてみることをおすすめします。それが判断の基準になります。また、最近ではスマホで映像を見る方も多いので、スマホのスピーカーでも聴いてみましょう。さらにはメーターを参考にするのも大事です。ソフトウェアのメーターを見る癖をつけるといいでしょう。
収録した音のノイズを取り除く
では、収録した音を整えていくことにしましょう。カメラマイク、ラベリアマイク、ガンマイクと、それぞれのマイクの音を比較して聴いてみようと思いますが、その前に、それぞれの音源の位置合わせをしてみようと思います。手動で合わせるのは大変ですが、Premiere Proを使えば簡単です。ファイルを選択して同期を行なうだけです。
部屋の中のインタビューなどでは、これで十分うまくいきます。もし、映像も4〜5つ、音声も複数の場合は、PluralEyes(レッドジャイアント)というソフトウェアを使うといいと思います。複数の動画や音を正確にシンクロしてくれます。経験的にもかなり信頼のできるソフトウェアだと言えます。
ではまず、カメラマイクから録音した音を聴いてみます。ノイズが入っていますし、音もよくないですね。
ではラベリアマイクで録った音はどうでしょうか。ちょっと聴いただけでもまったく質が違うことがわかりますよね。よく聴くとノイズが入っていたりするんですが、このままでも聴きやすさは大違いです。ではガンマイクの音はどうでしょうか。こちらも聴きやすい音ですが、背景に車の音が入ってしまっています。
こういう場合には、Premiere Proの「エッセンシャルサウンド」の「ノイズを軽減」を使います。ワンタッチで背景のボーッという音が消えます。
それでもまだノイズが気になる場合は、音声編集ソフトの「Adobe Audition」を使うといいでしょう。Auditionのノイズリダクション機能を使えば、より強力にノイズを取り除くことができます。
さらに手強いノイズには、プラグインを使うといい場合があります。「NS1 Noise Suppressor」(Waves)は、うっすら乗っているエアコンや車の音などをかなりの精度で取り除くことができます。時間がないような時にも便利なプラグインです。
聴きやすい音に整える
ノイズを取った状態の音を聴いてみると、キンキンしたり、シャキシャキしたり、モコモコした音に聴こえることがあります。こういう場合はイコライザーを使って整音作業をしていきます。Premiere Pro、Auditionには「パラメトリックイコライザー」という機能があります。これを使って、真ん中から右寄り辺りの、人間の耳に一番敏感な辺りを調整します。山になっている部分を少し下げてみるといいでしょう。
また、人間の声より低い、地響きのようなところもまるまるカットしてみたり、メーターで尖って見えるところを丁寧に削っていくと、音がスッキリしていきます。
音の抑揚が気になる場合は、プリセットを使って調整するといいでしょう。今回のような女性の声の調整をするためのプリセットが用意されていますので、試してみるといいでしょう。「さしすせそ」の音が耳につく場合は、ディレッサーを使って調整をします。これもプリセットを活用するのがいいでしょう。こうした作業を繰り返すと、聴きやすさが上がってきたと思います。
BGMをミックスする
次に、BGMをつけてみたいと思います。まずは曲を読み込みますが、CDに入っている音はかなり大きな音であることが多いので、そのまま重ねるとBGMだけが大きくなり、肝心の人の声が聴こえなくなってしまいます。Premiere Proには、音声クリップの「声があるところ」のBGMの音量を自動的に小さくする機能がついています。こうした機能を使うと、聴きやすい音に仕上げることができます。
最後に音量を調整をしようと思うのですが、どれくらいの音量で設定すればいいのか、迷う方も多いと思います。CDの音は大きいものが多いのですが、テレビや映画などではわりと低めに設定するのが普通です。どちらに合わせればいいのでしょうか。
特に指定がない場合は、Premiere Proの動画の書き出しで「ラウドネスの正規化」の項目を「ITUBS1770-3」に設定しておくといいでしょう。こうしておくと、放送局の基準に合わせた音量に自動調整されます。
ちなみにラウドネスというのは、人間の耳にどれくらいの大きさで聴こえるのかという基準の単位のことです。
さて、そろそろお時間になりました。マイクの状態や録音の仕方、さらには仕上げ方によってまったく別物になるということがおわかりいただけたと思います。1人で、しかも電車移動できる機材で、ここまでできるというところは参考になったのではないかと思います。
本日は長時間、ありがとうございました。
取材:小泉森弥