時々雑録

ペース落ちてます。ぼちぼちと更新するので、気が向いたらどうぞ。
いちおう、音声学のことが中心のはず。

R-09による録音

2006年11月27日 | フィールドワークから
知り合いの方から、ここで以前紹介した録音機材についてたずねられました。8月10日の記事で、新たに仕入れた録音機器、として紹介したRoland R-09にはどんなマイクをつけているのか、というハナシ。「マルソリ・ラボ」のUさんもこれに関してトラックバックをしてくださったようなので、自分が知っている限りで「こういうのがいいのでは」と思っていることを書きます。

まずその前に。R-09には内臓マイクがあるのですが、これの質が悪くありません(写真に写っているR-09の上部両脇に出ているもの)。ケーブルを介さず直接入力できるし、十分なS/N比が得やすいので、実験室的なリスト読みの録音などなら、これを利用するのが一番いいと思います。といっても、それなら音声実験室でもっときちんとした設備を利用するでしょうから、以下「フィールドワークでどうするのか」ということを主眼に書きます。

写真が使っているマイク一式をR-09に装着したところ。ペンやCD-ROMは大きさの比較のためにおきました。マイクはSONY ECM-140という会議録音用のピン型。もう10年以上使っていて、売っていません。SONYのWebsite情報では、後継機種らしきECM-T145というのが売っています(これも「生産完了」って書いてあるけど)。

これのいい点は小さいこと。大きな電源供給ユニットも不要で持ち運びが楽。写真のとおりリチウム電池によるパワーサプライがある(めちゃくちゃ長期間もつ)ので、R-09のプラグインパワー設定を外します。プラグインパワーでも使えますが、録音機からのパワー供給によっては十分な音量が得られないことがあります。R-09の場合ちょっと足りない気がしました。もちろん録音レベルを上げればいい(1~30)のですが、そうすると環境ノイズも大きい音で拾うのであまりオススメではありません。

この小ささを利用して、発話者の口にかなり近づけてもらいます。録音ボリウムをできるだけ絞って録音することで、できるだけ高いS/N比を保つのが狙い。このマイクは全指向性(Omni-directional)なのですが、こうすれば、フィールドワークで周囲のノイズや私の合いの手などをあまり拾わず、分析に適した音声が得られます。

問題はステレオ・マイクであること。下に述べるように、ステレオマイクを装着するとステレオの音声ファイルが出来上がってしまいます。ということでお勧めは、
1) 小さい。でもできれば自前の電源供給がある。ヘッドマウント型だとベスト。
2) モノラル
3) 単一指向性
という条件がそろっているもの。あるのかどうか分かりませんが、探して、いいものがあったらぜひ教えてください。

このECM-140をドイツのヘッドホンなどのメーカーSennheiser NB-2というマウントに装着しています。ECM-140のコードは黒いチューブの中に通してあります。これを発音者の頭に装着してもらい、マイクを固定します。マイクを口から一定の距離に保つためです。特に自由発話を録音するときなど、話者がおしゃべりの興が乗ってあっちを向いたりこっちを向いたりするので、これがとても役に立ちます。ATRのNick Campbellさんに教えていただきました。

R-09はステレオ、モノラル両方の入力を選べることになっていますが、上でちょっと触れたように、ステレオマイクを挿すとどう設定してもステレオで録音されてしまいます。そこで今はとりあえずWavesurferでモノラル変換しています。これで問題なく処理・分析ができる音声ファイルになります。が、Intensityのレンジが若干小さくなるのが残念。R-09はサンプリング周波数を48KHzか44.1KHzの二つしか選べず、音声分析には不要な情報まで含んだ大きなファイルができてしまうので、この段階でダウンサンプルもやります。なお、R-09の内臓マイクもステレオです。基本が音楽録音用なので。。。 16bit、44.1KHzで1分間録音して10MB程度の大きさのファイルでした。上述のように、モノラル・22KHzに変換すると、ちょうど1/4の2.5MBくらいになります。

注意が二つ。R-09は16bitと24bitの録音が選べますが、16bitを選択しないと、その後のダウンサンプルがうまく行きませんでした。PC側の音声デバイスが16bitだからだと思いますが、未確認。音声分析なら16bitで十分でしょう。それから、写真に見えているR-09の裏のパネルのAGCとLOWCUTはOFFにする。AGCはAuto Gain Control。突然の大音量など対策として、音量を均す(ならす)機能です。LOWCUTは低周波ノイズ防止のためのいわゆるHi-pass filterだと思います。息によるノイズなどは別の手段で防止した上で、こういう機能は外して原音に忠実に録音すべきでしょう。さらに情報が欲しい方はご連絡ください。こちらのためにもなるので、できる範囲でテストなどもしてみます。

(ちょっとだけつづきがあります。下の記事もご覧下さい)

録音&分析例

2006年11月27日 | フィールドワークから
上記のデバイス一式で自分の声を録音してみました。22KHzにダウンサンプリング。「電源スイッチを」と言っている箇所。フレーズ先頭のF0ピークは260Hzほど。もう完全に女性の声のレンジ。男のくせに声が高くて。。。 ともあれ、ノイズもなく、十分な音声データが得られていると思います。

ところでついでですが、こういうデバイスや音声分析プログラムがやっているデジタル音声処理に関して、来年の秋にDiane Kewley-Port先生のS522・Digital Signal Processingで数学的な原理から教わる予定です。きつい授業だそうで、その準備として今学期、Math & Physics for Speech and Hearing Sciencesを受講しています。久しぶりに三角関数だの、対数だの教わって多少リハビリできました。

一番最近は信号検出理論(Signal Detection Theory)を簡単に教わりました。Diane先生は「耳科医になる勉強をしているうちの学科の学生には必要だけど、あなたには関係なくて悪いわね」と言っていました。たしかにこの授業では診断の意思決定のため、という文脈で教わったのですが、実際には音声知覚実験の結果の解釈などに利用されているようですね。UCLAのWebにも音声学Labのボス、Pat Keatingさんじきじきの解説ページがありました。思いがけぬ方向から重要な知識を授かりました。この夏、韓国でやった知覚実験の結果の評価に利用すべく、もうちょっと勉強するつもりでいます。師匠、de Jong先生がL710(Seminor in Phonetics: Speech production and perception)を来学期開講するので、そこで結果を議論させてもらって、発展させたいと思っています。

ついでにもう一つ来学期の受講予定。コンピューターサイエンス学科の新科目Computing Tools for Science Researchesという授業を受けます。この授業は私が副専攻(Minor)として考えている認知科学の単位として認められます。C/C+を使ったプログラミングと、Matlabによる計算やグラフ作りをやるのだそうです。MatlabはDSPの授業で使うSTRAIGHTを動かすために必要なので、Diane先生がDSPの授業の前提として指定。必要だと思いながら学べずに来た技術を習得するいい機会が得られました。言語学科の外にも音声研究に関わる教員が多数いて、そこでも鍛えてもらえるのは、総合大学であるIUにいる利点の一つだと思います。