オーディオファイルには様々なフォーマットがあります。
音楽制作の現場で多く使われるもので見ていくと拡張子だけでも.wavと.aif、.aiffがあります。
–wav
.wavは、マイクロソフトとIBMが共同で開発した音声データ記述のためのフォーマットで、RIFFの一種と位置付けられています。wavはwebと区別するために、レコーディングスタジオなどではワブと発音されることがあります。
Windowsで多く使われるファイル形式で、OSX以降のMacでも多く使われるようになってきたフォーマットです。
.wavフォーマットでは、データ長が32ビット符号なし整数型で記述されているため、4GBを超えるファイルを作成できないという欠点があります。
この制限を越えるため、データ長を64ビット符号なし整数型で記述するWave64 (.W64) というフォーマットも存在しています。
–aiff
.aiff は、アップルコンピュータにより開発された音声データのファイルフォーマットで90年代あたりから音楽制作に使われていたMacintoshやAmiga上で使われるファイル形式です。
2000年あたりまではwindowsはwav、macはaiffという区分けが暗黙にあったように思いますが、現在ではむしろaiffのほうが劣勢で、wavのほうが多くの環境でサポートが行われている印象です。
ファイルに格納した場合の拡張子は、.aiff、.aifの2種類があります。
通常は非圧縮、リニアPCMのサンプリングデータ用のフォーマットとして扱いますが、.aifcという圧縮データ用のフォーマットも存在します。
AIFFの制限としては浮動小数点数であるfloatを扱えないというものがあるため、32bit floatのオーディオファイルを.aifで利用したい場合はAIFCとなるので注意が必要です。
私のソフトウェア環境では例えばMax/MSPのsfrecord~オブジェクトを使ってサウンドファイルを生成する場合に、32bit floatで音源を作るのですが.wavか.aifかオプションで選ぶことが可能です。.aifをファイル名に選択した場合32bit floatで書き出すと自動的にファイルフォーマットはAIFCとなっておりました。
(Max/MSP sfrecord~がサポートするビットデプス)
int8 int16 int24 int32 float32 float64 mulaw alaw
DSDからPCMのサウンドファイルにコンバートするKORGのAudio Gateを使った場合、32bit floatでPCMサウンドファイルを書き出す場合にはAIFFは選択することができず、wavを選択する必要があります。
この際、4GBを越える32bit floatのwavファイルを作成することはできないので注意が必要です。
ちなみに中身は無圧縮なためwavもaiffも音質は変わらないです。
32bit floatのfloat、すなわち浮動小数点数は 1.0 を超えるアンプリチュード(振幅)を表すことができる点が24bit以下のファイルと異なります。
32bit floatの場合、1.0 を超えていてもエラーとはならず、再生時は 1.0 を越えた部分が 1.0 に丸められるなどの処理が行われる場合が多いです。音響合成ソフトRTcmixなどではオプションで-1から1の値に丸め込むかなどを選択することが可能になっていました。
これが16bitの場合2の16乗 [-32768, 32767] が [-1.0, 1.0] にマッピングされる仕組みであるため、最小単位が 1/32767 (1/32768) 固定になります。
ビット数は高いほど波動の縦(y)の解像度が細かくなるため、精度が高いデジタルデータを作り出すことができます。
その反面、容量は大きくなりますし、CPUだけでなくHDDへの負荷が大きくなります。
32bitで4ch以上のリアルタイムレコーディングなどはHDDの回転速度が遅い場合(5400では厳しい)、書き込みが追いつかず音が途切れるということも経験があります。
これに対してサンプリング周波数とは波動の横(x)の解像度を示すものであり、一秒間に何回サンプリングを行い、波動を検知するのかということを決定するパラメータとなります。
サンプリング周波数は横軸の解像度だけでなく、ナイキストの定理とも深く関係があります。
例えば48KHzでサンプリングを行った場合、ナイキストレート24KHz以上の周波数の音が含まれていた場合、波動が折り返してしまう現象があります。
48KHzのサンプリング周波数で25KHzのサイン波を録音すると、23KHzの音に変化してしまいます。これを折り返しといいます。
通常はこの折り返しを防ぐために録音段以前にオーディオデータのフィルタリングが行われ、高い周波数を除去してしまいます。
つまり、サンプリング周波数は高いほど高音域の再現性も高いと言えます。
コンピュータ音楽―歴史・テクノロジー・アート Curtis Roads 青柳 龍也 後藤 真孝 東京電機大学出版局 2001-01 |