デジタルオーディオの基本。 サンプルレートとビット深度

つまり、少なくともその周波数の2倍のサンプルレート、ナイキストレートと呼ばれるレートで、元の正弦波の周波数を捕捉して再構成することができます。 逆に、システムは、ナイキスト周波数と呼ばれる、サンプル レートの半分までの周波数を捕捉および再現できます。ナイキスト周波数を超える信号は、オーディオ/デジタル コンバータ (ADC) で適切に記録されず、ナイキスト周波数を超えてミラーリングされ、エイリアシングと呼ばれるプロセスで人工的な周波数が混入します。 これにより、元の音声に含まれる不要な超高周波がエイリアシングの原因となるのを防ぐことができます。 初期のフィルターはオーディオを汚す可能性がありましたが、より良い技術が導入されるにつれて、この問題は最小限に抑えられつつあります。 44.1 kHz

もっとも一般的なサンプルレートは 44.1 kHz、または 44,100 サンプル/秒です。 これは、CD のようなフォーマットで使用される、ほとんどの消費者向けオーディオの標準です。

これは任意の数字ではありません。 人間は 20 Hz から 20 kHz の間の周波数を聞くことができます。 ほとんどの人は、人生の中で高い周波数を聞き取る能力を失い、15 kHz~18 kHzまでの周波数しか聞き取れなくなります。 しかし、この「20対20」のルールは、私たちが聞くことのできるすべてのものの標準的な範囲として今でも受け入れられています。コンピュータは、私たちが聞くことのできるすべてのものを保存するために、20kHzまでの周波数の波を再現できる必要があります。 したがって、40 kHz のサンプル レートで技術的には十分でしょう。これは事実ですが、エイリアシングを防ぐには、かなり強力で一時期は高価なローパス フィルタが必要です。 44.1 kHz のサンプルレートは、技術的には 22.05 kHz までの周波数のオーディオを記録することができます。 ナイキスト周波数を私たちの可聴域外に置くことで、エイリアシングを除去するためにより控えめなフィルターを使用でき、聴感上の効果はあまりありません。

44.1 kHz はコンシューマ向けオーディオのサンプル レートとして受け入れられますが、より高いサンプル レートが使用される場合もあります。 強力なアンチエイリアシング フィルタが高価だったデジタル オーディオの初期に導入されたものもあります。 ナイキスト周波数をさらに高くすることで、フィルタを人間の聴覚からどんどん遠ざけ、その結果、オーディオへの影響をさらに少なくすることができます。 高いサンプルレートは、技術的に、1秒あたりの測定値を増やし、オリジナルのオーディオをより近く再現することにつながるので、48 kHz は、音楽よりも「プロフェッショナルオーディオ」の文脈でよく使用されます。 例えば、ビデオ用のオーディオでは標準的なサンプルレートです。 このサンプル レートはナイキスト周波数を約 24 kHz に移動し、フィルタリングが必要になる前に、さらにバッファの余裕を与えます。エンジニアによっては、さらに高いサンプル レートを選択する人もおり、それは 44.1 kHz または 48 kHz の倍数の場合が多いです。 88.2 kHz、96 kHz、176.4 kHz、および 192 kHz のサンプル レートは、ナイキスト周波数が高くなり、超音速の周波数を記録および再現できることを意味します。 ローパス フィルターは音への影響が少なく、1 秒あたりのサンプル数が多いため、元のオーディオをより高精細に再現できます。

しかし、これを本当に聞くことができますか。

経験豊富なエンジニアは、サンプル レートの違いを聞き取ることができる場合があります。 しかし、フィルタリングやアナログ/デジタル変換技術が向上するにつれて、これらの違いを聞き取ることは難しくなります。理論的には、176.4 kHz や 192 kHz など、高いサンプル レートで作業することは悪いことではありません。 ファイルは大きくなりますが、最終的なバウンスまで音質を最大化するのは良いことかもしれません。 しかし、最終的には、オーディオは44.1 kHzか48 kHzのいずれかに変換されることが多いでしょう。 88.2を44.1に、96を48に変換する方が数学的にはるかに簡単なので、プロジェクト全体では1つのフォーマットにとどめておくのがベストでしょう。 しかし、一般的には 44.1 kHz または 48 kHz で作業します。システムが 48 kHz のサンプル レートに設定されているときに 44.1 kHz のオーディオ ファイルを使用すると、システムは必要以上に速くサンプルを読み取ります。 その結果、音声は高速化され、わずかに高い音で聞こえます。 システムのサンプル レートが 44.1 kHz スケールで、オーディオ ファイルが 48 kHz スケールの場合、その逆が起こり、オーディオは遅くなり、わずかに低いピッチで聞こえます。 標準的な 44.1 kHz のオーディオ ファイルのピッチを下げたことがある場合、高域が多少空っぽになることに気づいたと思います。 22.05 kHz 以上の周波数は変換前にフィルタリングされたため、ピッチダウンする周波数コンテンツがなく、結果として高域にぽっかりと穴が開いてしまうのです。

しかし、例えばこの音声を192kHzで録音した場合、元の音声の96kHzまでの周波数が記録されることになります。 これは明らかに人間が聞き取れる範囲をはるかに超えていますが、音声をピッチダウンすると、これらの聞き取れない周波数が聞き取れるようになるのです。 その結果、高周波数コンテンツを維持したまま、録音のピッチを大きく落とすことができます。 サンプル レートの詳細については、このビデオを参照してください。

Bit depth

Analog audio is a continuous wave, with a effectively infinite number of possible amplitude values. しかし、デジタル・オーディオでこの波を測定するには、サンプリングするたびに波の振幅を有限の値として定義する必要があります。

ビット深度は、各サンプルに対して記録できる可能な振幅値の数を決定します。 最も一般的なビット深度は、16 ビット、24 ビット、および 32 ビットです。 それぞれは2進数の用語で、可能な値の数を表します。 ビット深度の高いシステムは、より多くの可能な値を表現することができます

コメントを残す

メールアドレスが公開されることはありません。