Digital Audio Basics: Abtastrate und Bittiefe

Das bedeutet, dass wir die Frequenz der ursprünglichen Sinuswelle mit einer Abtastrate erfassen und rekonstruieren können, die mindestens das Doppelte ihrer Frequenz beträgt, eine Rate, die Nyquist-Rate genannt wird. Umgekehrt kann ein System Frequenzen bis zur Hälfte der Abtastrate erfassen und rekonstruieren, eine Grenze, die als Nyquist-Frequenz bezeichnet wird.

Signale oberhalb der Nyquist-Frequenz werden von Audio-Digital-Wandlern (ADCs) nicht richtig aufgezeichnet, da sie über die Nyquist-Frequenz zurückgespiegelt werden und künstliche Frequenzen in einen Prozess einbringen, der als Aliasing bezeichnet wird.

Um Aliasing zu verhindern, werden Audio-Digital-Wandlern oft Tiefpassfilter vorgeschaltet, die Frequenzen oberhalb der Nyquist-Frequenz eliminieren, bevor die Audiosignale den Wandler erreichen. Dadurch wird verhindert, dass unerwünschte sehr hohe Frequenzen im Originalton Aliasing verursachen. Frühe Filter konnten den Ton verfälschen, aber dieses Problem wird mit der Einführung besserer Technologien minimiert.

Standardabtastrate: 44,1 kHz

Die gängigste Abtastrate ist 44,1 kHz oder 44.100 Samples pro Sekunde. Dies ist der Standard für die meisten Audioformate für Verbraucher, wie z. B. CDs.

Dies ist keine willkürliche Zahl. Der Mensch kann Frequenzen zwischen 20 Hz und 20 kHz hören. Die meisten Menschen verlieren im Laufe ihres Lebens die Fähigkeit, höhere Frequenzen zu hören, und können nur noch Frequenzen bis 15 kHz-18 kHz wahrnehmen. Diese „20-zu-20“-Regel wird jedoch immer noch als Standardbereich für alles, was wir hören können, akzeptiert.

Der Computer sollte in der Lage sein, Wellen mit Frequenzen bis zu 20 kHz wiederzugeben, um alles, was wir hören können, zu erhalten. Daher sollte eine Abtastrate von 40 kHz technisch gesehen ausreichen, nicht wahr?

Das stimmt, aber man braucht einen ziemlich leistungsfähigen – und seinerzeit teuren – Tiefpassfilter, um hörbares Aliasing zu verhindern. Die Abtastrate von 44,1 kHz ermöglicht technisch gesehen die Aufzeichnung von Audiodaten mit Frequenzen bis zu 22,05 kHz. Da die Nyquist-Frequenz außerhalb unseres Hörbereichs liegt, können wir moderatere Filter verwenden, um Aliasing ohne große hörbare Auswirkungen zu beseitigen.

Weitere Abtastraten: 48 kHz, 88,2 kHz, 96 kHz, usw.

Während 44,1 kHz eine akzeptable Abtastrate für Consumer-Audio ist, gibt es Fälle, in denen höhere Abtastraten verwendet werden. Einige wurden in den Anfängen der digitalen Audiotechnik eingeführt, als leistungsfähige Anti-Aliasing-Filter noch teuer waren. Wenn man die Nyquist-Frequenz noch weiter nach oben verschiebt, kann man den Filter immer weiter vom menschlichen Gehör entfernen, so dass der Klang noch weniger beeinträchtigt wird.

48 kHz ist eine weitere gängige Abtastrate. Die höhere Abtastrate führt technisch gesehen zu mehr Messungen pro Sekunde und zu einer genaueren Nachbildung des Originalklangs, weshalb 48 kHz oft in „professionellen Audio“-Zusammenhängen verwendet wird und nicht so sehr in der Musik. Sie ist zum Beispiel die Standard-Abtastrate bei Audio für Video. Mit dieser Abtastrate wird die Nyquist-Frequenz auf etwa 24 kHz verschoben, so dass mehr Pufferraum zur Verfügung steht, bevor eine Filterung erforderlich ist.

Einige Tontechniker arbeiten mit noch höheren Abtastraten, die in der Regel ein Vielfaches von 44,1 kHz oder 48 kHz sind. Abtastraten von 88,2 kHz, 96 kHz, 176,4 kHz und 192 kHz führen zu höheren Nyquist-Frequenzen, was bedeutet, dass Überschallfrequenzen aufgezeichnet und wiedergegeben werden können. Tiefpassfilter haben einen geringeren Einfluss auf den Klang und mehr Abtastungen pro Sekunde, was zu einer hochauflösenderen Wiedergabe des ursprünglichen Tons führt.

Kann man das wirklich hören?

Einigen erfahrenen Tontechnikern mag es möglich sein, Unterschiede zwischen den Abtastraten zu hören. Mit zunehmender Verbesserung der Filter- und Analog/Digital-Wandlungstechnologien wird es jedoch immer schwieriger, diese Unterschiede zu hören.

In der Theorie ist es keine schlechte Idee, mit einer höheren Abtastrate zu arbeiten, wie 176,4 kHz oder 192 kHz. Die Dateien werden zwar größer, aber es kann sinnvoll sein, die Klangqualität bis zum endgültigen Bounce zu maximieren. Letztendlich werden die Audiodaten aber wahrscheinlich in 44,1 kHz oder 48 kHz konvertiert. Es ist mathematisch viel einfacher, 88,2 in 44,1 und 96 in 48 zu konvertieren, daher ist es am besten, für das gesamte Projekt bei einem Format zu bleiben. Es ist jedoch gängige Praxis, mit 44,1 kHz oder 48 kHz zu arbeiten.

Wenn das System auf eine Abtastrate von 48 kHz eingestellt wäre und wir eine 44,1-kHz-Audiodatei verwenden würden, würde das System die Samples schneller lesen als es sollte. Infolgedessen würde der Ton beschleunigt und etwas höher klingen. Der umgekehrte Fall tritt ein, wenn die Abtastrate des Systems auf der 44,1-kHz-Skala und die Audiodateien auf der 48-kHz-Skala liegen; das Audiomaterial klingt langsamer und etwas tiefer.

Superhohe Abtastraten haben auch eine interessante kreative Verwendung. Wenn Sie jemals die Tonhöhe einer Standard-Audiodatei mit 44,1 kHz gesenkt haben, haben Sie wahrscheinlich bemerkt, dass die Höhen etwas leer werden. Frequenzen oberhalb von 22,05 kHz wurden vor der Konvertierung herausgefiltert, so dass es keine Frequenzinhalte zum Absenken gibt, was zu einem klaffenden Loch in den Höhen führt.

Würden diese Audiodaten jedoch z. B. mit 192 kHz aufgezeichnet, würden Frequenzen von bis zu 96 kHz im Originalton aufgezeichnet werden. Das liegt natürlich weit außerhalb dessen, was der Mensch hören kann, aber wenn man den Ton herunterdreht, werden diese unhörbaren Frequenzen hörbar. Auf diese Weise können Sie die Tonhöhe einer Aufnahme stark absenken und gleichzeitig die hohen Frequenzen beibehalten. Weitere Informationen zur Abtastrate finden Sie in diesem Video.

Bit-Tiefe

Analoges Audio ist eine kontinuierliche Welle mit einer praktisch unendlichen Anzahl möglicher Amplitudenwerte. Um diese Welle jedoch in digitalem Audio zu messen, müssen wir die Amplitude der Welle jedes Mal, wenn wir sie abtasten, als einen endlichen Wert definieren.

Die Bittiefe bestimmt die Anzahl der möglichen Amplitudenwerte, die wir für jedes Sample aufzeichnen können. Die gebräuchlichsten Bittiefen sind 16 Bit, 24 Bit und 32 Bit. Jede Bittiefe ist ein binärer Begriff, der für eine bestimmte Anzahl möglicher Werte steht. Systeme mit höherer Bittiefe können mehr mögliche Werte ausdrücken:

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.