Esto significa que podemos capturar y reconstruir la frecuencia de la onda sinusoidal original con una frecuencia de muestreo de al menos el doble de su frecuencia, una tasa llamada tasa de Nyquist. A la inversa, un sistema puede capturar y recrear frecuencias hasta la mitad de la frecuencia de muestreo, un límite llamado frecuencia de Nyquist.
La señal por encima de la frecuencia de Nyquist no es registrada correctamente por los convertidores de audio a digital (ADC), volviéndose a reflejar a través de la frecuencia de Nyquist e introduciendo frecuencias artificiales en un proceso llamado aliasing.
Para evitar el aliasing, los convertidores de audio a digital suelen ir precedidos de filtros de paso bajo que eliminan las frecuencias por encima de la frecuencia de Nyquist antes de que el audio llegue al convertidor. Esto evitará que las superfrecuencias no deseadas en el audio original provoquen el aliasing. Los primeros filtros podían contaminar el audio, pero este problema se está minimizando a medida que se introduce una mejor tecnología.
Tasa de muestreo estándar: 44,1 kHz
La frecuencia de muestreo más común que verá es 44,1 kHz, o 44.100 muestras por segundo. Este es el estándar para la mayoría del audio de consumo, utilizado para formatos como los CD.
Este no es un número arbitrario. Los seres humanos pueden oír frecuencias entre 20 Hz y 20 kHz. La mayoría de las personas pierden su capacidad de oír las frecuencias superiores a lo largo de su vida y sólo pueden oír frecuencias hasta 15 kHz-18 kHz. Sin embargo, esta regla de «20 a 20» se sigue aceptando como el rango estándar para todo lo que podemos oír.
El ordenador debe ser capaz de recrear ondas con frecuencias de hasta 20 kHz para preservar todo lo que podemos oír. Por lo tanto, una frecuencia de muestreo de 40 kHz debería ser técnicamente suficiente, ¿no?
Esto es cierto, pero se necesita un filtro de paso bajo bastante potente -y, en su momento, caro- para evitar el aliasing audible. La frecuencia de muestreo de 44,1 kHz permite técnicamente grabar audio a frecuencias de hasta 22,05 kHz. Al situar la frecuencia de Nyquist fuera de nuestro rango de audición, podemos utilizar filtros más moderados para eliminar el aliasing sin mucho efecto audible.
Otras velocidades de muestreo: 48 kHz, 88,2 kHz, 96 kHz, etc.
Aunque 44,1 kHz es una frecuencia de muestreo aceptable para el audio de consumo, hay casos en los que se utilizan frecuencias de muestreo más altas. Algunas se introdujeron durante los primeros días del audio digital, cuando los potentes filtros antialiasing eran caros. Mover la frecuencia de Nyquist aún más alto nos permite colocar el filtro cada vez más lejos de la audición humana, y por lo tanto impactar el audio aún menos.
48 kHz es otra tasa de muestreo común. La tasa de muestreo más alta conduce técnicamente a más mediciones por segundo y a una recreación más cercana del audio original, por lo que 48 kHz se utiliza a menudo en contextos de «audio profesional» más que en contextos musicales. Por ejemplo, es la frecuencia de muestreo estándar en audio para vídeo. Esta frecuencia de muestreo desplaza la frecuencia de Nyquist a unos 24 kHz, lo que proporciona un mayor espacio de amortiguación antes de que sea necesario el filtrado.
Algunos ingenieros optan por trabajar con frecuencias de muestreo aún más altas, que suelen ser múltiplos de 44,1 kHz o 48 kHz. Las frecuencias de muestreo de 88,2 kHz, 96 kHz, 176,4 kHz y 192 kHz dan lugar a frecuencias de Nyquist más altas, lo que significa que se pueden grabar y recrear frecuencias supersónicas. Los filtros de paso bajo tienen menos impacto en el sonido y más muestras por segundo, lo que da como resultado una recreación de más alta definición del audio original.
¿Pero realmente se puede oír esto?
Algunos ingenieros experimentados pueden ser capaces de oír las diferencias entre las frecuencias de muestreo. Sin embargo, a medida que las tecnologías de filtrado y conversión analógica/digital mejoran, es más difícil oír estas diferencias.
En teoría, no es mala idea trabajar en una frecuencia de muestreo más alta, como 176,4 kHz o 192 kHz. Los archivos serán más grandes, pero puede ser bueno para maximizar la calidad del sonido hasta el rebote final. Al final, sin embargo, es probable que el audio se convierta a 44,1 kHz o 48 kHz. Es mucho más fácil, desde el punto de vista matemático, convertir 88,2 a 44,1 y 96 a 48, así que es mejor quedarse en un solo formato para todo el proyecto. Sin embargo, una práctica común es trabajar en 44,1 kHz o 48 kHz.
Si el sistema estuviera ajustado a una frecuencia de muestreo de 48 kHz y utilizáramos un archivo de audio de 44,1 kHz, el sistema leería las muestras más rápido de lo que debería. Como resultado, el audio sonaría acelerado y ligeramente más agudo. Lo contrario ocurre si la frecuencia de muestreo del sistema está en la escala de 44,1 kHz y los archivos de audio están en la escala de 48 kHz; el audio suena más lento y con un tono ligeramente más bajo.
Las frecuencias de muestreo súper altas también tienen un interesante uso creativo. Si alguna vez ha bajado el tono de un archivo de audio estándar de 44,1 kHz, probablemente habrá notado que los agudos se vuelven algo vacíos. Las frecuencias por encima de 22,05 kHz se filtran antes de la conversión, por lo que no hay contenido de frecuencia para bajar el tono, lo que resulta en un agujero en los agudos.
Sin embargo, si este audio se grabara a 192 kHz, por ejemplo, se registrarían frecuencias de hasta 96 kHz en el audio original. Obviamente, esto está muy lejos de lo que el ser humano puede oír, pero bajar el tono del audio hace que estas frecuencias inaudibles se vuelvan audibles. Como resultado, se puede bajar mucho el tono de una grabación conservando el contenido de las altas frecuencias. Para obtener más información sobre la frecuencia de muestreo, asegúrese de ver este vídeo.
Profundidad de bits
El audio analógico es una onda continua, con un número efectivamente infinito de posibles valores de amplitud. Sin embargo, para medir esta onda en audio digital, necesitamos definir la amplitud de la onda como un valor finito cada vez que la muestreamos.
La profundidad de bits determina el número de valores de amplitud posibles que podemos registrar para cada muestra. Las profundidades de bits más comunes son 16 bits, 24 bits y 32 bits. Cada una es un término binario que representa un número de valores posibles. Los sistemas de mayor profundidad de bits son capaces de expresar más valores posibles: