Noções básicas de áudio digital: Taxa de amostragem e profundidade de bits

Isto significa que podemos capturar e reconstruir a frequência da onda senoidal original com uma taxa de amostragem de pelo menos o dobro da sua frequência, uma taxa chamada taxa Nyquist. Inversamente, um sistema pode capturar e recriar frequências até metade da taxa de amostragem, um limite chamado frequência Nyquist.

Sinal acima da frequência Nyquist não é gravado corretamente pelos conversores áudio-digitais (ADCs), tornando-se espelhado de volta através da frequência Nyquist e introduzindo frequências artificiais em um processo chamado aliasing.

Para evitar o aliasing, os conversores áudio-digitais são frequentemente precedidos por filtros passa-baixo que eliminam frequências acima da frequência Nyquist antes que o áudio chegue ao conversor. Isso evitará que freqüências indesejadas super altas no áudio original causem o aliasing. Os primeiros filtros podem manchar o áudio, mas este problema está sendo minimizado com a introdução de uma tecnologia melhor.

Taxa de amostragem padrão: 44,1 kHz

A taxa de amostragem mais comum é de 44,1 kHz, ou 44.100 amostras por segundo. Este é o padrão para a maioria do áudio de consumo, usado para formatos como CDs.

Este não é um número arbitrário. Os humanos podem ouvir frequências entre 20 Hz e 20 kHz. A maioria das pessoas perde a capacidade de ouvir frequências superiores ao longo da sua vida e só consegue ouvir frequências até 15 kHz-18 kHz. No entanto, esta regra “20 a 20” ainda é aceita como a faixa padrão para tudo que pudemos ouvir.

O computador deve ser capaz de recriar ondas com freqüências de até 20 kHz, a fim de preservar tudo o que podemos ouvir. Portanto, uma taxa de amostragem de 40 kHz deve tecnicamente fazer o truque, certo?

Isso é verdade, mas você precisa de um filtro de passagem bastante potente – e de uma vez, caro – para evitar o aliasing audível. A taxa de amostragem de 44,1 kHz permite tecnicamente a gravação de áudio em frequências até 22,05 kHz. Ao colocar a frequência Nyquist fora da nossa faixa auditiva, podemos usar filtros mais moderados para eliminar o aliasing sem muito efeito audível.

Outras taxas de amostragem: 48 kHz, 88,2 kHz, 96 kHz, etc.

Embora 44,1 kHz seja uma taxa de amostragem aceitável para o áudio de consumo, há casos em que são utilizadas taxas de amostragem mais elevadas. Alguns foram introduzidos durante os primeiros dias do áudio digital quando os poderosos filtros anti-aliasing eram caros. Mover a frequência Nyquist ainda mais alta nos permite colocar o filtro cada vez mais longe da audição humana e, portanto, impactar o áudio ainda menos.

48 kHz é outra frequência de amostragem comum. A maior taxa de amostragem conduz tecnicamente a mais medições por segundo e a uma recriação mais próxima do áudio original, por isso 48 kHz é frequentemente utilizado em contextos “áudio profissional” mais do que em contextos musicais. Por exemplo, é a taxa de amostragem padrão em áudio para vídeo. Esta taxa de amostragem move a frequência Nyquist para cerca de 24 kHz, dando mais espaço de memória antes de ser necessário filtrar.

Alguns engenheiros optam por trabalhar com taxas de amostragem ainda mais elevadas, que tendem a ser múltiplos de 44,1 kHz ou 48 kHz. Taxas de amostragem de 88,2 kHz, 96 kHz, 176,4 kHz e 192 kHz resultam em frequências Nyquist mais altas, o que significa que as frequências supersónicas podem ser gravadas e recriadas. Os filtros de baixa passagem têm menos impacto no som e mais amostras por segundo, o que resulta numa recriação mais em alta definição do áudio original.

Pode realmente ouvir isto, embora?

alguns engenheiros experientes possam ser capazes de ouvir diferenças entre as taxas de amostragem. No entanto, à medida que as tecnologias de filtragem e conversão analógica/digital melhoram, torna-se mais difícil ouvir estas diferenças.

Em teoria, não é uma má ideia trabalhar com uma taxa de amostragem mais elevada, como 176,4 kHz ou 192 kHz. Os arquivos serão maiores, mas pode ser bom maximizar a qualidade do som até o bounce final. No final, entretanto, o áudio provavelmente será convertido para 44,1 kHz ou 48 kHz. É matematicamente muito mais fácil converter 88,2 para 44,1 e 96 para 48, por isso é melhor ficar em um formato para todo o projeto. Entretanto, uma prática comum é trabalhar em 44,1 kHz ou 48 kHz.

Se o sistema fosse configurado para uma taxa de amostragem de 48 kHz e usássemos um arquivo de áudio de 44,1 kHz, o sistema leria as amostras mais rápido do que deveria. Como resultado, o áudio soaria acelerado e ligeiramente mais agudo. O inverso acontece se a taxa de amostragem do sistema estiver na escala de 44,1 kHz e os arquivos de áudio estiverem na escala de 48 kHz; os sons de áudio ficam mais lentos e ligeiramente mais baixos.

As taxas de amostragem mais altas também têm um uso criativo interessante. Se você já baixou o tom de um arquivo de áudio padrão de 44,1 kHz, você provavelmente já notou que as altas se tornam um pouco vazias. Frequências acima de 22,05 kHz foram filtradas antes da conversão, por isso não há conteúdo de frequência para baixar o tom, resultando em um buraco nas altas.

No entanto, se este áudio fosse gravado a 192 kHz, por exemplo, seriam gravadas frequências de até 96 kHz no áudio original. Isto é obviamente muito fora do que os humanos podem ouvir, mas a inclinação do áudio faz com que estas frequências inaudíveis se tornem audíveis. Como resultado, você pode baixar muito o tom de uma gravação enquanto preserva o conteúdo de alta frequência. Para mais informações sobre a taxa de amostragem, certifique-se de verificar este vídeo.

Profundidade do bit

Audio analógico é uma onda contínua, com um número efetivamente infinito de valores de amplitude possíveis. No entanto, para medir esta onda em áudio digital, precisamos definir a amplitude da onda como um valor finito cada vez que a sampleamos.

A profundidade do bit determina o número de valores de amplitude possíveis que podemos gravar para cada amostra. As profundidades de bits mais comuns são 16-bit, 24-bit e 32-bit. Cada um é um termo binário, representando um número de valores possíveis. Sistemas com profundidades de bits mais altas são capazes de expressar mais valores possíveis:

Deixe uma resposta

O seu endereço de email não será publicado.