Les bases de l’audio numérique : Fréquence d’échantillonnage et profondeur de bits

Cela signifie que nous pouvons capturer et reconstruire la fréquence de l’onde sinusoïdale originale avec une fréquence d’échantillonnage au moins deux fois supérieure à sa fréquence, un taux appelé taux de Nyquist. Inversement, un système peut capturer et recréer des fréquences jusqu’à la moitié du taux d’échantillonnage, une limite appelée fréquence de Nyquist.

Le signal au-dessus de la fréquence de Nyquist n’est pas enregistré correctement par les convertisseurs audio-numériques (ADC), devenant reflété en retour à travers la fréquence de Nyquist et introduisant des fréquences artificielles dans un processus appelé aliasing.

Pour éviter l’aliasing, les convertisseurs audio-numériques sont souvent précédés de filtres passe-bas qui éliminent les fréquences au-dessus de la fréquence de Nyquist avant que l’audio n’atteigne le convertisseur. Cela empêchera les super hautes fréquences indésirables de l’audio d’origine de provoquer un aliasing. Les premiers filtres pouvaient altérer l’audio, mais ce problème est minimisé au fur et à mesure que de meilleures technologies sont introduites.

Fréquence d’échantillonnage standard : 44,1 kHz

Le taux d’échantillonnage le plus courant que vous verrez est de 44,1 kHz, soit 44 100 échantillons par seconde. C’est la norme pour la plupart des produits audio grand public, utilisée pour des formats comme les CD.

Ce n’est pas un nombre arbitraire. Les êtres humains peuvent entendre des fréquences comprises entre 20 Hz et 20 kHz. La plupart des gens perdent leur capacité à entendre les fréquences supérieures au cours de leur vie et ne peuvent entendre que des fréquences allant jusqu’à 15 kHz-18 kHz. Cependant, cette règle du « 20 à 20 » est toujours acceptée comme la gamme standard pour tout ce que nous pourrions entendre.

L’ordinateur devrait être capable de recréer des ondes avec des fréquences allant jusqu’à 20 kHz afin de préserver tout ce que nous pouvons entendre. Par conséquent, une fréquence d’échantillonnage de 40 kHz devrait techniquement faire l’affaire, n’est-ce pas ?

C’est vrai, mais il faut un filtre passe-bas assez puissant – et à une époque, coûteux – pour éviter le repliement audible. La fréquence d’échantillonnage de 44,1 kHz permet techniquement d’enregistrer des sons à des fréquences allant jusqu’à 22,05 kHz. En plaçant la fréquence de Nyquist en dehors de notre plage d’audition, nous pouvons utiliser des filtres plus modérés pour éliminer le crénelage sans grand effet audible.

Autres fréquences d’échantillonnage : 48 kHz, 88,2 kHz, 96 kHz, etc.

Bien que 44,1 kHz soit une fréquence d’échantillonnage acceptable pour l’audio grand public, il existe des cas où des fréquences d’échantillonnage plus élevées sont utilisées. Certains ont été introduits aux débuts de l’audio numérique, lorsque de puissants filtres anti-aliasing étaient coûteux. Déplacer la fréquence de Nyquist encore plus haut nous permet de placer le filtre de plus en plus loin de l’audition humaine, et donc d’impacter encore moins l’audio.

48 kHz est une autre fréquence d’échantillonnage courante. Le taux d’échantillonnage plus élevé conduit techniquement à plus de mesures par seconde et à une recréation plus proche de l’audio original, de sorte que 48 kHz est souvent utilisé dans des contextes « audio professionnels » plus que dans des contextes musicaux. Par exemple, c’est la fréquence d’échantillonnage standard en audio pour la vidéo. Cette fréquence d’échantillonnage déplace la fréquence de Nyquist à environ 24 kHz, ce qui donne une plus grande marge de manœuvre avant que le filtrage ne soit nécessaire.

Certains ingénieurs choisissent de travailler dans des fréquences d’échantillonnage encore plus élevées, qui ont tendance à être des multiples de 44,1 kHz ou 48 kHz. Les fréquences d’échantillonnage de 88,2 kHz, 96 kHz, 176,4 kHz et 192 kHz donnent lieu à des fréquences de Nyquist plus élevées, ce qui signifie que les fréquences supersoniques peuvent être enregistrées et recréées. Les filtres passe-bas ont moins d’impact sur le son et plus d’échantillons par seconde, ce qui se traduit par une recréation plus haute définition de l’audio original.

Pouvez-vous vraiment l’entendre, cependant ?

Certains ingénieurs expérimentés peuvent être en mesure d’entendre les différences entre les fréquences d’échantillonnage. Cependant, au fur et à mesure que les technologies de filtrage et de conversion analogique/numérique s’améliorent, il devient plus difficile d’entendre ces différences.

En théorie, ce n’est pas une mauvaise idée de travailler dans une fréquence d’échantillonnage plus élevée, comme 176,4 kHz ou 192 kHz. Les fichiers seront plus volumineux, mais il peut être agréable de maximiser la qualité sonore jusqu’au rebondissement final. Au final, cependant, le son sera probablement converti en 44,1 kHz ou 48 kHz. Il est mathématiquement beaucoup plus facile de convertir 88,2 en 44,1 et 96 en 48, il est donc préférable de rester dans un seul format pour l’ensemble du projet. Cependant, une pratique courante consiste à travailler en 44,1 kHz ou 48 kHz.

Si le système était réglé sur une fréquence d’échantillonnage de 48 kHz et que nous utilisions un fichier audio de 44,1 kHz, le système lirait les échantillons plus rapidement qu’il ne le devrait. En conséquence, l’audio semblerait accéléré et légèrement plus aigu. L’inverse se produit si le taux d’échantillonnage du système est sur l’échelle de 44,1 kHz et que les fichiers audio sont sur l’échelle de 48 kHz ; l’audio sonne ralenti et légèrement plus bas.

Les taux d’échantillonnage super élevés ont également une utilisation créative intéressante. Si vous avez déjà baissé la hauteur d’un fichier audio standard de 44,1 kHz, vous avez probablement remarqué que les aigus deviennent quelque peu vides. Les fréquences supérieures à 22,05 kHz ont été filtrées avant la conversion, il n’y a donc aucun contenu de fréquence à abaisser, ce qui entraîne un trou béant dans les aigus.

Cependant, si cet audio était enregistré à 192 kHz, par exemple, des fréquences allant jusqu’à 96 kHz dans l’audio original seraient enregistrées. C’est évidemment en dehors de ce que les humains peuvent entendre, mais le fait de baisser le niveau de l’audio fait que ces fréquences inaudibles deviennent audibles. Par conséquent, vous pouvez réduire considérablement la hauteur du son d’un enregistrement tout en préservant le contenu des hautes fréquences. Pour plus d’informations sur la fréquence d’échantillonnage, assurez-vous de consulter cette vidéo.

Profondeur de bits

L’audio analogique est une onde continue, avec un nombre effectivement infini de valeurs d’amplitude possibles. Cependant, pour mesurer cette onde en audio numérique, nous devons définir l’amplitude de l’onde comme une valeur finie chaque fois que nous l’échantillonnons.

La profondeur de bit détermine le nombre de valeurs d’amplitude possibles que nous pouvons enregistrer pour chaque échantillon. Les profondeurs de bits les plus courantes sont 16 bits, 24 bits et 32 bits. Chacune est un terme binaire, représentant un nombre de valeurs possibles. Les systèmes de profondeurs de bits supérieures sont capables d’exprimer un plus grand nombre de valeurs possibles:

.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.