Aceasta înseamnă că putem capta și reconstrui frecvența undei sinusoidale originale cu o rată de eșantionare de cel puțin două ori mai mare decât frecvența acesteia, o rată numită rata Nyquist. Invers, un sistem poate capta și recrea frecvențe până la jumătate din rata de eșantionare, o limită numită frecvența Nyquist.
Semnalul peste frecvența Nyquist nu este înregistrat corespunzător de convertoarele audio-digitale (ADC), devenind oglindit peste frecvența Nyquist și introducând frecvențe artificiale într-un proces numit aliasing.
Pentru a preveni aliasing-ul, convertoarele audio-digitale sunt adesea precedate de filtre trece-jos care elimină frecvențele peste frecvența Nyquist înainte ca semnalul audio să ajungă la convertor. Acest lucru va preveni ca frecvențele super înalte nedorite din sunetul original să provoace aliasing. Filtrele timpurii puteau altera sunetul, dar această problemă este redusă la minimum pe măsură ce se introduce o tehnologie mai bună.
Frecvența de eșantionare standard: 44,1 kHz
Cea mai comună rată de eșantionare pe care o veți vedea este de 44,1 kHz, sau 44.100 de eșantioane pe secundă. Acesta este standardul pentru majoritatea produselor audio de consum, utilizat pentru formate precum CD-urile.
Nu este un număr arbitrar. Oamenii pot auzi frecvențe între 20 Hz și 20 kHz. Majoritatea oamenilor își pierd capacitatea de a auzi frecvențele superioare pe parcursul vieții și pot auzi doar frecvențe de până la 15 kHz-18 kHz. Cu toate acestea, această regulă „20 la 20” este încă acceptată ca fiind intervalul standard pentru tot ceea ce am putea auzi.
Computerul ar trebui să fie capabil să recreeze unde cu frecvențe de până la 20 kHz pentru a păstra tot ceea ce putem auzi. Prin urmare, o frecvență de eșantionare de 40 kHz ar trebui, din punct de vedere tehnic, să fie suficientă, nu-i așa?
Acest lucru este adevărat, dar aveți nevoie de un filtru trece-jos destul de puternic – și, la un moment dat, scump – pentru a preveni aliasing-ul audibil. Frecvența de eșantionare de 44,1 kHz permite, din punct de vedere tehnic, înregistrarea audio la frecvențe de până la 22,05 kHz. Prin plasarea frecvenței Nyquist în afara intervalului nostru auditiv, putem folosi filtre mai moderate pentru a elimina aliasing-ul fără prea mult efect audibil.
Alte frecvențe de eșantionare: 48 kHz, 88,2 kHz, 88,2 kHz, 96 kHz, etc.
În timp ce 44,1 kHz este o rată de eșantionare acceptabilă pentru audio de consum, există cazuri în care se folosesc rate de eșantionare mai mari. Unele au fost introduse în timpul primelor zile ale audio-ului digital, când filtrele puternice anti-aliasing erau scumpe. Mutarea frecvenței Nyquist și mai sus ne permite să plasăm filtrul din ce în ce mai departe de auzul uman și, prin urmare, să avem un impact și mai mic asupra sunetului.
48 kHz este o altă frecvență de eșantionare comună. Frecvența de eșantionare mai mare duce, din punct de vedere tehnic, la mai multe măsurători pe secundă și la o recreare mai apropiată a sunetului original, astfel încât 48 kHz este adesea folosită în contexte „audio profesionale” mai mult decât în contexte muzicale. De exemplu, este rata de eșantionare standard în audio pentru video. Această rată de eșantionare mută frecvența Nyquist la aproximativ 24 kHz, oferind mai mult spațiu tampon înainte de a fi necesară filtrarea.
Câțiva ingineri aleg să lucreze la rate de eșantionare chiar mai mari, care tind să fie multiplii fie de 44,1 kHz, fie de 48 kHz. Frecvențele de eșantionare de 88,2 kHz, 96 kHz, 176,4 kHz și 192 kHz au ca rezultat frecvențe Nyquist mai mari, ceea ce înseamnă că pot fi înregistrate și recreate frecvențe supersonice. Filtrele de trecere joasă au un impact mai mic asupra sunetului și mai multe eșantioane pe secundă, ceea ce duce la o recreare de înaltă definiție a sunetului original.
Puteți auzi cu adevărat acest lucru, totuși?
Câțiva ingineri experimentați pot fi capabili să audă diferențele dintre ratele de eșantionare. Cu toate acestea, pe măsură ce tehnologiile de filtrare și de conversie analogică/digitală se îmbunătățesc, devine din ce în ce mai dificil să auziți aceste diferențe.
În teorie, nu este o idee rea să lucrați la o rată de eșantionare mai mare, cum ar fi 176,4 kHz sau 192 kHz. Fișierele vor fi mai mari, dar poate fi bine să se maximizeze calitatea sunetului până la bounce-ul final. În cele din urmă, totuși, sunetul va fi probabil convertit fie la 44,1 kHz, fie la 48 kHz. Din punct de vedere matematic, este mult mai ușor să convertiți 88,2 la 44,1 și 96 la 48, așa că este mai bine să rămâneți într-un singur format pentru întregul proiect. Cu toate acestea, o practică obișnuită este de a lucra în 44,1 kHz sau 48 kHz.
Dacă sistemul a fost setat la o frecvență de eșantionare de 48 kHz și am folosit un fișier audio de 44,1 kHz, sistemul ar citi eșantioanele mai repede decât ar trebui. Ca urmare, sunetul audio ar suna accelerat și ușor mai acut. Invers se întâmplă dacă rata de eșantionare a sistemului este pe scara de 44,1 kHz și fișierele audio sunt pe scara de 48 kHz; sunetul audio sună mai încet și ușor mai grav.
Ratele de eșantionare super-înalte au, de asemenea, o utilizare creativă interesantă. Dacă ați coborât vreodată tonul unui fișier audio standard de 44,1 kHz, ați observat probabil că frecvențele înalte devin oarecum goale. Frecvențele mai mari de 22,05 kHz au fost filtrate înainte de conversie, așa că nu există conținut de frecvență pentru a scădea tonul, rezultând o gaură imensă în înalte.
Cu toate acestea, dacă acest audio ar fi fost înregistrat la 192 kHz, de exemplu, ar fi fost înregistrate frecvențe de până la 96 kHz în audio original. În mod evident, acest lucru este cu mult în afara a ceea ce pot auzi oamenii, dar reducerea frecvenței audio face ca aceste frecvențe inaudibile să devină audibile. Prin urmare, puteți scădea foarte mult tonul unei înregistrări, păstrând în același timp conținutul de înaltă frecvență. Pentru mai multe informații despre rata de eșantionare, nu uitați să consultați acest videoclip.
Profunditatea biților
Audio analogic este o undă continuă, cu un număr efectiv infinit de valori posibile ale amplitudinii. Cu toate acestea, pentru a măsura această undă în audio digital, trebuie să definim amplitudinea undei ca fiind o valoare finită de fiecare dată când o eșantionăm.
Profunditatea biților determină numărul de valori posibile ale amplitudinii pe care le putem înregistra pentru fiecare eșantion. Cele mai comune adâncimi de biți sunt 16 biți, 24 biți și 32 biți. Fiecare este un termen binar, reprezentând un număr de valori posibile. Sistemele cu adâncimi de bit mai mari sunt capabile să exprime mai multe valori posibile:
.