Digitális hangzás alapjai:

Ez azt jelenti, hogy az eredeti szinuszhullám frekvenciáját legalább kétszeres frekvenciájú mintavételi frekvenciával tudjuk rögzíteni és rekonstruálni, ezt a frekvenciát Nyquist-rátának nevezzük. Ezzel szemben egy rendszer legfeljebb a mintavételi frekvencia felének megfelelő frekvenciákat képes rögzíteni és rekonstruálni, ezt a határértéket Nyquist-frekvenciának nevezzük.

A Nyquist-frekvencia feletti jelet az audio-digitális átalakítók (ADC-k) nem rögzítik megfelelően, visszatükröződik a Nyquist-frekvenciára, és mesterséges frekvenciákat vezet be az aliasingnek nevezett folyamat során.

Az aliasing megelőzése érdekében az audio-digitális átalakítókat gyakran aluláteresztő szűrők előzik meg, amelyek eltávolítják a Nyquist-frekvencia feletti frekvenciákat, mielőtt a hang eléri az átalakítót. Ez megakadályozza, hogy az eredeti hangban lévő nem kívánt szuper magas frekvenciák aliasinget okozzanak. A korai szűrők beszennyezhették a hangot, de ezt a problémát a jobb technológia bevezetésével egyre inkább minimalizálják.

Standard mintavételi sebesség: 44,1 kHz

A leggyakrabban előforduló mintavételi frekvencia a 44,1 kHz, azaz 44 100 minta/másodperc. Ez a legtöbb fogyasztói audio szabvány, amelyet az olyan formátumoknál használnak, mint a CD-k.

Ez nem egy önkényes szám. Az emberek 20 Hz és 20 kHz közötti frekvenciákat hallanak. A legtöbb ember élete során elveszíti a felsőbb frekvenciák hallásának képességét, és csak 15 kHz-18 kHz-ig képes frekvenciákat hallani. Ez a “20-20” szabály azonban még mindig elfogadott szabványos tartományként mindarra, amit hallani tudunk.

A számítógépnek képesnek kell lennie arra, hogy 20 kHz-ig terjedő frekvenciájú hullámokat hozzon létre újra, hogy megőrizze mindazt, amit hallani tudunk. Ezért a 40 kHz-es mintavételi frekvenciának technikailag elégségesnek kellene lennie, nem?

Ez igaz, de egy elég erős – és egy időben drága – aluláteresztő szűrőre van szükség a hallható aliasing megakadályozásához. A 44,1 kHz-es mintavételi frekvencia technikailag lehetővé teszi a 22,05 kHz-ig terjedő frekvenciájú hangok rögzítését. Azzal, hogy a Nyquist-frekvencia a hallási tartományunkon kívülre került, mérsékeltebb szűrőket használhatunk az aliasing kiküszöbölésére, különösebb hallható hatás nélkül.

Más mintavételi frekvenciák:

Míg a 44,1 kHz elfogadható mintavételi frekvencia a fogyasztói hangok számára, vannak esetek, amikor magasabb mintavételi frekvenciákat használnak. Néhányat a digitális hang korai időszakában vezettek be, amikor a nagy teljesítményű kiegyenlítésgátló szűrők még drágák voltak. A Nyquist-frekvencia még magasabbra mozgatása lehetővé teszi, hogy a szűrőt egyre távolabb helyezzük az emberi hallástól, és így még kevésbé befolyásolja a hangot.

A 48 kHz egy másik gyakori mintavételi frekvencia. A magasabb mintavételi frekvencia technikailag több mérést eredményez másodpercenként, és közelebb hozza az eredeti hangot, ezért a 48 kHz-et gyakran inkább “professzionális audio” kontextusokban használják, mint zenei kontextusokban. Ez a szabványos mintavételi frekvencia például a videókhoz használt hangoknál. Ez a mintavételi frekvencia a Nyquist-frekvenciát 24 kHz környékére helyezi át, ami további pufferteret biztosít, mielőtt szűrésre lenne szükség.

Egyes mérnökök még magasabb mintavételi frekvenciákat választanak, amelyek általában a 44,1 kHz vagy a 48 kHz többszörösei. A 88,2 kHz, 96 kHz, 176,4 kHz és 192 kHz mintavételi frekvenciák magasabb Nyquist-frekvenciákat eredményeznek, ami azt jelenti, hogy szuperszonikus frekvenciák is rögzíthetők és újraalkothatók. Az aluláteresztő szűrők kevésbé befolyásolják a hangot, és másodpercenként több mintát tartalmaznak, ami az eredeti hang nagy felbontású rekonstrukcióját eredményezi.

Tényleg hallja ezt?

Egyes tapasztalt mérnökök talán képesek meghallani a mintavételi sebességek közötti különbségeket. Azonban ahogy a szűrés és az analóg/digitális átalakítási technológiák fejlődnek, egyre nehezebb lesz hallani ezeket a különbségeket.

Egyáltalán nem rossz ötlet magasabb mintavételi frekvencián, például 176,4 kHz-en vagy 192 kHz-en dolgozni. A fájlok nagyobbak lesznek, de jó lehet maximalizálni a hangminőséget a végső pattintásig. A végén azonban a hangot valószínűleg 44,1 kHz-re vagy 48 kHz-re konvertáljuk. Matematikailag sokkal könnyebb a 88,2-t 44,1-re és a 96-ot 48-ra konvertálni, ezért a legjobb, ha az egész projekt során egy formátumban marad. Általános gyakorlat azonban, hogy 44,1 kHz-ben vagy 48 kHz-ben dolgozunk.

Ha a rendszer 48 kHz-es mintavételi frekvenciára lenne beállítva, és 44,1 kHz-es hangfájlt használnánk, a rendszer gyorsabban olvasná a mintákat, mint kellene. Ennek eredményeképpen a hang gyorsítottan és kissé magasabban szólna. Ennek fordítottja történik, ha a rendszer mintavételi sebessége a 44,1 kHz-es skálán van, a hangfájlok pedig a 48 kHz-es skálán vannak; a hang lassabban és kissé halkabban hangzik.

A szupernagy mintavételi sebességeknek van egy érdekes kreatív felhasználási módja is. Ha valaha is csökkentette a hangmagasságot egy normál 44,1 kHz-es hangfájlban, valószínűleg észrevette, hogy a magas hangok kissé üressé válnak. A 22,05 kHz feletti frekvenciákat a konvertálás előtt kiszűrték, így nincs olyan frekvenciatartalom, amelyet le lehetne hangmagasságolni, ami tátongó lyukat eredményez a magas hangokban.

Ha azonban ezt a hangot például 192 kHz-en rögzítették volna, akkor az eredeti hangban 96 kHz-ig terjedő frekvenciák is rögzítésre kerülnének. Ez nyilvánvalóan messze kívül esik azon, amit az emberek hallani tudnak, de a hang lefelé hangolásával ezek a hallhatatlan frekvenciák hallhatóvá válnak. Ennek eredményeképpen nagymértékben csökkentheti a felvétel hangmagasságát, miközben megőrizheti a magas frekvenciájú tartalmakat. A mintavételi frekvenciával kapcsolatos további információkért mindenképpen nézze meg ezt a videót.

Bitmélység

Az analóg hang folyamatos hullám, amelynek amplitúdóértékei gyakorlatilag végtelen számúak lehetnek. Ahhoz azonban, hogy ezt a hullámot digitális hangban mérni tudjuk, a hullám amplitúdóját minden egyes mintavételezéskor véges értékként kell definiálnunk.

A bitmélység határozza meg az egyes mintákhoz rögzíthető lehetséges amplitúdóértékek számát. A leggyakoribb bitmélységek a 16 bites, a 24 bites és a 32 bites. Mindegyik egy bináris kifejezés, amely a lehetséges értékek számát jelenti. A nagyobb bitmélységű rendszerek több lehetséges értéket képesek kifejezni:

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.