To znamená, že můžeme zachytit a rekonstruovat frekvenci původní sinusové vlny se vzorkovací frekvencí, která je nejméně dvojnásobkem její frekvence, což se nazývá Nyquistova frekvence. Naopak systém může zachytit a rekonstruovat frekvence až do poloviny vzorkovací frekvence, což je hranice nazývaná Nyquistova frekvence.
Signál nad Nyquistovou frekvencí není audio-digitálními převodníky (ADC) zaznamenán správně, zrcadlí se zpět přes Nyquistovu frekvenci a zavádí umělé frekvence v procesu zvaném aliasing.
Aby se zabránilo aliasingu, audio-digitálním převodníkům často předcházejí dolnopropustné filtry, které eliminují frekvence nad Nyquistovou frekvencí předtím, než se zvuk dostane do převodníku. Tím se zabrání tomu, aby nežádoucí super vysoké frekvence v původním zvuku způsobovaly aliasing. Dřívější filtry mohly zkreslit zvuk, ale tento problém se minimalizuje s tím, jak se zavádějí lepší technologie.
Standardní vzorkovací frekvence: Nejběžnější vzorkovací frekvence, se kterou se setkáte, je 44,1 kHz
, tedy 44 100 vzorků za sekundu. Jedná se o standard pro většinu spotřebního audia, který se používá pro formáty, jako jsou CD.
Toto číslo není libovolné. Lidé slyší frekvence mezi 20 Hz a 20 kHz. Většina lidí v průběhu života ztrácí schopnost slyšet vyšší frekvence a slyší pouze frekvence do 15 kHz-18 kHz. Toto pravidlo „20-20“ je však stále přijímáno jako standardní rozsah pro vše, co bychom mohli slyšet.
Počítač by měl být schopen rekonstruovat vlny s frekvencemi do 20 kHz, aby bylo zachováno vše, co můžeme slyšet. Vzorkovací frekvence 40 kHz by tedy měla technicky vzato stačit, ne?“
To je pravda, ale abyste zabránili slyšitelnému aliasingu, potřebujete docela výkonný – a svého času drahý – dolnopropustný filtr. Vzorkovací frekvence 44,1 kHz technicky umožňuje nahrávat zvuk o frekvenci až 22,05 kHz. Díky umístění Nyquistovy frekvence mimo náš sluchový rozsah můžeme použít mírnější filtry k odstranění aliasingu bez většího slyšitelného efektu.
Další vzorkovací frekvence:
Přestože 44,1 kHz je přijatelná vzorkovací frekvence pro spotřebitelský zvuk, existují případy, kdy se používají vyšší vzorkovací frekvence. Některé byly zavedeny v počátcích digitálního zvuku, kdy byly výkonné antialiasingové filtry drahé. Posunutí Nyquistovy frekvence ještě výš nám umožňuje umístit filtr stále dál a dál od lidského sluchu, a proto ovlivňuje zvuk ještě méně.
Další běžnou vzorkovací frekvencí je 48 kHz. Vyšší vzorkovací frekvence technicky vede k většímu počtu měření za sekundu a bližšímu obnovení původního zvuku, takže 48 kHz se často používá v kontextu „profesionálního zvuku“ více než v kontextu hudby. Je to například standardní vzorkovací frekvence zvuku pro video. Tato vzorkovací frekvence posouvá Nyquistovu frekvenci na přibližně 24 kHz, což poskytuje další prostor pro vyrovnávací paměť před nutností filtrace.
Někteří inženýři volí práci v ještě vyšších vzorkovacích frekvencích, které bývají násobkem buď 44,1 kHz, nebo 48 kHz. Vzorkovací frekvence 88,2 kHz, 96 kHz, 176,4 kHz a 192 kHz vedou k vyšším Nyquistovým frekvencím, což znamená, že lze zaznamenat a znovu vytvořit nadzvukové frekvence. Nízkofrekvenční filtry mají menší vliv na zvuk a více vzorků za sekundu, což vede k reprodukci původního zvuku s vyšším rozlišením.
Můžete to ale opravdu slyšet?
Někteří zkušení inženýři mohou být schopni slyšet rozdíly mezi vzorkovacími frekvencemi. Se zdokonalováním filtrace a technologií analogové/digitální konverze je však stále obtížnější tyto rozdíly slyšet.
Teoreticky není špatný nápad pracovat ve vyšší vzorkovací frekvenci, například 176,4 kHz nebo 192 kHz. Soubory budou větší, ale může být příjemné maximalizovat kvalitu zvuku až do finálního odrazu. Nakonec však bude zvuk pravděpodobně převeden na 44,1 kHz nebo 48 kHz. Matematicky je mnohem jednodušší převést 88,2 na 44,1 a 96 na 48, takže je lepší zůstat v jednom formátu pro celý projekt. Běžnou praxí je však pracovat ve formátu 44,1 kHz nebo 48 kHz.
Pokud by byl systém nastaven na vzorkovací frekvenci 48 kHz a my bychom použili zvukový soubor 44,1 kHz, systém by načítal vzorky rychleji, než by měl. Výsledkem by byl zrychlený zvuk s mírně vyššími tóny. Opačná situace nastane, pokud je vzorkovací frekvence systému na stupnici 44,1 kHz a zvukové soubory jsou na stupnici 48 kHz; zvuk zní zpomaleně a o něco níže.“
Super vysoké vzorkovací frekvence mají také zajímavé kreativní využití. Pokud jste někdy snížili výšku tónu standardního zvukového souboru s frekvencí 44,1 kHz, pravděpodobně jste si všimli, že výšky jsou poněkud prázdné. Frekvence nad 22,05 kHz byly před převodem odfiltrovány, takže zde není žádný frekvenční obsah, který by bylo možné snížit, což má za následek zející díru ve výškách.
Pokud by však byl tento zvuk zaznamenán například při 192 kHz, byly by zaznamenány frekvence až do 96 kHz v původním zvuku. To je samozřejmě daleko za hranicí toho, co lidé mohou slyšet, ale snížení výšky zvuku způsobí, že tyto neslyšitelné frekvence budou slyšitelné. Výsledkem je, že můžete výrazně snížit výšku tónu nahrávky a zároveň zachovat vysokofrekvenční obsah. Další informace o vzorkovací frekvenci najdete v tomto videu.
Bitová hloubka
Analogový zvuk je spojitá vlna s fakticky nekonečným počtem možných hodnot amplitudy. Abychom však mohli tuto vlnu měřit v digitálním zvuku, musíme při každém vzorkování definovat amplitudu vlny jako konečnou hodnotu.
Bitová hloubka určuje počet možných hodnot amplitudy, které můžeme zaznamenat pro každý vzorek. Nejběžnější bitové hloubky jsou 16bitová, 24bitová a 32bitová. Každá z nich je binární výraz, který představuje počet možných hodnot. Systémy s vyšší bitovou hloubkou jsou schopny vyjádřit více možných hodnot: