Podstawy cyfrowego audio: Sample Rate and Bit Depth

To oznacza, że możemy uchwycić i zrekonstruować częstotliwość oryginalnej fali sinusoidalnej z częstotliwością próbkowania co najmniej dwa razy większą od jej częstotliwości, częstotliwością zwaną częstotliwością Nyquista. Odwrotnie, system może przechwytywać i odtwarzać częstotliwości do połowy częstotliwości próbkowania, limit zwany częstotliwością Nyquista.

Sygnał powyżej częstotliwości Nyquista nie jest rejestrowany prawidłowo przez przetworniki audio-cyfrowe (ADC), stając się lustrzanym odbiciem w poprzek częstotliwości Nyquista i wprowadzając sztuczne częstotliwości w procesie zwanym aliasingiem.

Aby zapobiec aliasingowi, przetworniki audio-cyfrowe są często poprzedzone filtrami dolnoprzepustowymi, które eliminują częstotliwości powyżej częstotliwości Nyquista, zanim dźwięk dotrze do przetwornika. Zapobiega to niepożądanym super wysokim częstotliwościom w oryginalnym dźwięku z powodowania aliasingu. Wczesne filtry mogły zanieczyszczać dźwięk, ale problem ten jest minimalizowany w miarę wprowadzania lepszych technologii.

Standardowa częstotliwość próbkowania: 44,1 kHz

Najczęstszą częstotliwością próbkowania, jaką spotkasz, jest 44,1 kHz, czyli 44 100 próbek na sekundę. Jest to standard dla większości konsumenckich urządzeń audio, używany w formatach takich jak CD.

Nie jest to arbitralna liczba. Ludzie mogą słyszeć częstotliwości pomiędzy 20 Hz a 20 kHz. Większość ludzi traci zdolność słyszenia górnych częstotliwości w ciągu swojego życia i może słyszeć tylko częstotliwości do 15 kHz-18 kHz. Jednak ta zasada „20 do 20” jest nadal akceptowana jako standardowy zakres dla wszystkiego, co moglibyśmy usłyszeć.

Komputer powinien być w stanie odtworzyć fale o częstotliwościach do 20 kHz, aby zachować wszystko, co możemy usłyszeć. W związku z tym, częstotliwość próbkowania 40 kHz powinna technicznie zrobić sztuczkę, prawda?

To prawda, ale potrzebujesz dość potężnego – i w pewnym momencie drogiego – filtra dolnoprzepustowego, aby zapobiec słyszalnemu aliasingowi. Częstotliwość próbkowania 44,1 kHz technicznie pozwala na zapis dźwięku o częstotliwościach do 22,05 kHz. Umieszczając częstotliwość Nyquista poza naszym zakresem słyszalności, możemy użyć bardziej umiarkowanych filtrów do wyeliminowania aliasingu bez większego słyszalnego efektu.

Inne częstotliwości próbkowania: 48 kHz, 88,2 kHz, 96 kHz, itd.

Choć 44,1 kHz jest akceptowalną częstotliwością próbkowania dla konsumenckiego audio, istnieją przypadki, w których stosowane są wyższe częstotliwości próbkowania. Niektóre z nich zostały wprowadzone we wczesnych dniach cyfrowego audio, kiedy potężne filtry antyaliasingowe były drogie. Przesunięcie częstotliwości Nyquista jeszcze wyżej pozwala nam umieścić filtr coraz dalej od ludzkiego słuchu, a zatem wpływać na dźwięk w jeszcze mniejszym stopniu.

48 kHz jest inną popularną częstotliwością próbkowania. Wyższa częstotliwość próbkowania technicznie prowadzi do większej ilości pomiarów na sekundę i bliższego odtworzenia oryginalnego dźwięku, więc 48 kHz jest często używane w kontekście „profesjonalnego audio” bardziej niż w kontekście muzyki. Dla przykładu, jest to standardowa częstotliwość próbkowania w audio dla wideo. Ta częstotliwość próbkowania przesuwa częstotliwość Nyquista do około 24 kHz, dając więcej przestrzeni buforowej zanim filtrowanie będzie potrzebne.

Niektórzy inżynierowie decydują się na pracę z jeszcze wyższymi częstotliwościami próbkowania, które zwykle są wielokrotnością albo 44,1 kHz albo 48 kHz. Częstotliwości próbkowania 88,2 kHz, 96 kHz, 176,4 kHz i 192 kHz skutkują wyższymi częstotliwościami Nyquista, co oznacza, że częstotliwości naddźwiękowe mogą być rejestrowane i odtwarzane. Filtry dolnoprzepustowe mają mniejszy wpływ na dźwięk i więcej próbek na sekundę, co skutkuje odtworzeniem oryginalnego dźwięku w bardziej wysokiej rozdzielczości.

Czy naprawdę to słychać?

Niektórzy doświadczeni inżynierowie mogą być w stanie usłyszeć różnice pomiędzy częstotliwościami próbkowania. Jednak wraz z poprawą technologii filtrowania i konwersji analogowo-cyfrowej, coraz trudniej usłyszeć te różnice.

W teorii, nie jest złym pomysłem pracować w wyższej częstotliwości próbkowania, jak 176.4 kHz lub 192 kHz. Pliki będą większe, ale może to być miłe, aby zmaksymalizować jakość dźwięku aż do ostatecznego odbicia. Ostatecznie jednak, dźwięk zostanie prawdopodobnie przekonwertowany do 44,1 lub 48 kHz. Matematycznie dużo łatwiej jest przekonwertować 88,2 na 44,1 i 96 na 48, więc najlepiej pozostać przy jednym formacie dla całego projektu. Jednak powszechną praktyką jest praca w 44,1 lub 48 kHz.

Gdyby system był ustawiony na częstotliwość próbkowania 48 kHz, a my użylibyśmy pliku audio 44,1 kHz, system odczytywałby próbki szybciej niż powinien. W rezultacie dźwięk byłby przyspieszony i miałby nieco wyższe dźwięki. Odwrotna sytuacja ma miejsce, gdy częstotliwość próbkowania systemu jest na skali 44,1 kHz, a pliki audio są na skali 48 kHz; dźwięk jest spowolniony i nieco niżej brzmiący.

Super-wysokie częstotliwości próbkowania mają również interesujące twórcze zastosowanie. Jeśli kiedykolwiek obniżyłeś wysokość dźwięku w standardowym pliku audio 44,1 kHz, prawdopodobnie zauważyłeś, że wysokie tony stają się nieco puste. Częstotliwości powyżej 22.05 kHz zostały odfiltrowane przed konwersją, więc nie ma żadnej zawartości częstotliwościowej do obniżenia, co skutkuje dziurami w wysokich tonach.

Jednakże, jeśli ten dźwięk zostałby nagrany przy 192 kHz, na przykład, częstotliwości do 96 kHz w oryginalnym dźwięku zostałyby zarejestrowane. Jest to oczywiście daleko poza tym, co człowiek może usłyszeć, ale obniżenie poziomu dźwięku powoduje, że te niesłyszalne częstotliwości stają się słyszalne. W rezultacie można znacznie zmniejszyć wysokość dźwięku w nagraniu, zachowując zawartość wysokich częstotliwości. Aby uzyskać więcej informacji na temat częstotliwości próbkowania, sprawdź ten film.

Głębie bitowe

Analogowy dźwięk jest falą ciągłą, z efektywnie nieskończoną liczbą możliwych wartości amplitudy. Jednakże, aby zmierzyć tę falę w dźwięku cyfrowym, musimy zdefiniować amplitudę fali jako skończoną wartość za każdym razem, gdy ją próbkujemy.

Głębokość bitowa określa liczbę możliwych wartości amplitudy, które możemy zarejestrować dla każdej próbki. Najczęściej spotykane głębokości bitowe to 16-bitowa, 24-bitowa i 32-bitowa. Każda z nich jest terminem binarnym, reprezentującym pewną liczbę możliwych wartości. Systemy o większej głębokości bitowej są w stanie wyrazić więcej możliwych wartości:

.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.