Twoje PC  
Zarejestruj się na Twoje PC
TwojePC.pl | PC | Komputery, nowe technologie, recenzje, testy
M E N U
  0
 » Nowości
0
 » Archiwum
0
 » Recenzje / Testy
0
 » Board
0
 » Rejestracja
0
0
 
Szukaj @ TwojePC
 

w Newsach i na Boardzie
 
TwojePC.pl © 2001 - 2024
RECENZJE | Audiotechnika: dźwięk cyfrowy - czy analog naprawdę był lepszy?
    

 

Audiotechnika: dźwięk cyfrowy - czy analog naprawdę był lepszy?


 Autor: Przemysław Rel | Data: 11/04/13

Zapis cyfrowy

Wiadomo więc, że dźwięk to rozchodząca się we wszystkich kierunkach fala, którą można przedstawić na wykresie. To, co widzimy na wykresie jest niemal bezpośrednio nanoszone na najpopularniejsze analogowe nośniki dźwięku – na płytę winylową i na taśmę magnetyczną. Skoro jest to wykres, to można go zapisać pewnie w postaci funkcji. Wykresy, funkcje... od razu z przerażeniem można zdać sobie sprawę, że to wszystko można wyrazić matematycznie. Matematyka kojarzy się jednak nie tylko z traumą ze szkoły, ale też z komputerami, które w gruncie rzeczy są przerośniętymi kalkulatorami.

Wykres fali dźwiękowej można zapisać w formie cyfrowej, ale trzeba pokonać kilka problemów. Przede wszystkim, odwzorowanie fali dźwiękowej nie będzie dokładne. Odwzorowanie fali następuje poprzez dokonywanie pomiarów jej natężenia wiele razy w ciągu sekundy. Takie pomiary nazywają się próbkowaniem (sampling).

Na powyższym wykresie kolorem czarnym oznaczoną mamy „analogową” falę dźwiękową, zaś czerwone „schody” to cyfrowe odwzorowanie jej. Zwrócicie pewnie uwagę na to, że nie jest to zbyt precyzyjne – ale jest to tylko wykres poglądowy. Ponadto, matematyczny opis fali dźwiękowej jest na tyle dokładny, że podczas odtwarzania jest ona w pełni przywracana do oryginalnej, analogowej formy. Jak by tego było mało, ilość próbek (pomiarów) na sekundę wynosi zwykle ok. 44 tysiące razy, a każdy z tych razy opisany jest kilkudziesięcioma tysiącami wartości liczbowych.

To już brzmi trochę znajomo – płyta Audio CD i większość plików muzycznych na naszych komputerach, „empetrójkach”, czy telefonach, to pliki o częstotliwości próbkowania (sampling rate) wynoszącej 44100Hz (lub 44.1kHz). Istnieje jeszcze druga rzecz mająca znaczenie w cyfrowym dźwięku, mianowicie precyzja pomiarów. Ta określana jest za pomocą bitów, a dokładniej głębi bitów. Najczęściej jest to 16.

Powróćmy do częstotliwości próbkowania. Ma ona bezpośredni związek z maksymalną częstotliwością dźwięku, jaką można zarejestrować i odtworzyć. Częstotliwość dźwięku (odległość między falami dźwięku – o czym wspominaliśmy wcześniej) określa jego wysokość. Ludzkie ucho jest w stanie usłyszeć ok. 20kHz. Dźwięki o większej częstotliwości to tzw. ultradźwięki. Są ludzie, którzy twierdzą, że słyszą dźwięki powyżej 20kHz – nie będziemy tutaj wątpić w ich istnienie, choć warto wspomnieć, że 20kHz są w stanie usłyszeć tylko niektórzy... i tylko młodzi. Wraz z wiekiem narząd słuchu traci precyzję – słuch dorosłej osoby kończy się zwykle w okolicach 16kHz.

Według teorii Harry'ego Nyquista, który już na początku XX wieku opracował zasady odwzorowania audio w formie cyfrowej, maksymalna częstotliwość zarejestrowanego dźwięku jest o połowę niższa od częstotliwości próbkowania. Czyli dźwięk zapisany na płycie CD Audio, o częstotliwości 44,1kHz, jest w stanie odwzorować dźwięki o częstotliwości 22kHz. Wydaje się więc to w zupełności wystarczające – przynajmniej dla większości ludzi.

Teraz słówko na temat głębi bitów. Co to oznacza, że plik audio ma właściwości 44.1kHz i 16 bitów? Bity te określają po prostu ilość szczegółów, które można zapisać dla każdej pojedynczej próbki. Dokładniej: podczas rejestrowania dźwięku cyfrowo, każda próbka opisywana jest za pomocą liczby. Im więcej bitów (zer i jedynek), tym dokładniejsze odwzorowanie danego sampla i całej fali dźwiękowej.

Podczas takiego zapisu powstają pewne przekłamania, określane mianem błędów kwantyzacji (kwantyzacja to właśnie proces opisu próbki za pomocą bitów), co w praktyce oznacza... szum. Im mniej bitów, tym więcej przekłamań w zapisanym dźwięku. Im więcej bitów przeznaczymy na opis próbki, tym te błędy są mniej znaczące. Dlatego 8-bitowe nagranie jest wyraźnie słabszej jakości od 16 bitowego i najczęściej charakteryzuje się tym, że szumi.

Trochę matematyki będzie teraz potrzebne. Komputery liczą w systemie binarnym, czyli składającym się tylko z dwóch cyfr: 0 i 1. Osiem bitów oznacza, że jest możliwość zapisania ośmiu cyfr o wartościach 0 lub 1 – czyli 2 możliwe wartości, osiem pozycji, zatem 2^8, czyli w systemie dziesiętnym będzie to liczba od 0 do 255 (czyli 256 możliwych wartości). Jeśli zwiększymy głębię bitów z ośmiu do szesnastu, będziemy mieć 2^16, co da nam wynik 65536 (od 0 do 65535).

Wniosek jest następujący: ośmiobitowe nagranie będzie używać 256 możliwych wartości dla każdej pojedynczej próbki dźwięku. Szesnastobitowe nagranie może już spożytkować 65536 wartości. Jeśli zwiększymy głębię bitów do 24, otrzymamy aż 16777216 wartości.

Skoro 44,1kHz i 16 bitów wystarcza do zapisania dźwięku o jakości CD Audio... po co wyższe wartości? Co daje 48kHz i 24 bity? Po co komuś 192kHz?

Wspomniałem już, że ilość bitów na próbkę ma wpływ na szum, a dokładniej stosunek sygnału do szumu. To z kolei ma znaczenie przy zakresie dynamicznym, czyli najcichszym i najgłośniejszym możliwym do odwzorowania dźwiękiem. 16 bitowy plik audio pozwala na uzyskanie zakresu dynamiki na poziomie 96dB – jest to wartość podobna, a nawet nieco większa od zakresu płyt winylowych i kaset (które są w stanie odtworzyć 80-90dB). Jeśli zwiększymy ilość bitów do 24, zakres dynamiki zwiększa się do 144dB.

Od jakiegoś czasu coraz popularniejsze stają się pliki audio „HD”, które mają zagwarantować wyższą jakość niż standardowe dla CD Audio 44kHz/16bit. Co daje nam rozdzielczość 96kHz/24bit? Zakres dynamiki 144dB i odwzorowanie częstotliwości dźwięków do 48kHz. Jak pisałem wcześniej, większość ludzi potrafi usłyszeć dźwięki do ok. 20-22kHz. Wszystko powyżej, to ultradźwięki, słyszalne z reguły tylko przez zwierzęta. Ludzie, którzy twierdzą, że słyszą różnicę między 44,1kHz a wyższymi częstotliwościami próbkowania nie muszą jednak kłamać. Nawet jeśli nie są w stanie usłyszeć np. pisku o częstotliwości 48kHz, to przestrzeń powyżej 20-22kHz może sprawiać, że dźwięk reprodukowany jest nieco naturalniej. Większa głębia bitów z kolei może przełożyć się na lepszą reprodukcję niskich częstotliwości (których wykres fali jest „rozwlekły”, więc opisywać go musi większa ilość bitów). Jest to jednak tematem wciąż trwających debat - „ślepe” testy, kiedy odsłuchujący nie wie o jakiej jakości dźwięku słucha muzyki, nie są w pełni rozstrzygające.

Czy zatem pliki audio „HD” nie mają w ogóle sensu? Wydaje się, że... nie. O ile rejestrowanie audio przy najwyższej możliwej jakości sens ma (obróbka dźwięku lubi wysoką precyzję), to wyszukiwanie nagrań np. 24-bit i 192kHz sensu nie ma. Są to jedynie przerośnięte pliki!

Zakres reprodukowanych częstotliwości od 20Hz do 22kHz jest i tak bardzo szeroki – mało kto słyszy powyżej 20kHz, a dźwięki tak niskie jak 20Hz są bardziej odczuwalne fizycznie niż autentycznie słyszalne. Każdy wzmacniacz generuje mniejszy lub większy przester (zniekształcenia), szczególnie przy bardzo niskich i bardzo wysokich częstotliwościach. Z pewnością każdy z Was słyszał co dzieje się z dźwiękiem kiedy przesadzi się z pokrętłem „volume” - występuje wtedy nie tylko dudnienie basu, które pierwsze „rzuca się w uszy”, ale także duże zniekształcenie dźwięków wysokich. Co to ma za znaczenie? Ano takie, że im więcej wysokich dźwięków, tym większy przester. Odtwarzając nagranie o częstotliwości 192kHz, czyli reprodukujące dźwięki do 96kHz, dodajemy ogromną ilość niesłyszalnych dźwięków, które doprowadzą wzmacniacz do przesteru szybciej, niż nagranie „ucięte” przy 22kHz. Przester przy tych częstotliwościach wpływa na niższe, zatem... plik audio o 192kHz w rzeczywistości będzie słabszej jakości niż 44,1kHz!

Nawet jeśli ktoś pokaże Wam taki wykres:

udowadniając, że niebieska fala dźwiękowa została zmasakrowana do formy czerwonej (cyfrowej) i przez to dźwięk utracił jakość... przypomnijmy sobie o czym wspomniałem na samym początku: matematyczny opis fali dźwiękowej jest na tyle dokładny, że fala zmieniana z powrotem na analogową, jest dokładnie taka sama jak fala wejściowa. Przy częstotliwości próbkowania wynoszącej 44.1kHz każdy zarejestrowany dźwięk o połowie tej częstotliwości, czyli maksymalnie 22,05kHz, podczas odtwarzania, czyli zamieniania go z powrotem z formy cyfrowej na analogową, będzie identyczny. Nie ma więc mowy o tym, że większa częstotliwość próbkowania, np. 192kHz, wpłynie pozytywnie także na te słyszalne częstotliwości tylko dlatego, że dźwięk analizowany jest częściej w ciągu sekundy.

Każdy zainteresowany dużo bardziej szczegółowym opisem tematu bezcelowości istnienia wysokich częstotliwości próbkowania i głębi bitów powinien odwiedzić m.in. ten artykuł. Wniosek jest jeden: nie ma sensu „rzucać się” na dużo ważące pliki obiecujące wyższą jakość dźwięku. Jeśli jednak chcielibyście wyższą jakość... trzeba zwrócić uwagę na zupełnie inny fenomen, któremu poświęcony jest jeden z kolejnych działów – o wojnie głośności.







Polub TwojePC.pl na Facebooku

Rozdziały: Audiotechnika: dźwięk cyfrowy - czy analog naprawdę był lepszy?
 
 » Wstęp
 » Kilka słów ogólnie o dźwięku i zapisie analogowym
 » Długość fali i częstotliwość
 » Zapis cyfrowy
 » Kompresja stratna i bezstratna
 » Kompresja dynamiki, czyli wojna głośności
 » Podsumowanie
 » Kliknij, aby zobaczyć cały artykuł na jednej stronie
Wyświetl komentarze do artykułu »