Wzrastające
zainteresowanie przemysłu filmowego doskonalszym przekazem dźwięku
wielokanałowego w końcu lat 80. stało się czynnikiem intensyfikującym
prace Dolby Laboratories nad nowym systemem
cyfrowym. Na podstawie badań określono, że powinien on przenosić sześć
niezależnych kanałów, aby stworzyć optymalne warunki prezentacji
widowiskowych filmów kinowych. Ograniczenie przestrzeni na taśmie
filmowej 35 mm wymogło opracowanie nowej metody
kompresji danych audio, którą nazwano AC-3, od
słów Audio Coding wersja 3. Od tej nazwy
wywodzi się nazwa systemu Dolby AC-3, obecnie częściej
określanego jako Dolby Digital.
Do kin Dolby Digital zostało wprowadzone w 1992
r. Gwałtowny rozwój techniki cyfrowej i technologii półprzewodników
w latach 90. sprawił, że bardzo szybko wprowadzono Dolby
Digital do kina domowego. Technika kodowania pozostała taka
sama, zmieniły się tylko nośniki. Już w 1994 r. firma Zoran
Corporation wyprodukowała pierwszy układ scalony realizujący
cały proces dekodowania. Wkrótce pojawiły się stosunkowo tanie układy
łączące funkcje dekodera Dolby Digital i Pro
Logic, co umożliwiło ekspansje na rynku konsumenckim. Pierwszym
nośnikiem z dźwiękiem Dolby Digital,
przeznaczonym do użytku domowego, była pyta Laserdisc
(1995 r.). Format Dolby Digital wybrano jako
standard dźwięku wielokanałowego w systemie telewizji cyfrowej w USA,
a także na pytach DVD z systemem wizji NTSC.
Ze względu na wyjątkowo efektywną kompresje technika AC-3
jest też stosowana do transmisji programów stereofonicznych przez
satelity DBS i w systemach telewizji kablowej. W
1997 r. do rąk miłośników kina domowego trafiły pierwsze pyty DVD
zakodowane w Dolby Digital.
Dolby Digital jest wyjątkowo
uniwersalnym formatem. Nie jest to jeden sztywny schemat kodowania, lecz
elastyczny zespól procesów umożliwiających dopasowanie do konkretnej
aplikacji takich parametrów, jak przepływność bitowa i liczba kanałów.
Wszystkie warianty opierają się jednak na takiej samej technice
kodowania percepcyjnego sygnałów akustycznych, która umożliwia
zredukowanie znacznej ilości zapisywanej informacji, zachowując najwyższą
jakość dźwięku.
W systemie kinowym i kina domowego Dolby Digital
zakodowane jest sześć oddzielnych kanałów: przednie - lewy, prawy i
centralny; surround - lewy i prawy oraz kanał efektów niskich częstotliwości
(LFE - Low Frequency Effects). Zadaniem
ostatniego kanału jest zwiększenie ekspresji scen, takich jak wybuchy,
zderzenia, itp. Pięć pierwszych kanałów przenosi całe pasmo
akustyczne (3 Hz-20 kHz), zaś kanał LFE tylko
zakres 3-120 Hz, stąd określenie systemu "5.1".
Pełna separacja kanałów wpływa na zwiększenie przestrzenności dźwięku,
możliwości precyzyjnej lokalizacji, a stereofoniczne kanały surround
umożliwiają efektywniejsze operowanie efektami specjalnymi i podnoszą
ogólny realizm wydarzeń. Każdy z pięciu kanałów kształtujących
kierunkowe pole dźwiękowe może przenosić równocześnie inną
informacje, dlatego możliwe jest tworzenie wielu źródeł przyciągających
uwagę widza. Przypomnijmy, że w Pro Logic w
danej chwili mógł istnieć tylko jeden sygnał dominujący.
W systemie Dolby Digital
informacja zakodowana jest cyfrowo z 20-bitową rozdzielczością
minimalną, a dostępne częstotliwości próbkowania to 32,
44.1 i 48 kHz. Zakres
przepływności sięga od 32 kb/s dla zapisu mono
i do 640 kb/s dla zapisu wielokanałowego. W
zapisie na taśmie 35 mm stosuje się przepływność
320 kb/s, natomiast w kinie domowym typowa wartość
to 384 kb/s. Przyjmując przekształcenie
strumienia danych audio PCM o przepływności ponad 5 Mb/s (6 kanałów
x 44.1 kHz x 20 bitów = 5.292 Mb/s) w strumień 384 kb/s otrzymujemy
współczynnik kompresji większy od 13. Tak efektywna redukcja jest możliwa
dzięki wykorzystaniu w procesie kodowania AC-3 właściwości
ludzkiego słuchu -efektu maskowania dźwięków. Koder AC-3
przetwarza sygnał źródłowy będący strumieniem danych audio PCM.
Pasmo słyszalne każdego kanału dzielone jest na wąskie podpasma o równej
szerokości, optymalizowane pod względem selektywności zmysłu słuchu.
Sygnał użyteczny o dużym poziomie maskuje szum kodowania w paśmie
bardzo bliskim jego częstotliwości. W obszarze, w którym brak jest
maskującego sygnału użytecznego następuje natomiast ostre
filtrowanie sygnałów. Można powiedzieć, że system kodowania
percepcyjnego jest wiec systemem selektywnej redukcji szumu o dużej
skuteczności.
Bity są rozdzielane pomiędzy pasma filtrów, zależnie od widma częstotliwościowego
i dynamiki nagrania. Koder pogarsza selektywność częstotliwości i
rozdzielczość czasową zapisywanego sygnału, aby ograniczyć liczbę
bitów potrzebnych do opisu w danym paśmie. Istnieje wspólny zakres
bitów, tzw. common bit pool, który dynamicznie jest rozdzielany
na poszczególne ścieżki. W ten sposób np. kanał z sygnałem o
szerszym widmie lub wyższym poziomie zostanie zakodowany większą
liczbą bitów. Poświęcenie większej liczby bitów na dźwięki o wyższym
poziomie w jednym kanale zapewni maskowanie szumu w innych kanałach.
Model maskowania i alokacji bitów są kluczem do wyjątkowej efektywności
systemu kodowania AC-3.
W systemie Dolby Digital
wprowadzono wiele bardzo przydatnych, dodatkowych cech, umożliwiających
spełnienie różnorodnych wymagań systemów domowych i kinowych.
Szczególnie uwzględniono potrzeby miłośników kina domowego.
Widzowie mogą mieć instalacje od najprostszych, monofonicznych po
zestawy kina domowego 5.1. W każdym przypadku konieczne jest
zapewnienie dźwięku najlepszej jakości. W przeszłości różne
potrzeby realizowano przez użycie różnych formatów i nośników
nagrań. Celem projektantów Dolby Digital jest
natomiast uzyskanie optymalnej równowagi między efektywnością
transmisji a jakością reprodukcji. Wszystkie dekodery otrzymują
kompletny strumień wielokanałowy i od użytkownika zależy, jak go
wykorzysta. Dodatkowe dane w strumieniu AC-3 są
nadzorowane przez realizatorów dźwięku, przygotowujących materiał
na rynek konsumencki, tak aby za każdym razem wrażenia odsłuchowe
odpowiadały zamierzeniom artystycznym. Na uzyskanie optymalnych
rezultatów wpływają w dużej mierze niżej opisane cechy.
W strumieniu AC-3 przesyłane są
dane określające typ zapisanego materiału fonicznego, np. muzyka i
efekty, dialogi, kompletny. Inne parametry informują o liczbie
wykorzystywanych kanałów (1 - 5.1). Ułatwia to pracę dekodera i
eliminuje problemy przy odtwarzaniu.
Kompatybilne miksowanie w dół (downmixing) w systemie
Dolby Digital
W systemach odtwarzania dźwięku liczba głośników może
być mniejsza niż liczba oryginalnie zakodowanych kanałów. Dla
reprodukcji pełnego materiału audio w mniejszej liczbie kanałów
stosuje się tzw. miksowanie w dół (downmixing).
Dotyczy to np. przetworzenia sygnałów dyskretnych 5.1 na sygnały Dolby
Surround lub stereofonii dwukanałowej. Dekoder według
odpowiedniego algorytmu tworzy ścieżki poszczególnych kanałów,
schodząc nawet do ścieżki monofonicznej (rysunek z prawej)
Dzięki standaryzacji algorytmów realizator może kontrolować, jak
nagranie zostanie odtworzone w różnych konfiguracjach i zoptymalizować
rezultaty brzmieniowe dla każdego wariantu. Dokonuje się to przez
zapis odpowiednich wartości tzw. współczynników
miksowania w strumieniu danych AC-3.
Przy odtwarzaniu nagrań z różnych źródeł występują
różnice w poziomie głośności, które zwykle zmuszałyby słuchacza
do ręcznej regulacji wzmocnienia. Różne źródła mogą oznaczać różne
fragmenty programu jednej stacji (np. film, informacje), różne stacje
nadawcze, czy też różne nośniki (taśma, Laserdisc,
DVD). W AC-3 rozwiązano
ten problem przez kodowanie tzw. wskaźnika głośności, który umożliwia
unifikację poziomu reprodukcji dialogów. Słowo normalizacji dialogów
wyraża, o ile dB poziom normalnego dialogu jest niższy od maksimum
zakresu cyfrowego. Informacja ta nie jest bezpośrednio wykorzystywana
przez dekoder, lecz przez układ regulacji wzmocnienia, chyba że
wzmocnienie realizuje się przez operację mnożenia w rozbudowanym
dekoderze. Poziom wzmocnienia całego systemu reprodukcji zależy od słuchacza,
który ustawia żądany poziom ciśnienia dźwięku dla dialogu oraz od
wskaźnika poziomu dialogu towarzyszącego zakodowanemu sygnałowi. W
ten sposób poziom odsłuchiwanego dialogu pozostaje stały, niezależnie
od nagrania.
Przykład: Słuchacz ustawia
poziom na 65 dB (W AC-3 możliwe jest
kalibrowanie poziomu bezpośrednio w jednostkach ciśnienia dźwięku SPL).
Na płycie został nagrany wysokiej jakości materiał i tak zakodowany,
że poziom dialogu jest 25 dB poniżej maksimum zakresu. System
automatycznie ustawia wzmocnienie tak, aby sygnał cyfrowy zajmujący pełną
skalę odtwarzany był z poziomem ciśnienia 90 dB. Dialog będzie wówczas
odtwarzany z poziomem 25 dB niższym, czyli z poziomem 65 dB SPL.
Permanentnym problemem reprodukcji audio jest zróżnicowanie
jakości systemów oraz warunków odsłuchu. Ścieżki filmowe cechują
się zwykle szerokim zakresem dynamiki. Przyjmując dialog jako
odniesienie, silne dźwięki, takie jak eksplozje, są o 20 dB lub więcej
głośniejsze, a dźwięki tła, jak np. szelest liści, o 50 dB
cichsze. Widz może odtwarzać nagranie z małym poziomem głośności
lub przez małe zespoły głośnikowe, a wówczas pożądana jest
kompresja, aby delikatne pasaże pozostały słyszalne, a dramatyczne składniki
nie byty zbyt głośne. Należy podbić ciche dźwięki i osłabić
silne, zbliżając je do poziomu odniesienia, jakim jest poziom dialogu.
Dopasowanie do każdych warunków umożliwia elastyczny system
sterowania dynamiką, używany przy kodowaniu nagrania u producenta. Słuchacz
wybiera, czy dekoder ma pracować z kompresją pełną, częściową,
czy też z dynamiką oryginalną.
Przykład: Ścieżka filmowa ma
zakodowany dialog na poziomie 25 dB. Eksplozje osiągają maksimum
zakresu, czyli 0 dB. Dźwięki tła cechuje poziom niższy o 50 dB od
dialogu (-75 dB). Sygnały sterowania kompresją generowane są przez
koder AC-3. Realizator ustalił, że dla sygnałów 0 dB w słowie
sterującym zapisana jest redukcja wzmocnienia o 15 dB, zaś dla sygnałów
o 75 dB - przyrost wzmocnienia o 20 dB. Słuchacz pragnie cicho odtworzyć
ścieżkę dźwiękową, używa więc pełnej kompresji. Poziom
reprodukcji dialogu ustawia na 60 dB SPL. Eksplozje osiągną tylko 70
dB SPL (są o 25 dB głośniejsze, ale zachodzi redukcja wzmocnienia o
15 dB). Ciche dźwięki będą odtwarzane z poziomem 30 dB SPL (są o 50
dB słabsze, ale podbijane są o 20 dB). Zakres dynamiki przy
reprodukcji wyniesie 70 dB - 30dB = 40dB.
Słuchacz ma możliwość zaprogramowania dekodera tak,
aby sygnały o niskich częstotliwościach przesyłać tylko do tych
kanałów, w których pracują zespoły głośnikowe o odpowiednio
niskiej dolnej granicy przenoszenia.
Dolby Digital stanowi kolejny
krok zwiększający zaangażowanie słuchacza w akcję filmu.
Producenci, realizatorzy i osoby prezentujące nagrania otrzymują
szerokie możliwości kreowania widowiska. System jest łatwo
adaptowalny do rozmaitych nośników, pozostając ciągle w obrębie
jednej, przyszłościowej ramy technicznej. Nie nakłada ona wymagań na
budowę koderów i dekoderów, lecz tylko na format danych wejściowych
i wyjściowych. W związku z tym producenci układów scalonych mają
bardzo szerokie pole do popisu. Obecnie 78 firm prowadzi badania nad
doskonaleniem algorytmów dekodowania i budowy dekoderów Dolby
Digital, nie tylko do zastosowań w systemie 5.1.
Procesor kinowy CP500 firmy Dolby Labs. CP500 jest połączeniem
procesora analogowego i cyfrowego.
CP500 jest połączeniem
procesora kinowego analogowego i cyfrowego. Odczytuje i obrabia
klasyczne formaty dźwiękowe zarejestrowane na taśmie analogowo, oraz
format Dolby Digital. Połączenie w jednej
obudowie procesorów analogowego i cyfrowego jest nie tylko tańsze, ale
również doskonalsze, ponieważ umożliwiło cyfrową obróbkę także
sygnałów analogowych, odczytywanych w formatach Dolby
Stereo i Dolby Stereo SR. Zastosowano
najbardziej wyrafinowaną technikę obróbki sygnałów by uzyskać
najwyższą jakość dźwięku. Ta mikroprocesorowa konstrukcja
powoduje, że CP500 się nie starzeje, ponieważ
kolejne generacje oprogramowania tworzonego przez firmę Dolby
Labs. są po prostu wczytywane do programowalnej pamięci urządzenia
bezpośrednio ze ścieżki cyfrowej (która oprócz dźwięku niesie także
informacje systemowe).
Zbliżenie na wyświetlacz CP500.
Zawiera klasyczne dekodery Dolby A
oraz Dolby Stereo SR dla najwierniejszego
dekodowania dźwięku z kopii w formatach analogowych
equalizacja cyfrowa wszystkich kanałów dźwięku
cyfrowa matryca dekodująca 2:4
wbudowany generator wewnętrzny i system kontroli i
diagnostyki całej aparatury nagłaśniającej w kinie
czytelny wyświetlacz LCD
(patrz na zdjęcie) i wielozadaniowe klawisze o funkcji określanej
programowo ułatwiają codzienną kontrolę i obsługę systemu
najwyższej klasy obróbka dźwięku, już dziś
modyfikowana wraz z rozwojem algorytmów oprogramowania układów DSP,
przy pomocy informacji sczytywanych automatycznie z kopii cyfrowych