Рассмотрим такие характеристики как: реальный динамический диапазон для форматов DSD, величину фазового шума и ошибки дискретизации для всех цифровых форматов в общем.
В характеристиках звуковоспроизводящей аппаратуры часто приводят такие характеристики как:
- Динамический и частотный диапазон
- Отношение сигнал\шум
- И т.д.
Но очень многое упускается.
- Что такое дискретизация;
- Формат CD и родственные ему форматы Flac – реальный динамический диапазон;
- Итог по чистоте записи в формате CD;
Что такое дискретизация
Дискретизация делает дискретным сигнал во времени (в отличие от квантования, которое делает дискретными амплитуды сигналов). Все знают, что такое разрядность аудио и цапов (ацп). Чем выше разрядность аудиоинформации и цапа (ацп), тем выше: качество, лучше динамический диапазон и отношение сигнал\шум.
Мало кто задумывается, что квантование на временной оси или правильнее говорить — дискретизация, так-же вносит свой вклад в динамический диапазон и привносит цифровой шум (об этом мало пишут в сети).
Ошибка дискретизация в этом смысле похожа на ошибку квантования — чем выше частота дискретизации и, таким образом, больше информации для цифрового представления сигнала, тем лучше качество. Чаще всего меломаны ограничиваются лишь информацией о (теоретическом) частотном диапазоне, а зря! =)
Формат CD и родственные ему форматы Flac – динамический диапазон
Рассмотрим для начала любимый формат CD и родственные ему форматы Flac. Динамический диапазон рассчитывается очень просто — он равен 6дБ на 1 бит информации, при импульсно кодовой модуляции использующейся в этих форматах. Для компакт диска динамический диапазон таким образом равен 16бит х 6дБ = 96дБ. Соответственно величина ошибки квантования равна величине младшего разряда и для 16бит динамического диапазона цифровой (теоретический) шум квантования составит -96дБ. Мы разобрали квантование по амплитуде и это еще не все характеристики цифрового аудио.
В прошлых своих обзорах я уже рассказывал о проблемах связанных с дискретизацией аудио в компакт диске и его реальном частотном диапазоне. Напомню. Диапазон CD (теоретический) составляет 20Гц-20000Гц.
С нижними частотами все в порядке. Проблемы возникают при оцифровке высоких частот. Дело в том что период максимальной (по теореме Котельникова-Шеннона или известная как «частота Найквиста») частоты 22050Гц, будет записан всего двумя цифрами. Это и есть частота дискретизации которая равна для компакт диска 44100Гц. Если сравнить количество информации доступное для записи максимальной частоты 22050Гц и минимальной для CD частоты в 20Гц, на ум приходит очень важный и простой вывод — различные частоты записываются с разным качеством.
Понятно так же, что если нижняя частота запишется с высоким качеством, то верхние частоты, совершенно логично, запишутся с качеством плохим. Вопрос только в том насколько плохое это качество.
Чтобы посчитать величину шума дискретизации подойдет формула от оценки шума квантования. Предварительно нужно знать величину периода (целое число) искомой частоты и расчитать требуемое количество бит кодирующих фазу частоты. Ниже представлена таблица где приведены частоты с уменьшением на октаву, плюс самая низкая частота (кодируемая, как мы помним с избытком качества), далее следует величина периода, минимальная 2р, здесь и далее указывается число единиц информации кодирующих один период частоты и разрядность в битах необходимая для кодирования одного периода при этой частоте дискретизации (ограничением для количества бит на фазу является как раз частота дискретизации). В конце приводится то что нам нужно — величина (теоретическая) фазового шума (ошибка дискретизации) для определенной частоты:
CD 44100 Hz 16bit
- 22050 Hz 2p(1b) -6дБ
- 11025 Hz 4p(2b) -12дБ
- 5512 Hz 8p(3b) -18дБ
- 2756 Hz 16p(4b) -24дБ
- 20 Hz 2205p(11b) -66дБ
Итак, значения шума дискретизации прямо сказать обескураживающие =). Недаром эти характеристики производители аппаратуры не указывают вообще.
Итог по чистоте записи в формате CD
В формате CD чисто запишутся только низкие частоты с отношением сигнал\шум ниже примерно -45дБ. Средние запишутся уже с высоким уровнем фазового шума. На высокие частоты уже практически ничего не остается… Напомню, что шум квантования всего -96дБ — его то и указывают производители техники и в описании форматов.
Посмотрим что у нас с форматами высокого разрешения, начнем с Flac:
Flac 96000 Hz 24 bit
- 24000 Hz 4p(2b) -12дБ
- 12000 Hz 8p(3b) -18дБ
- 6000 Hz 16p(4b) -24дБ
- 3000 Hz 32p(5b) -30дБ
- 20 Hz 4800p(13b) -78дБ
Flac 192000 Hz 24 bit
- 24000 Hz 8p(3b) -18дБ
- 12000 Hz 16p(4b) -24дБ
- 6000 Hz 32p(5b) -30дБ
- 3000 Hz 64p(6b) -36дБ
- 20 Hz 9600p(14b) -84дБ
Видно, что с увеличением частоты качество становится лучше, но не на много.
Дополнительно рассмотрим пару форматов WAVE, с ультравысокой частотой дискретизации
WAVE 384000 Hz 32 bit
- 24000 Hz 16p(4b) -24дБ
- 12000 Hz 32p(5b) -30дБ
- 6000 Hz 64p(6b) -36дБ
- 3000 Hz 128p(7b) -42дБ
- 20 Hz 19200p(15b) -90дБ
WAVE 768000 Hz 32 bit
- 24000 Hz 32p(5b) -30дБ
- 12000 Hz 64p(6b) -36дБ
- 6000 Hz 128p(7b) -42дБ
- 3000 Hz 256p(8b) -48дБ
- 20 Hz 38400p(16b) -96дБ
Результаты уже значительно лучше, но все еще не идеальные =) Понятно что форматы с сверхвысокой частотой еще недоступны практически ни кому.
Формат DSD
Теперь обратим внимание на самый спорный и интересный в плане качества формат DSD, использующийся в SACD. Во первых здесь используется не импульсно-кодовая модуляция, а плотностно импульсная. Это означает что весь сигнал и по амплитуде и во времени кодируется потоком однобитных значений.
От сюда следует вывод что квантование симметрично дискретизации и, следовательно шум квантования, будет равен шуму дискретизации. И то и другое (в данном случае это одна величина) представляет интерес.
Итак, начнем… DSD
DSD64
- 2.822.400 Hz 1 bit
- 22050 Hz 128p(7b) -42дБ
- 11025 Hz 256p(8b) -48дБ
- 5512 Hz 512p(9b) -54дБ
- 2756 Hz 1024p(10b) -60дБ
- 20 Hz 141120p(18b) -108дБ
Результаты расчетов впечатляют — это действительно формат высокого качества! Здесь относительно низкий уровень шумов на высоких частотах, на средних частотах этот показатель еще лучше, а на низких качество вообще выше всяких похвал. На высоких частотах начальный формат DSD оставляет позади даже WAVE 768000 Гц!.
Осталось рассмотреть формат DSD с более высокими частотами дискретизации
DSD128
- 5.644.800 Hz 1 bit
- 22050 Hz 256p(8b) -48дБ
- 11025 Hz 512p(9b) -54дБ
- 5512 Hz 1024p(10b) -60дБ
- 2756 Hz 2048p(11b) -66дБ
- 20 Hz 282240p(19b) -114дБ
DSD256
- 11.289.600 Hz 1 bit
- 22050 Hz 512p(9b) -54дБ
- 11025 Hz 1024p(10b) -60дБ
- 5512 Hz 2048p(11b) -66дБ
- 2756 Hz 4096p(12b) -72дБ
- 20 Hz 564480(20b) -120дБ
DSD512
- 22.579.200 Hz 1 bit
- 22050 Hz 1024p(10b) -60дБ
- 11025 Hz 2048p(11b) -66дБ
- 5512 Hz 4096p(12b) -72дБ
- 2756 Hz 8192p(13b) -78дБ
- 20 Hz 1128960p(21b) -126дБ
Из таблицы видно, что увеличение частоты в формате DSD имеет смысл для качества высоких частот (нижние записаны с избытком качества).
Итог:
- Производители звуковоспроизводящей техники указывают динамический диапазон квантования, связанное с ним соотношение сигнал\шум и не указывают величину фазового шума (ошибка дискретизации).
- Вывод второй. Заявленные высокие характеристики форматов, с импульсно кодовой модуляцией отчасти миф.
- И, последнее — форматы DSD действительно имеют преимущество в качестве перед стандартными форматами.
В будущем, вероятно, с дальнейшим развитием цифровой электроники, будут доступны форматы аудио с очень высокой частотой дискретизации и низким фазовым шумом, а пока выбор не очень большой и следует обратить внимание на DSD. Конечно это не реклама DSD и SACD=), но выбор за вами.