Аудио. Цифровое и аналоговое аудио

Аудио. Цифровое и аналоговое аудио

29 декабря 2014

Несмотря на то, что большую часть внешней информации мы усваиваем с помощью зрения, звуковые образы для нас ничуть не менее важны, а часто даже и более. Попробуйте посмотреть кино с выключенным звуком – через 2-3 минуты вы потеряете нить сюжета и интерес к происходящему, каким бы большим ни был экран и качественным изображение! Поэтому в немом кино за кадром играл тапер. Если же убрать изображение и оставить звук, кино вполне можно «слушать» как увлекательную радиопостановку.

Слух доносит до нас информацию о том, чего мы не видим, поскольку сектор визуального восприятия ограничен, а ухо улавливает звуки, доносящиеся со всех сторон, дополняя зрительные образы

Слух доносит до нас информацию о том, чего мы не видим, поскольку сектор визуального восприятия ограничен, а ухо улавливает звуки, доносящиеся со всех сторон, дополняя зрительные образы. При этом наш слух с большой точностью может локализовать невидимый источник звука по направлению, расстоянию, скорости перемещения.

Звук научились преобразовать в электрические колебания задолго до изображения. Этому предшествовала механическая запись звуковых колебаний, история которой началась еще в 19 веке.

Ускоренный прогресс, включая возможность передачи звука на расстояние, стал возможен благодаря электричеству, с появлением усилительной техники, акустоэлектрических и электроакустических и преобразователей – микрофонов, звукоснимателей, динамических головок и прочих излучателей. Сегодня звуковые сигналы передаются не только по проводам и через эфир, но и по оптоволоконным линиям связи, в основном в цифровом виде.

Акустические колебания преобразуются в электрический сигнал обычно с помощью микрофонов. Любой микрофон имеет в своем составе подвижный элемент, колебания которого порождают ток или напряжение определенной формы. Наиболее распространенный тип микрофона – динамический, представляющий собой «динамик наоборот». Колебания воздуха приводят в движение мембрану, жестко связанную со звуковой катушкой, находящейся в магнитном поле. Конденсаторный микрофон, по сути, и есть конденсатор, одна из обкладок которого колеблется в такт со звуком, а вместе с ней изменяется емкость между обкладками. В ленточных микрофонах используется тот же принцип, только одна из пластин свободно подвешена. Схож с конденсаторным электретный микрофон, пластины которого в процессе колебаний сами вырабатывают электрический заряд, пропорциональный амплитуде колебаний. Многие модели микрофонов имеют встроенный усилитель (уровень сигнала непосредственно с акусто-электрического преобразователя очень мал). В отличие от микрофона, звукосниматель электромузыкального инструмента регистрирует колебания не воздуха, а твердого тела: струны или деки инструмента. Головка звукоснимателя считывает канавку грампластинки с помощью иглы, механически соединенной с подвижными катушками, находящимися в магнитном поле, либо магнитами, если катушки неподвижны. Либо колебания иглы передаются на пьезоэлемент, который при механических воздействиях вырабатывает электрический заряд. В магнитной записи звуковой сигнал записывается на магнитную ленту, а затем считывается специальной головкой. Наконец, в кинематографе традиционно была принята оптическая запись: с краю пленки наносилась непрозрачная звуковая дорожка, ширина которой менялась в такт со сигналом, и при протягивании пленки через проекционный аппарат электрический сигнал снимался с помощью фотосенсора.

В синтезаторах звук рожается непосредственно в виде электрических колебаний, здесь отсутствует первичное преобразование акустических волн в электрический сигнал.

Современные источники звука осень разнообразны, и все большее распространение получают цифровые носители: компакт-диски, DVD, хотя сохраняются еще и виниловые пластинки. Мы продолжаем слушать радио, как эфирное, так и кабельное (радио-точки). Звук сопровождает телепередачи и кинофильмы, не говоря уже о таком привычном явлении, как телефония. Все больший удельный вес в мире аудио получает компьютер, позволяющий с удобством архивировать, комбинировать и обрабатывать звуковые программы в виде файлов. В век цифровых технологий оцифрованная речь и музыка передается по цифровым каналам, включая сеть Интернет, без серьезных потерь на транспортировку. Это обеспечивается цифровым кодированием, и потери возникают исключительно из-за сжатия, которое чаще всего при этом используется. Однако на цифровых носителях его либо нет вовсе (CD, SACD), либо применяются алгоритмы сжатия звука без потерь (DVD Audio, DVD Video). В остальных случаях степень сжатия определяется требуемым уровнем качества фонограммы (файлы MP3, цифровая телефония, цифровое телевидение, некоторые типы носителей).

cifrovoe-i-analogovoe-audio-1.jpg
Рис. 1. Преобразование акустических звуковых колебаний в электрический сигнал

Обратное преобразование из электрических колебаний в акустические осуществляются с помощью громкоговорителей, встроенных в радиоприемники и телевизоры, а также отдельных акустических систем, головных телефонов.

Звуком называют акустические колебания в диапазоне частот от 16 Гц до 20 000 Гц

Звуком называют акустические колебания в диапазоне частот от 16 Гц до 20 000 Гц. Ниже (инфразвук) и выше (ультразвук) человеческое ухо не слышит, да и в пределах звукового диапазона чувствительность слуха весьма неравномерна, ее максимум приходится на частоту 4 кГц. Чтобы слышать звуки всех частот одинаково громко, нужно воспроизводить их с разным уровнем. Такой прием, называемый тонкомпенсацией, часто реализуется в бытовой аппаратуре, хотя результат его нельзя признать однозначно положительным.

cifrovoe-i-analogovoe-audio-2.jpg
Рис. 2. Кривые равной громкости
(Нажмите на изображение для увеличения)

Физические свойства звука обычно представляются не в линейных, а в относительных логарифмических величинах – децибелах (дБ), поскольку это гораздо нагляднее в цифрах и компактнее на графиках (в противном случае пришлось бы оперировать с величинами, имеющими множество нулей до запятой и после, и вторые с легкостью потерялись бы на фоне первых). Отношение двух уровней A и B в дБ (скажем, напряжения или тока) определяется как:

Сu [дБ] = 20 lg A/B. Если же речь идет о мощностях, то Сp [дБ] = 10 lg A/B.

Кроме частотного диапазона, определяющего чувствительность человеческого слуха к высоте звука, существует также понятие диапазона громкостей, который показывает чувствительность уха к уровню громкости и охватывает интервал от самого тихого звука, различимого слухом (порог чувствительности), до самого громкого, за которым лежит болевой порог. Порог чувствительности принят как звуковое давление в 2 х 10-5 Па (Паскаль), а болевой порог – давление, в 10 миллионов раз большее. Иными словами, диапазон слышимости, или отношение давления самого громкого звука, к самому тихому, составляет 140 дБ, что заметно превосходит возможности любой аудио аппаратуры ввиду ее собственных шумов. Только цифровые форматы высокого разрешения (SACD, DVD Audio) подбираются к теоретическому пределу динамического диапазона (отношение самого громкого звука, воспроизводимого аппаратурой, к уровню шума) 120 дБ, компакт-диск обеспечивает 90 дБ, виниловая пластинка – порядка 60 дБ.

cifrovoe-i-analogovoe-audio-3.jpg
Рис. 3. Диапазон чувствительности слуха

Только цифровые форматы высокого разрешения (SACD, DVD Audio) подбираются к теоретическому пределу динамического диапазона

Шумы всегда присутствуют в звуковом тракте. Это как собственные шумы усилительных элементов, так и внешние наводки. Искажения сигнала делятся на линейные (амплитудные, фазовые) и нелинейные, или гармонические. В случае линейных искажений спектр сигнала не обогащается новыми компонентами (гармониками), изменяются лишь уровень или фаза уже существующих. Амплитудные искажения, нарушающие изначальные соотношения уровней на разных частотах, приводят к слышимым искажениям тембра. Долгое время считалось, что фазовые искажения некритичны для слуха, однако на сегодня доказано обратное: и тембр, и локализация звука в значительной мере зависимы от фазовых соотношений частотных компонентов сигнала.

Любой усилительный тракт нелинеен

Любой усилительный тракт нелинеен, поэтому всегда возникают гармонические искажения: новые частотные компоненты, отстоящие по частоте в 3, 5, 7 и т.д. от порождающего их тона (нечетные гармоники) или в 2, 4, 6 и т.д. раз (четные). Порог заметности гармонических искажений сильно варьирует: от нескольких десятых и даже сотых долей процента до 3-7%, в зависимости от состава гармоник. Четные гармоники менее заметны, поскольку находятся в консонансе с основным тоном (разница по частоте в два раза соответствует октаве).

Помимо гармонических, имеют место интермодуляционные искажения, представляющие собой разностные продукты частот спектра сигнала и их гармоник. Например, на выходе усилителя, на вход которого подано две частоты 8 и 9 Гц (при достаточно нелинейной его характеристике) появится третья (1 кГц), а также целый ряд других: 2 кГц (как разность вторых гармоник основных частот) и т.д. Интермодуляционные искажения особенно неприятны на слух, поскольку порождают множество новых звуков, включая диссонансные по отношению к основным.

То, что сможет услышать аудиофил и не только услышать, но и объяснить звукорежиссер, может оказаться совершенно незаметным для обычного слушателя

Шумы и искажения в значительной степени маскируются сигналом, однако они и сами маскируют сигналы малого уровня, которые исчезают или теряют отчетливость. Поэтому чем выше отношение сигнал/шум, тем лучше. Фактическая чувствительность к шумам и искажениям зависит от индивидуальных особенностей слуха и его натренированности. Уровень шумов и искажений, не влияющий на передачу речи, может быть абсолютно неприемлемым для музыки. То, что сможет услышать аудиофил и не только услышать, но и объяснить звукорежиссер, может оказаться совершенно незаметным для обычного слушателя.

ПЕРЕДАЧА АНАЛОГОВОГО АУДИО

Традиционно аудио сигналы передавались по проводам, а также эфиру (радио).

Различают небалансную линию передачи (классическая проводная) и балансную. Небалансная имеет в своем составе два провода: сигнальный (прямой) и обратный (земля). Такая линия весьма чувствительна к внешним помехам, поэтому для передачи сигнала на большие расстояния не подходит. Часто реализуется с помощью экранированного провода, экран при этом соединяется с землей.

cifrovoe-i-analogovoe-audio-4.jpg
Рис. 4. Небалансная экранированная линия

Балансная линия предполагает три провода: два сигнальных, по которым течет один и тот же сигнал, но в противофазе, и землю. На приемной стороне синфазные помехи (наведенные на оба сигнальных провода) взаимно вычитаются и полностью исчезают, а уровень полезного сигнала удваивается.

cifrovoe-i-analogovoe-audio-5.jpg
Рис. 5. Балансная экранированная линия

Небалансные линии обычно применяются внутри приборов и при небольших расстояниях, в основном в пользовательских трактах. В профессиональной же сфере господствует балансная.

На рисунках точки подключения экрана показаны условно, поскольку их приходится каждый раз подбирать «по месту» для достижения наилучших результатов. Чаще всего экран подключается только на стороне приемника сигнала.

Небалансные линии обычно применяются внутри приборов и при небольших расстояниях, в основном в пользовательских трактах. В профессиональной же сфере господствует балансная

Аудиосигналы нормируются по уровню действующего напряжения (0,707 от амплитудного значения):

  • микрофонный 1-10 мВ (для микрофонов без встроенного усилителя),
  • линейный 0,25-1 В, обычно 0,7 В.

На выходе усилителя мощности, с которого сигнал поступает на громкоговорители, его уровень гораздо выше и может достигать (в зависимости от громкости) 20-50 В при токах до 10‑20 А. Иногда – до сотен вольт, для трансляционных линий и озвучивания открытых пространств.

Используемые кабели и разъемы:

  • для балансных линий и микрофонов – экранированная пара (часто витая), 3-контактные разъемы XLR или клеммы, винтовые или зажимные;

cifrovoe-i-analogovoe-audio-6.jpg
Рис. 6. Разъемы для балансных линий: клеммы и XLR

  • для небалансных линий – экранированный кабель, разъемы RCA («тюльпан»), реже DIN (а также ГОСТ), а также различные штекеры;

cifrovoe-i-analogovoe-audio-7.jpg
Рис. 7. Разъемы для небалансных линий: RCA, 3,5-мм и 6,25-мм штекеры

  • для мощных сигналов для громкоговорителей – неэкранированные (за редким исключением) акустические кабели большого сечения, клеммы или зажимы, разъемы типа «банан» или «игла»

cifrovoe-i-analogovoe-audio-8.jpg
Рис. 8. Разъемы акустических кабелей

Качество разъемов и кабелей играет ощутимую роль, особенно в высококачественных аудио системах

Качество разъемов и кабелей играет ощутимую роль, особенно в высококачественных аудио системах. Имеют значение материалы проводника и диэлектрика, сечение, геометрия кабеля. В самых дорогих моделях межблочных и акустических кабелей применяется сверхчистая медь и даже цельное серебро, а также тефлоновая изоляция, отличающаяся минимальным уровнем диэлектрической абсорбции, увеличивающей потери сигнала, причем неравномерно по полосе частот. Рынок кабельной продукции очень разнообразен, часто разные модели одинакового качества отличаются друг от друга лишь ценой, причем во много раз.

Любые кабели характеризуются потерями аналогового сигнала, которые растут с ростом частоты и расстояния передачи. Потери определяются омическим сопротивлением проводника и контактов в разъемах, а также распределенными реактивными составляющими: индуктивностью и емкостью. По сути, кабель представляет собой фильтр низких частот (режет высокие).

Помимо передачи на разные расстояния, сигналы часто приходится разветвлять и коммутировать. Коммутаторы (селекторы входов) являются неотъемлемой частью многих компонентов аудиотракта, как профессионального, так и пользовательского. Существуют и специализированные усилители-распределители, разветвляющие сигнал и обеспечивающие согласование с линией передачи и другими компонентами по уровню и импедансам (а также часто компенсирующих спад на высоких частотах) и коммутаторы, обычные (несколько входов и один выход) и матричные (множество входов и выходов).

ОБРАБОТКА АНАЛОГОВОГО АУДИО

Любая обработка аналогового аудиосигнала сопровождается определенными потерями его качества (возникают частотные, фазовые, нелинейные искажения), однако она необходима. Основные виды обработки следующие:

  • усиление сигнала до уровня, нужного для передачи, записи или воспроизведения громкоговорителем: подав сигнал с микрофона на динамик, мы ничего не услышим: требуется предварительно усилить его по уровню и мощности, обеспечив при этом возможность регулировки громкости.

cifrovoe-i-analogovoe-audio-9.jpg
Рис. 9

  • фильтрация по частотам: от полезного звукового диапазона (20 Гц – 20 кГц) отсекают инфразвук, который на определенных частотах вреден для здоровья, и ультразвук. Во многих случаях диапазон намеренно сужают (речевой телефонный канал имеет полосу от 300 Гц – 3400 Гц, существенно ограничена полоса частот метровых радиостанций). Для акустических систем, имеющих как правило 2-3 полосы, также необходимо разделение, которое осуществляется обычно в фильтрах кроссоверов уже на уровне усиленного (мощного) сигнала.

cifrovoe-i-analogovoe-audio-10.jpg
Рис. 10. Схема кроссовера для трехполосной акустической системы

  • коррекция по частотам (эквалайзинг): регулировка тембра, компенсация неравномерной отдачи из-за акустических свойств помещения, компенсация потерь в линиях передачи, студийная обработка с целью достижения нужной «окраски» звука, подавление паразитной акустической обратной связи («свиста») и т.д.

cifrovoe-i-analogovoe-audio-11.jpg
Рис. 11. Пример прибора-эквалайзера

  • подавление шумов: существуют специальные схемы динамического шумопонижения, которые анализируют сигнал и сужают полосу пропорционально уровню и частоте ВЧ-составляющих («денойзеры», «дехиссеры»). При этом шум, находящийся выше полосы сигнала, отрезается, а оставшийся более или менее маскируется самим сигналом. Подобные схемы всегда приводят к весьма заметной на слух деградации сигнала, но в отдельных случаях их применение уместно (например, при работе с записанной речью или в переговорных радиостанциях). Для аналоговой звукозаписывающей техники также используются шумоподавители на основе компрессоров/экспандеров («компандерные», например, системы Dolby B, dbx), работа которых на слух менее заметна.
  • воздействие на динамический диапазон: для того чтобы воспроизведение музыкальных программ на обычных бытовых системах, включая автомобильные магнитолы, было достаточно сочным и выразительным, динамический диапазон сжимают, делая звучание тихих звуков более громким. В противном случае, не считая отдельных всплесков фортиссимо (на классической музыке), придется слушать тишину из динамиков, особенно с учетом шумной окружающей обстановки. Для этой цели служат приборы, называемые компрессорами. В некоторых случаях, наоборот, требуется расширить динамический диапазон, тогда применяются экспандеры. А чтобы исключить превышение максимального уровня, которое приведет к клиппированию (ограничение сигнала сверху, сопровождаемое очень высокими нелинейными искажениями, воспринимаемыми как хрип), в студиях используются лимитеры. Они как правило обеспечивают «мягкое» ограничение, а не просто срезают верхушки сигнала;

cifrovoe-i-analogovoe-audio-12.jpg
Рис. 12. Пример студийного процессора динамической обработки звука

  • спецэффекты для студий, ЭМИ и пр.: в распоряжении звукорежиссеров и музыкантов имеется большое количество спец-техники для придания звучанию нужной окраски или получения определенного эффекта. Это различные дистортеры (звук электрогитары становится хриплым, зернистым), приставки вау-вау (модуляция по амплитуде, вызывающая характерный «квакающий» эффект), энхенсеры и эксайтеры (приборы, влияющие на окраску звука, в частности, могущие придавать звучанию «ламповый» оттенок); фленжеры, хорусы и т.д.

cifrovoe-i-analogovoe-audio-13.jpg
Рис. 13. Примеры процессоров и приставок для электрогитар

  • смешивание звуков, эхо/реверберация: запись на студиях обычно ведется в многоканальном виде, затем с помощью микшеров фонограмма сводится в нужное количество каналов (чаще всего 2 или 6). При этом звукорежиссер может «выдвинуть вперед» тот или иной солирующий инструмент, записанный на отдельной дорожке, изменить соотношение громкостей разных дорожек. Иногда на сигнал накладываются многократные копии меньшего уровня с определенным сдвигом по времени, тем самым имитируется естественная реверберация (эхо). В настоящее время подобные и прочие эффекты достигаются в основном с помощью сигнальных процессоров, обрабатывающих цифровой сигнал.

cifrovoe-i-analogovoe-audio-14.jpg
Рис. 14. Современный микшерный пульт

ЗАПИСЬ АНАЛОГОВОГО АУДИО

Считается, что механическая запись звука была впервые реализована Эдисоном в 1877 году, когда он изобрел фонограф – валик, покрытый слоем мягкой станиоли, на который иглой, передающей колебания воздуха, наносился след (впоследствии вместо станиоли использовался воск, а сам метод стали называть глубинной записью, поскольку дорожка модулировалась по глубине). Однако в том же году француз Шарль Кро подал заявку в Академию наук по поводу своего изобретения – звук записывался на плоском стеклянном диске, покрытым сажей, с помощью соединенной с мембраной иглы, получалась поперечная дорожка, затем диск предполагалось просвечивать и снимать с него фотокопии для тиражирования (сам способ еще предстояло разработать). В конце концов поперечная запись, которая оказалась намного совершеннее глубинной, дала начало грамзаписи. В мире появились три компании, серийно выпускавших пластинки (CBS в Америке, JVC в Японии, Odeon в Германии – эта компания подарила миру двустороннюю пластинку) и аппараты для их воспроизведения. От Дойче Граммофон (Германия) произошло название «граммофон», от Пате (Франция) – патефон. Затем начали производить портативные патефоны с раструбом на шарнире, с электрическим двигателем вместо ручного привода, позже – с электромагнитными адаптерами. Пластинки становились все совершеннее, вмещали больше материала по времени звучания, расширялся диапазон частот, первоначально ограниченный 4 кГц. На смену хрупкому шеллаку пришел винилит, а недолговечные стальные иглы уступили место сапфировым, затем и алмазным. Началась эпоха стерео: в одной канавке нарезались две дорожки под углом в 45°. К началу 80-х годов прошлого века, когда наметилась глобальный переход к цифровому формату звука, виниловая пластинка подошла в апогее своего развития.

cifrovoe-i-analogovoe-audio-15.jpg
Рис. 15. Граммофон, патефон, электропроигрыватель

Магнитная запись более совершенна и издавна применялась в студиях. Первый аппарат для магнитной записи – телеграфон – создал Вальдемар Паульсен (Дания) в 1878 году, причем запись велась на стальную проволоку (струну от фортепьяно). В 20-х годах 20 века появились магнитофоны, использовавшие магнитную ленту. Массовое производство магнитофонов началось в 40-х. Сначала появились магнитные ленты на целлюлозной, а затем на лавсановой основе. Запись аудиосигналов производится на продольные дорожки с помощью пишущей (или универсальной) головки с магнитным зазором. Лента протягивается вплотную к зазору головки, и на ней образуется дорожка остаточного намагничивания. Нелинейная часть характеристики «размывается» с помощью высокочастотного тока подмагничивания (обычно порядка 100 кГц), на который накладывается полезный сигнал. Студийные аналоговые магнитофоны наряду с цифровыми до сих пор применяются для первичной записи фонограмм. Бытовые бывают двух- и трехголовочными (отдельно записывающая, воспроизводящая и стирающая головки либо стирающая и универсальная). Иногда присутствуют две воспроизводящие головки, если предусмотрен реверс.

Даже при очень бережном отношении магнитная лента со временем начинает осыпаться

Магнитная лента обладает шумами, которые уменьшаются (частично выводятся за пределы слышимого диапазона) с ростом скорости протяжки. Поэтому студийные магнитофоны имеют скорость 38, в то время как бытовые катушечные – 19 и 9,5 см/с. Для бытовых кассетных магнитофонов была принята скорость 4,76 см/с. Шумы ленты эффективно подавляются с помощью компандерной системы Dolby B: при записи уровень высокочастотной части для слабых сигналов поднимается на 10 дБ, а при воспроизведении на столько же опускается.

Профессиональная аналоговая магнитная запись на высокой скорости обеспечивает очень высокое качество. Именно на магнитных мастер-лентах долгое время архивировались музыкальные записи, и с них фонограмма переносилась на виниловые пластинки с некоторой потерей качества. Однако даже при очень бережном отношении магнитная лента со временем начинает осыпаться, ей свойственно постепенное размагничивание, деформация, копир-эффект (соседние слои в рулоне взаимно намагничиваются), она подвержена влиянию внешних магнитных полей. Затруднен также быстрый поиск нужного фрагмента (хотя это неудобство относится скорее к бытовой сфере). Поэтому с появлением цифровых форматов компания Sony, владелец огромного архива записей CBS/Columbia, озаботившись проблемой сохранности бесценных оригиналов записей второй половины 20 века, разработала метод записи в формате дискретной широтно-импульсной модуляции (поток DSD – Direct Stream Digital, который в дальнейшем дал начало пользовательскому формату Super Audio CD). Если аналоговая магнитная запись обеспечивает сохранность фонограммы в несколько десятилетий при постепенно увеличивающихся потерях, то цифровые архивы вечны и выдерживают неограниченное количество копирований без какой-либо деградации. По этой, как и по многим другим причинам (сервисные преимущества, универсальность, огромные возможности обработки) все большее распространение нынче получают цифровые форматы аудио.

ПОЛУЧЕНИЕ ЦИФРОВОГО АУДИОСИГНАЛА

По теореме Котельникова-Шенона дискретный сигнал может быть впоследствии полностью восстановлен при условии, что частота дискретизации как минимум вдвое превосходит верхнюю частоту спектра сигнала

Цифровой сигнал получают из аналогового или синтезируют непосредственно в цифре (в электромузыкальных инструментах). Аналого-цифровое преобразование предполагает две основные операции: дискретизацию и квантование. Дискретизация – замена непрерывного сигнала на ряд отсчетов его мгновенных значений, взятых через равные промежутки времени. По теореме Котельникова-Шенона дискретный сигнал может быть впоследствии полностью восстановлен при условии, что частота дискретизации как минимум вдвое превосходит верхнюю частоту спектра сигнала. Затем отсчеты квантуются по уровню: каждому из них присваивается дискретное значение, ближайшее к реальному. Точность квантования определяется разрядностью двоичного представления. Чем выше разрядность, тем больше уровней квантования (2N, где N – число разрядов) и ниже шумы квантования – погрешности из-за округления до ближайшего дискретного уровня.

cifrovoe-i-analogovoe-audio-16.jpg
Рис. 16. Оцифровка аналогового сигнала и получение цифровых отсчетов

Формат CD предполагает частоту дискретизации 44,1 кГц и разрядность 16 бит. То есть получается 44 тысячи отсчетов в секунду, каждый из которых может принимать один из 216 = 65536 уровней (для каждого из стереоканалов).

Наиболее совершенными пользовательскими форматами аудио являются DVD Audio и Super Audio CD (SACD)

Помимо формата 44,1 кГц / 16 бит в цифровой записи применяются и другие. Студийная запись обычно производится с разрядностью 20-24 бит. Затем данные переводятся в стандартный CD-формат путем пересчета. Лишние биты затем отбрасываются либо (лучше) округляются, иногда подмешивается псевдослучайный шум для уменьшения шумов квантования (dither).

Наиболее совершенными пользовательскими форматами аудио являются DVD Audio и Super Audio CD (SACD). В DVD Audio принят алгоритм сжатия данных без потерь MLP, разработанный компанией Meridian. А SACD, в отличие от других форматов, использует не импульсно-кодовую модуляцию (ИКМ, или PCM), а однобитовое кодирование DSD-потока (дискретная широтно-импульсная модуляция). Диски SACD бывают однослойными и двухслойными (гибридными), с обычным CD-слоем.

Наиболее популярным аудио носителем на сегодня остается компакт-диск, несмотря на определенные ограничения по качеству звучания, отмечаемые аудиофилами. Причина их – в низкой частоте дискретизации: для точного восстановления сигналов, близких к верхней границе звукового диапазона, необходим фильтр, не реализуемый физически (его импульсная реакция захватывает область отрицательного времени). Это в определенной степени компенсируется с помощью цифровой фильтрации с повышением частоты дискретизации и разрядности. Для обеспечения бесперебойного воспроизведения в реальном времени данные на диске записываются с избыточным кодированием (код Рида-Соломона).

Цифровые носители, чатоты дискретизации и разрядности кодирования

Носитель Авторство Размеры Время звучания,
мин.
Кол. каналов Fs, кГц Разрядн., бит
CD-DA Sony,
Philips
120, 90 мм до 90 2 44,1 16
S-DAT кассета, лента 3,81 мм 2 32, 44,1, 48 16
R-DAT кассета, лента 3,81 мм 2, 4 44,1 12, 16
DASH лента 6,3, 12,7 мм 2…48 44,056,
44,1, 48
12, 16
DAT Alesis кассета
S-VHS
60 8 44,1, 48 16, 20
DСС Philips кассета 2, 4 32, 44,1,
48
16, 18
MiniDisk Sony 64 мм 74 2, 4 44,1 16
DVD
Audio
120 мм 5.1 192 24
SACD Sony,
Philips
120 мм 2, 5 2800 1

Для передачи цифрового звука нужна широкополосная линия связи, особенно для несжатого многоканального потока высокого разрешения.

ПЕРЕДАЧА ЦИФРОВОГО АУДИО

Линиями связи для передачи цифрового аудио могут служить кабели, оптические линии и радиоэфир.

Для передачи ИКМ-сигналов по проводным линиям разработаны интерфейсы AES/EBU (балансный, коаксиальный), S/PDIF (небалансный коаксиальный), обеспечивающие передачу нескольких сигналов (тактовую частоту, частоту следования цифровых слов, данные каналов) по одному проводу. Внутри аппаратов эти сигналы передаются по отдельности, на выходе транспортного механизма кодируются, а на входе цифро-аналогового преобразователя (в двухблочных системах) вновь разделяются в цифровом приемнике.

Как правило, для передачи цифрового аудио используется высококачественный коаксиальный кабель. Существуют также преобразователи S/PDIF для оптоволоконных линий: AT&T ST и Toslink (последний является стандартным для бытовой аппаратуры). А также – для использования витых пар в составе кабельных сетей Ethernet. Средой распространения сжатого аудио в виде архивированных файлов является и сеть Интернет.

cifrovoe-i-analogovoe-audio-17.jpg
Рис. 17. Оптический кабель с разъемом Toslink

Как любой цифровой сигнал, оцифрованное аудио распределяют и коммутируют с помощью специальных устройств – усилителей-распределителей, обычных и матричных коммутаторов.

Имеется фактор, отрицательно влияющий на цифровые сигналы и часто сводящий на нет практически все преимущества цифрового аудио перед аналоговым, в числе которых возможность многократного копирования, передачи и архивирования программ без потерь качества — речь идет о джиттере. Джиттер представляет собой дрожание фазы, или неопределенность момента перехода из 0 в 1 и наоборот. Происходит это из-за постепенной деформации прямоугольных импульсов с практически идеальными фронтами, которые становятся все более пологими из-за реактивных элементов кабелей, что и приводит к неопределенности момента перепада, хотя крутизна фронтов в каждом последующем цифровом устройстве полностью восстанавливается. С джиттером все современные цифровые устройства успешно борются с помощью блоков перетактирования (reclocking). Подробнее см. брошюру «Коммутация и управление сигналами».

cifrovoe-i-analogovoe-audio-18.jpg
Рис.18. Распределение и коммутация

Для передачи и записи на различные цифровые носители применяются сжатые форматы аудио: Dolby Digital (AC-3) и DTS. Это позволяет разместить на диске DVD Video емкостью 4,7 Гб полнометражный фильм с многоканальным звуковым сопровождением, а также разного рода дополнительные материалы. Формат Dolby Digital предлагает 5 независимых каналов: 2 фронтальных, 2 тыловых и 1 сабвуферный для спец-эффектов. Сжатие производится с помощью адаптивного алгоритма MPEG Audio, основанного на психоакустических особенностях восприятия звука и обеспечивающего минимальную заметность сжатия. Все это позволяет воссоздать полноценную трехмерную звуковую панораму. Однако для качественного воспроизведения музыки Dolby Digital подходит гораздо меньше, чем CD, обладая меньшим разрешением. Скорость потока в режиме Dolby Digital (отсчеты по каждому каналу передаются друг за другом) составляет 384-640 кбит/с, в то время как в обычном двухканальном формате CD – 1411,2 кбит/с. Формат Dolby Digital 5.1 неоднократно совершенствовался, в основном в направлении наращивания количества каналов. Сейчас доступен вариант DD 7.1, предполагающий 2 фронтальных, 2 боковых и 2 тыловых канала, не считая канала спецэффектов (известна также модификация DD 6.1 с одним тыловым каналом).

Формат DTS имеет меньшую степень сжатия и большую скорость потока данных – 1536 кбит/с. Поэтому он используется не только для кодирования многоканальных саундтреков на DVD Video, но для многоканальных аудиод

Подпишитесь на рассылку
и получайте популярные статьи, видео и кейсы за неделю в одном письме