Главная » Программирование звука » Аудио MPEG как способ компрессии видеопоследовательностей

0

Первое заседание Группы экспертов по движущимся изображениям (Motion Pictures Experts Group, MPEG) состоялось в мае 1988 года. Эта группа была создана решением  Международной  организации  по  стандартизации  (International  Organization for  Standardization,  ISO)  с целью  разработки стандартного  способа компрессии  видеопоследовательностей. K концу 1992 года ISO был официально одобрен первый стандарт из целой группы стандартов, известной также под названием MPEG. Несмотря на то что стандарты из группы MPEG больше всего известны в области компрессии видео, они распространяются и на высококачественную компрессию звука. B   разработке   стандартов   MPEG   принимало   участие   большое   количество   компаний,  исследовательских  организаций  и  групп  по  разработке  стандартов.  Частично это стало следствием того, что интересы различных отраслей промышленности совпали. Коммерческие станции вещания были заинтересованы в передаче высококачественного видео по спутниковым, кабельным и обычным каналам. Производители   бытовой   радиоэлектроники   хотели   получить   возможность   распространять фильмы  на  компактных  цифровых  носителях.  Производителям  компьютеров  была нужна  возможность  использования  аудио и  видеоинформации  в  разнообразных программных продуктах. Ключевым условием для всех этих областей является наличие стандарта на высококачественную цифровую компрессию.

Обзор стандартов MPEG

Разработка   стандартов   MPEG     это   непрекращающийся   процесс.   По   мере того как возрастал интерес к новым технологиям и устройствам, комитеты по разработке  MPEG  проводили  анализ  существующих  стандартов  и,  по  возможности, вели работу по их расширению и улучшению. Поскольку все больше и большелюдей  приобретают  опыт  работы  с этими стандартами, появляются  новые  успешные разработки,  повышающие  их  качество.  B  настоящее  время  известны  три  стандарта  MPEG,  находящиеся  на  различных  стадиях  развития.  Каждый  из  стандартов включает  в  ссбя  несколько  частей,  относящихся  к  разным  аспектам  компрессии видеосигналов, их хранения и распространения.

Стандарт MPEG-1

Стандарт  ISO-11172,  получивший  наименование  Стандарт  кодирования  движущегося изображения и связанного с ним звука для цифровых носителей информации со скоростью передачи данных до и около 1,5 Мбит/с, первый из стандартов группы  MPEG.  Общеизвестный  как MPEG-I,  он  состоит  из  пяти  частей,  перечисленных в табл. 14.1.

Таблица 14.1. Составные части стандарта MPEG-1

Часть 1: системы                 Описывает, как комбинировать множественные видеои аудиопотоки

Часть 2: видео                     Описывает, как сжимать последовательность изображений Часть 3: аудио                     Описывает, как сжимать одноили двухканальный звук Часть 4: соответствие         Описывает, как тестировать реализацию на соответствие

Часть 5: программное         Полная справочная реализация стандарта, сделанная, в частности,

обеспечение                        для устранения рассогласований, вызванных некоторыми первыми неудачными реализациями стандарта

B   соответствии   со   своим   названием   MPEG-I   предназначен   для   исполь-

зования  в  системах,  которые  могут  передавать  данные  со  скоростью  порядка

1,5  Мбит/с  (или  187,5  Кбайт/с).  K  таким  устройствам  относятся  компакт-диски,  линии  ISDN  и  некоторые  широковещательные  системы.  Принято  считать, что  в  целом  MPEG-I  позволяет  получить  такое  же  качество,  как  и  видеозапись стандарта  VHS.  Для  записи  необработанного  аудио и  видеосигнала  телевизионного   качества   необходима   скорость   передачи   данных   около   200   Мбит/с, что   соответствует   общей   компрессии   с   коэффициентом,   приблизительно   равным 150:1.

Раздел  стандарта  MPEG-I,  относящийся  к  компрессии  звука,  поделен  на  три

уровня.  Каждый  последующий  уровень  позволяет  получить  более  высокое  качество за счет более сложной реализации. Самым простым является первый. Лучше всего  он подходит  для  тех  случаев,  когда  данные  могут  передаваться  с большой скоростью  (например, считываться  с жесткого  диска)  при ограниченной скорости вычислений.  Стандарт  третьего  уровня  позволяет  добиться  максимального  качества  в  случае  критичности  объема  данных,  однако  работа  с  ним  подразумевает больший объем вычислений для компрессии и декомпрессии.

Использование   несогласованной   нумерации   для   частей   MPEG   стандартов привело  к  некоторой  путанице  с  именами  файлов.  B  частности,  повсеместно  используются  расширения   имен   файлов,   содержащие   цифры.   Расширение   .MP3, например,  чаще  всего  применяется  для  аудиофайлов  третьего  уровня  (Layer  3). Однако  может  быть  непонятно  (если  только  не  поясняется  в  контексте),  какой формат  имеет  файл  с расширением .MP2  видео MPEG-2  или звуковой MPEG-I Layer 2.

Правильное   распознавание   звуковых   и   видеофайлов   формата   MPEG   имеет большое  значение.  Стандарт  MPEG  определяет  три  формата  хранения  данных. B  файле  могут  быть  записаны  видеопоток,  аудиопоток  или  системный  поток, где  в  некоторой  комбинации  чередуются  данные  из  аудио и  видеопотоков.  Все три типа файлов получили широкое распространение.

Стандарт MPEG-2

Следствием   относительного   успеха   стандарта   MPEG-I   стала   заинтересованность в дальнейшем расширении стандарта для его использования в других приложениях. B результате появился стандарт ISO-13818, обычно называемый MPEG-2. Онявляется расширением и разъяснением стандарта MPEG-I, позволяющим

применять его более широко. B частности, в этом стандарте указывается, что всякий  декодер,  поддерживающий  стандарт  MPEG-2,  должен  также  поддерживать и MPEG-l.

Например,   в   третьей   части   стандарта   MPEG-2   аудиокодирование   MPEG-I расширяется   в   двух   направлениях.   Для   приложений,   использующих   высококачественный  звук  с  эффектом  присутствия,  добавляется  возможность  применения до  пяти  каналов  звука.  Для  приложений,  работающих  в  условиях  узкой  полосы пропускания,  напримердля  радиовещания  в  Internet,  обеспечивается  возможность использования меньших скоростей передачи битов (вплоть до 8 Кбит/с) и не столь высоких частот дискретизации (до 16000 выборок в секунду).

MPEG-2  состоит  из  девяти  частей.  Наименования   первых   пяти  совпадают с  наименованиями  частей  стандарта  MPEG-I,  а  части  с  6-й  по  9-ю  обеспечивают новые свойства и повышение точности воспроизведения. B седьмой части особый интерес  представляет  аудиоформат  AAC  (Advanced  Audio  Coding   усовершенствованная  система  кодирования  звука),  который  предназначен  для  решения  ряда проблем, связанных с поддержкой многоканального звука в третьей части MPEG-2. (Изначально  формат  AAC  был  известен  как  NBC   Non-Backwards  Compatible, обратно  несовместимый  формат  кодирования  звука.  B  противовес  этому  формат записи  звука,  описанный  в  третьей  части  MPEG-2,  иногда  называется  ВС-аудиоформатом.)

Для  обеспечения  обратной  совместимости  расширение  многоканальной  поддержки в третьей части MPEG-2 сначала смешивает все каналы так, чтобы получился  единый  стереопоток,  который  кодируется  с  помощью  методов,  описанных в  третьей  части  MPEG-I.  После  этого  кодируется  дополнительная  информация, которая  затем  встраивается  в  поток  битов  так,  чтобы  декодировщик  MPEG-I  ее не  распознавал.  B  результате  этого  декодер  MPEG-I  сможет  выделить  и  восстановить  стереозапись,  а  декодер,  обрабатывающий  многоканальный  звук,  полностью восстановит исходный сигнал (в котором могут работать до 5 каналов).

Ha практике эта многоканальная схема работает не так хорошо, как ожидается,  и  многие  программисты  предпочитают  применять  конкурирующие  схемы  кодирования,  такие  как компрессия  Dolby  AC-3.  При  создании  формата  ААС-аудио отказались  от  требования  обеспечения  совместимости  с  MPEG-I,  что  позволило добиться  более  высокого  качества  в  работе  с  приложениями,  использующими эффект присутствия.

Стандарт MPEG-3

Изначально  MPEG-3  был  предназначен  для  поддержки  телевидения  высокой четкости  (HDTV).  От  него  отказались,  как  только  стало  понятно,  что  MPEG-2 будет вполне достаточно.

Стандарт MPEG-4

MPEG-4 представляет собой попытку разработать стандарт для систем с очень низкой скоростью передачи битов. Работа над ним продолжается и сегодня. HaI личие этого стандарта позволило бы передавать низкокачественное видео по лиI ниям связи со скоростью передачи на уровне модема.

Источник: Кинтцель Т.  Руководство программиста по работе со звуком = A Programmer’s Guide to Sound: Пер. с англ. М.: ДМК Пресс, 2000. 432 с, ил. (Серия «Для программистов»).

По теме:

  • Комментарии