4) полоса пропускания до 24 Мбит/сек на ввод и до 48 Мбит/сек. на вывод;
5) поддержка форматов звука 5.1, 6.1 и 7.1 (Dolby Digital, Dolby Digital Surround-EX, DTS, DTS-ES);
6) полное автоматическое переопределение выходов/входов звукового кодека (например в гнездо, маркированное как «наушник», можно подключить «микрофон», и драйвер звукового кодека автоматически переназначит входы и выходы).
На сегодняшний день это основная спецификация звукового кодека, реализуемого на современных материнских платах. При этом звуковые кодеки (Realtek, VIA, Intel, ADI) могут различаться между собой аппаратной частью, однако совместимы между собой благодаря спецификации HD-Audio.
3.3. Системы пространственного звучания
В последнее время системы пространственного или объемного звучания становятся все более и более популярными.
При звуковом оформлении помещений для достижения эффекта присутствия используется специализированное оборудование, которое позволяет выводить звук на большое количество колонок, при этом должны использоваться технические средства по созданию соответствующего звукового сопровождения.
Для создания систем пространственного звучания используется специальное оборудование – многоканальные усилители (ресиверы), которые позволяют работать с многоканальным звуком. Также звуковые карты с появлением спецификации HD-Audio стали поддерживать вывод многоканального звука через аналоговые и цифровые выходы.
Для работы c многоканальным звуком (и его хранения) применяются различные форматы.
3.3.1. Dolby Digital. Стандарт предложен фирмой «Dolby Laboratories» и в него входят несколько форматов.
Dolby Surround AC-3 (Dolby Digital). Система Dolby Surround AC-3 была определена фирмой «Dolby Laboratories» как звуковая система для домашнего театра. В связи с тем, что реально эта система для конечного пользователя мало чем отличается от просто Dolby Digital (предназначенной для профессионального применения), было принято решение об объединении обеих технологий под общим названием Dolby Digital. Dolby Digital является дальнейшим улучшением ранее разработанных фирмой «Dolby» технологий Dolby Surround и Dolby Pro Logic. Изменения коснулись как технологии записи/воспроизведения звука, так и способов его передачи. Информация в технологии Dolby Digital передается только в цифровой форме и за счет оптимальных способов кодирования занимает небольшой объем (меньше, чем обычный аудиосигнал).
Dolby Surround – одна из первых систем объемного звучания, разработанных инженерами фирмы «Dolby Laboratories». Запись и воспроизведение звука выполняются для четырех каналов: левого и правого фронтальных каналов, а также левого и правого тыловых каналов. Сигнал для тыловых каналов кодируется вместе с сигналами для фронтальных каналов. При воспроизведении стереосигнал требует декодирования для извлечения информации тыловых каналов.
Dolby Pro Logic – система объемного звучания, разработанного инженерами фирмы «Dolby Laboratories». Запись и воспроизведение звука выполняются для пяти каналов: левого, центрального и правого фронтальных каналов, а также левого и правого тыловых каналов. Отличается от системы Dolby Surround большим разделением фронтальных и тыловых каналов.
Основная задача, которую ставили перед собой разработчики систем кодирования звука, максимально простыми и недорогими способами дать возможность пользователю "видеть" источники звука и четко представлять, где находится источник любого звука. Естественно, первоначально эти системы задумывались только для киноиндустрии, так как в кино объединение высококачественного изображения и объемной звуковой картины дает наиболее сильный и заметный даже для неискушенного слушателя эффект.
Dolby Digital не является форматом 3D-звука и не может использоваться в играх для поддержки самой игровой среды. Звук, записанный по стандарту Dolby Digital, ничем не отличается от обычного аудио и не может быть получен "искуственным" путем, а только соответствующей записью реального, "живого" звука и не может быть изменен после записи. Поэтому звук Dolby Digital может сопровождать фильм, концертную запись и т. п. и будет записан на обычной звуковой дорожке к фильму.
После появления DVD-видеодисков стало возможным записывать звуковую дорожку к фильмам на них в формате Dolby Digital. Одновременно интерес к технологиям от Dolby возник и у производителей звуковых карт, так как совершенно очевидно, что желание, наряду с превосходной картинкой с DVD-диска иметь объемный звук, появилось у владельцев компьютеров достаточно быстро.
Требования для прослушивания звука, записанного по технологии Dolby Digital:
1) собственно источник сигнала с Dolby Digital (DVD-видеодиск, аудиодиск);
2) декодер сигнала Dolby Digital. Как правило в звуковых картах есть поддержка декодирования Dolby Digital и 6 выходов для подключения акустики или многоканальный ресивер (усилитель) с поддержкой функции декодирования Dolby Digital;
3) акустическая система с числом колонок минимально от 4 до 5 и сабвуфером (он же LFE). Примерный эскиз расположения динамиков, рекомендуемый инженерами Dolby Laboratories, приведен на рис. 38.

Рис. 38. Схема подключения акустической системы 5.1
Блок LFE – Low Frequence Effects Channel – канал для низкочастотных эффектов. Это не сабвуфер, так как низкочастотные динамики могут входить в состав фронтальных акустических систем и собственно низкочастотные звуки будут воспроизводиться именно ими. Сюда могут быть направлены звуки мощных низкочастотных источников – взрывы, землетрясения и т. п. Если отсутствует LFE, то эти звуки будут направлены на фронтальные системы и они должны иметь возможность воспроизвести подобные звуки без искажений.
Примечание. При построении домашних акустических систем 5.1 под блоком LFE подразумевается сабвуфер, т. к. в основном остальные колонки являются одно-, двухполосными.
Под усилителем с декодером подразумевается любой источник декодированного звука Dolby Digital.
Под правым и левым Surround понимаются акустические системы для левого и правого боковых каналов объемного звука. Их не называют просто тыловыми, так как в кинотеатрах в зависимости от длины зала левые и правые Surround системы могут состоять из десятков динамиков как по левой, так и по правой стороне зрительного зала.
На DVD-дисках обычно есть специальная маркировка, указывающая тип формата записи звука (рис. 39).
а) Моно |
б) Стерео |
в) Dolby Surround |
г) Дискретный Surround |
д) Квадрафонический звук |
е) Dolby Digital 5.1 |
Рис. 39. Маркировка на DVD-диске, указывающая тип записи звука
Любой диск, на котором есть хотя бы один звуковой фрагмент, записанный в формате Dolby Digital, должен иметь специальную маркировку (рис. 40).

Рис. 40. Маркировка диска с форматом Dolby Digital
Особенностью стандарта Dolby Digital является использование сжатия звука Dolby AC-3 с максимальной скоростью потока 448 кбит/сек. для дисков DVD и до 640 кбит/сек. для дисков Blu-ray.
DOLBY Surround-EX. Стандарт DOLBY Digital корпорации «Dolby Digital» предоставляет высококачественный цифровой стереозвук. Начиная с 1992 года в кинотеатрах применялся стандарт 5.1, который определяет 5 отдельных основных каналов звука: левый, центральный, правый, левый окружающий (surround), правый surround и канал LFE для низкочастотных аудиоэффектов.
Новый стандарт звука DOLBY Surround-EX был разработан в 1999 году и отличается от предыдущих добавлением ещё одного surround-канала – заднего (рис. 41).

Рис. 41. Логотип стандарта Dolby Digital Surround-EX
Формула этого стандарта – "6.1". Таким образом, общее число каналов составляет 7, из них три обычных, три окружающих (surround) и один канал аудиоэффектов. Каждый канал может быть представлен двумя – тремя колонками, а эффекты обычно воспроизводятся через две колонки.
Примерная схема расстановки динамиков по стандарту DOLBY Surround-EX представлена на рис. 42.

Рис. 42. Расположение акустической системы
по стандарту Dolby Digital Surround-EX
Dolby Pro Logic IIx. Dolby Laboratories представила новый стандарт объемного звучания – Dolby Pro Logic IIx (рис. 43).

Рис. 43. Логотип стандарта Dolby Pro Logic IIx
В нем использованы элементы Dolby Pro Logic II и Dolby Digital Surround-EX, предназначен для воспроизведения на 7- или 8-канальных системах традиционных стереозаписей и записей формата 5.1 без искажений. Новая технология обеспечивает лучшие пространственные эффекты, лучшее позиционирование и лучший звуковой фон с низкими частотами.
Dolby Digital Plus. Стандарт представлен компаниями «MIPS Technologies» и «Dolby Laboratories» (рис. 44).

Рис. 44. Логотип стандарта Dolby Digital Plus
Это новая технология построения звука для устройств, поддерживающих воспроизведение видео и аудио высокой четкости, например HD DVD и Blu-ray-проигрыватели. Позволяет воспроизводить звук в формате до 7.1 с полосой пропускания до 6 Мбит/сек, при этом обратно совместим со стандартом Dolby Digital (старые устройства смогут использовать только формат звука 5.1).
Dolby TrueHD. Предыдущие форматы оперировали со сжатым звуком, при котором имелись некоторые потери. Новый стандарт Dolby TrueHD предполагает использование алгоритма сжатия без потерь (lossless) – Meridian Lossless Packing (MLP) для более качественного звучания (рис. 45).

Рис. 45. Логотип стандарта Dolby TrueHD
Цифровой поток может вмещать до 14 отдельных звуковых каналов (однако самые распространенные 5.1 и 7.1). Стандарт поддерживает разрядность 24 бит при 192 кГц (полоса пропускания до 63 Мбит/сек.) – для дисков Blu-ray доступно 8 каналов с разрядностью 24 бита при 96 кГц (полоса пропускания до 18 Мбит/сек.).
Для вывода такого формата звука должен использоваться интерфейс HDMI версии 1.3 и выше.
Примечание. High-Definition Multimedia Interface (HDMI) – интерфейс для мультимедиа высокой четкости, обеспечивающий передачу аудио - и видеоинформации. Существуют несколько версий интерфейса, отличающихся поддержкой различных форматов передачи данных и полосой пропускания: v1.0 – пропускная способность интерфейса 4,9 Гбит/сек, макс. разрешение видео 1920 ´ 1080 с глубиной цвета 8 бит на каждый цвет, количество аудиоканалов 8 (до 192 кГц/24 бит); v1.3 – полоса пропускания до 10,2 Гбит/сек, глубина цвета видео 10, 12, 16 бит на каждый цвет, поддержка форматов звука Dolby TrueHD и DTS-HD; v1.4 – увеличено разрешение видео до 3840 ´ 2160 при 24/25/30 Гц, возможность создания Fast Ethernet соединения (100 Мбит/сек.), реализована поддержка 3D; v1.4a – улучшена поддержка 3D (введены обязательные 3D-форматы для игр, фильмов и телевидения).
3.3.2. DTS. Изначально стандарт разрабатывался для кинотеат-
ров, но в дальнейшем стал использоваться для домашних кинотеатров.
DTS Digital Surround. Стандарт звука DTS (Digital Theatre System) (цифровые системы для кинотеатров) был разработан в 1993 году компанией «DTS», совладельцами которой являются Стивен Спилберг и компания «Universal» (рис. 46).

Рис. 46. Логотип стандарта DTS
Первое своё применение он нашёл в фильме "Парк Юрского периода" и отличается тем, что на киноплёнке нет отдельной цифровой аудиодорожки, а присутствует только тайм-код для синхронизации картинки и звука. Сам же звук записывается на CD-ROM. Таким образом, для воспроизведения звуков в этом формате в кинотеатр, кроме рулонов киноплёнки, привозят ещё и компакт-диски для декодера. В DTS так же применяется сжатие звуковых данных, как и в Dolby Digital Surround-EX, однако благодаря меньшему сжатию и более совершенному алгоритму качество звука, закодированного в DTS, выше, чем у Dolby Digital (при сохранении частоты дискретизации 48 кГц и разрядности сигнала 16 бит, скорость потока выше – 1411 кБит/сек. у DTS против максимального 448 кБит/сек. у Dolby Digital). Высокое качество звука DTS послужило причиной его выбора для издания музыкальных компакт-дисков DVD-Audio, смикшированных для многоканального прослушивания, а также для распространения фильмов в формате DVD-Video.
Схема конфигурации акустической системы 5.1 такая же, как и для стандарта Dolby Digital (рис. 38).
DTS Extended Surround. Он дополняет стандарт DTS и в него введен центральный тыловой канал (рис. 47).

Рис. 47. Логотип стандарта DTS Extended Surround (DTS ES)
Этот центральный канал может быть отдельным – DTS ES Discrete 6.1 или получаться за счет использования матричного метода – DTS ES Matrix 6.1. В последнем случае центральный тыловой канал кодируется по специальному алгоритму в два тыловых канала и восстанавливается при воспроизведении.
Возможно использование акустической системы формата 7.1 за счет того, что 2 тыловых колонки выводят один и тот же канал. Схема размещения такой системы представлена на рис. 48.

Рис. 48. Схема размещения акустической системы 7.1
для стандартов DTS-ES и Dolby Surround-EX
DTS Neo:6. За счет использования матричного метода предполагается выделение из стереосигнала центрального и тыловых каналов, таким образом получается звук 5.1 или 6.1 (рис. 49).

Рис. 49. Логотип стандарта DTS Neo:6
DTS 96/24. Разработан для "поддержки" более качественного многоканального звука на носителях DVD (DVD-Video и DVD-Audio) (рис. 50).

Рис. 50. Логотип стандарта DTS 96/24
Обеспечивает формат звучания 5.1 с частотой дискретизации 96 кГц с разрядностью 24 бита.
DTS Connect. Система кодирования звука со всех приложений, запущенных на компьютере, в один многоканальный поток формата DTS Digital Surround и вывод его через S/PDIF (рис. 51).

Рис. 51. Логотип стандарта DTS Connect
В DTS Connect входят: DTS Neo:PC и DTS Interactive. DTS Neo:PC обеспечивает создание из стереоисточников за счет матричного метода звук в формате до 7.1. DTS Interactive предназначена для кодирования различных источников аудиосигнала в формат DTS Digital Surround в реальном времени и вывод его через цифровой выход S/PDIF.
DTS-HD High Resolution Audio. Стандарт стал дальнейшим развитием DTS Digital Surround (рис. 52)

Рис. 52. Логотип стандарта DTS-HD High Resolution Audio
Он обеспечивает хранение звука формата 7.1 с частотой дискретизации 96 кГц с разрядностью 24 бита и полосой пропускания до 6 Мбит/сек. Данные организованы таким образом, что если оборудование не обеспечивает воспроизведение "нового" стандарта, то внутри содержится ядро DTS 5.1 (DTS core) с максимальным потоком 1,5 Мбит/сек. и на таком оборудовании звук будет воспроизводиться согласно стандарту DTS Digital Surround.
Для передачи такого формата должен использоваться цифровой интерфейс HDMI версии 1.3.
DTS-HD Master Audio. Аналогично Dolby TrueHD в нем используется сжатие без потерь (рис. 53).

Рис. 53. Логотип стандарта DTS-HD Master Audio
Пропускная способность в новом стандарте увеличена до 24,5 Мбит/сек. Так же содержит ядро DTS 5.1 для совместимости со старым оборудованием.
3.3.3. Environmental Audio eXtensions (EAX). Environmental Audio eXtensions – расширения аудиосреды. Эта система трехмерного звука была разработана фирмой «Creative Technologies» как одна из составляющих ее проекта по звуковой карте Sound Blaster Live!. Основная цель – слушатель (в основном любитель игр) должен получать информацию о местонахождении источника каждого звука и тем самым постоянно быть в трехмерном звуковом окружении.
Если Dolby Digital и DTS предназначены для передачи "живого" звука, то EAX необходима для генерации объемного звука по алгоритмам, заложенным при разработке игровой или иной программы или обработке уже имеющегося "живого" звука под соответствующую среду. Звук в соответствии с EAX может быть сформирован из обычного (например, с аудио компакт-диска) с указанием звуковому процессору параметров среды, которую желательно имитировать при воспроизведении этого звука. В качестве звуковой среды может быть концертный зал, стадион и т. п. Таким же образом может быть сформирован звук для любой программы (игры), и в программное обеспечение к SB Live! входят десятки готовых настроек под различные игры. Но как следствие создания виртуального пространства – обработанный с EAX "живой" звук, как правило, теряет часть своей естественности.
EAX выполнен как расширение DirectSound3D и основан на моделировании реверберации звука в зависимости от окружающей среды. В EAX звуковая среда моделируется по координатам X, Y, Z с учетом отражений и "содержимого" среды, так как действие может происходить в лесу, в квартире, под водой и т. д. Недостатком EAX является то, что нет вычислений звуковой картины под каждую конкретную ситуацию, а используются готовые предопределенные установки для каждого типа окружающей среды. Такой подход также облегчает жизнь и разработчикам игр, от которых требуется только указать тип среды и размер комнаты (пещеры, туннеля и т. п.). Этот способ позволяет также иметь звук с EAX и для тех игр, в которых поддержка EAX не заложена разработчиками. Достаточно просто знать среду, в которой происходит в основном действие игры, и поддержка как бы объемного звука легко появляется.
Одним из самых главных преимуществ EAX для разработчиков игр является то, что стандарт является открытым и включен в DirectX. Поэтому любая фирма-разработчик звуковых карт может включить поддержку EAX в свое изделие, поддерживая EAX аппаратно и/или программно.
Для прослушивания звука с EAX рекомендуется иметь следующие компоненты:
1) звуковую карту с поддержкой EAX (рекомендуется продукция компании «Creative Technologies»);
2) либо две пары обычных активных колонок, либо акустические системы с 4-мя и более колонками;
3) программу, поддерживающую вывод звука в формате EAX.
Последняя версия стандарта EAX год) поддерживает до 128 индивидуальных каналов с наложением 4 эффектов на каждый канал, позволяет обрабатывать входящий сигнал с микрофона (EAX Voice), обеспечивает более точное позиционирование виртуальных источников звука (EAX PurePath) и создает реалистичные эффекты позиционирования на близком расстоянии (EAX MacroFX).
3.3.4. Aureal 3D (A3D). Система пространственного звучания, аналогичная по своим областям применения (но не по принципам проектирования) EAX, была предложена фирмой «Aureal Semicon-ductor» для поддержки объемного звучания в прикладных программах. Основная идея подобной системы – получить трехмерный звук с минимальными затратами (стереоколонки и простая звуковая карта).
Один из путей подобной реализации можно увидеть на рис. 54.
Эта модель справедлива для высоких частот. Низкочастотные звуки воспринимаются по-другому, так как они легко проходят через препятствия и воспринимаются всем телом человека, достигая и его ушей. Поэтому определить направление и место источника низкочастотного звука достаточно сложно и такие звуки обычно не используются для позиционирования источника звука.
Расчет формирования звука делается на основе модели HRTF (Head-Related Transfer Functions). HRTF – функции передачи звука, зависящие от головы человека – концепция передачи звука, основанная на специфических особенностях восприятия звуков человеком. Человеческое ухо имеет нелинейную амплитудно-частотную характеристику, причем с уменьшением уровня громкости звука нелинейность возрастает.

Рис. 54. Принципы работы технологии A3D
Обычная модель HRTF состоит из двух звуковых фильтров (по одному для каждого уха). Функционирование фильтров зависит от трассировки звука до уха слушателя. Именно правильной реализацией механизма HRTF и объясняет фирма «Aureal» высокое качество своей системы объемного звучания. Так как, в отличие от EAX, ее звуковая модель учитывает специфические особенности человеческих ушей. Звук на головных наушниках при этом наиболее правдоподобен, так как звук поступает персонально на каждое ухо. При прослушивании через акустические системы возникает взаимовлияние одного канала на другой и эффект объемного звучания становится менее заметным.
В версии A3D 2.0 основное внимание было уделено математическому алгоритму трассировки звука в зависимости от геометрии и материала среды распространения звука, названному Wavetracing. Алгоритм и соответствующее API разрабатывались «Aureal» в кооперации с такими известными компаниями и организациями, как «NASA», «Matsushita» и «Disney». При расчете звучания анализируются не только отражения звука от различных объектов, но и перемещение звуковых волн через открытую в комнате дверь, распахнутое окно и т. п.
3.3.5. OpenAL. Это кроссплатформенная библиотека API (application program interface, интерфейс прикладного программирования) для работы с аудиоданными (OpenAL, Open Audio Library), предложенная компанией «Creative Labs» в 2000 году – версия OpenAL 1.0. В 2010 появилась версия Open AL 2.1. Поддержка стандарта со стороны производителей звуковых карт (в первую очередь компании «Creative Labs») позволила разработчикам ПО создавать объемный звук под любыми операционными системами.
Основные функции библиотеки OpenAL – исходные объекты, аудиобуферы и единственный слушатель. Исходные объекты включают в себя указатель на буфер, скорость, позицию, направление и интенсивность звука. Слушатель содержит скорость, позицию, направление и общее усиление звука в целом. Буферы содержат аудиоданные в формате PCM в 8- или 16- битном варианте, а также в моно или стерео. Функция рендеринга звука производит необходимые вычисления, такие как определение расстояния, эффекта Доплера и так далее. Таким образом достигается "естественное" звучание при перемещении персонажей в трехмерном мире, а программисту достаточно воспользоваться функциями, предлагаемыми библиотекой.
Спецификация OpenAL содержит два API: ядро, включающее в себя вызовы функций OpenAL, и ALC (Audio Library Context) – API, используемый для управления контекстом рендеринга, контролем использования ресурсов и задействования блокировок в мультипоточных вычислениях. Также существует ALUT-библиотека, предоставляющая функции высокого уровня для упрощения написания программы.
4. СРЕДСТВА ДЛЯ РАБОТЫ С ВИДЕОИНФОРМАЦИЕЙ
В персональных компьютерах видеокарты являются неотъемлемым элементом для вывода графической информации на экран монитора, при этом до недавнего времени за обработку данных отвечал центральный процессор. Постепенно изменялись требования к персональному компьютеру, нацеленные на создание игровых и мультимедийных систем для работы с видеоданными.
Необходимость повышения производительности за счет снижения нагрузки на центральный процессор компьютера потребовала иных подходов к ускорению обработки 3D и видеоинформации.
Для этих целей стали применяться специальные технические средства, которые условно можно разбить на несколько категорий:
1. Видеобластеры (платы видеозахвата) и TV-тюнеры – обеспечивают ввод аналоговой видеоинформации, в том числе и с телевизионных источников сигнала.
2. Платы нелинейного монтажа (платы ввода/вывода) – профессиональные платы, позволяют в процессе ввода/вывода информации обеспечивать обработку (наложение эффектов) в реальном времени.
3. Видеоадаптеры (видеоакселераторы) – отвечают за обработку и вывод видеоинформации.
4.1. Видеобластеры (платы видеозахвата)
Развитие цифровых аппаратных средств позволило обрабатывать видеоизображения на компьютере. Плюсы цифровой обработки заключаются в широких возможностях обработки, которые не могут дать аналоговые способы монтажа. Для работы с видеоинформацией на компьютере необходимо ее "оцифровать", т. е. перевести ее из аналогового вида в цифровой. Эту задачу и призваны решить видеобластеры (платы видеозахвата) (рис. 55).

Рис. 55. Плата расширения – видеобластер
Видеоинформация, передаваемая в компьютер, может быть двух видов:
1. Несжатый поток – происходит только оцифровка аналогового сигнала в цифровой вид и передача его в компьютер для дальнейшей обработки и сжатия.
2. Сжатый поток – помимо оцифровки, этот поток «сжимается» с использованием одного из стандартов сжатия непосредственно на плате или уже центральным процессором (программное сжатие).
С учетом этого отличается конструкция и самих плат (рис. 56 и 57).

Рис. 56. Структурная схема платы с аппаратным сжатием
Как можно увидеть из рис. 56 и 57, платы видеозахвата могут обеспечить ввод и звуковой информации.
К простейшим устройствам захвата видео относятся видеокарты с ТВ-входом. Они позволяют просматривать изображение, полученное с видеокамеры, магнитофона, тюнера или другого бытового видеоустройства, на экране монитора, сохранять отдельные кадры или даже видеопоследовательность на диск – здесь главным образом нужна только соответствующая программная поддержка.

Рис. 57. Структурная схема плат с программным сжатием
Сжатие данных. Необходимость сжатия обуславливается тем, что передача несжатого потока цифровых видеоданных предъявляет более жесткие требования к аппаратной части ПК, такие как объем оперативной памяти для хранения данных, большой объем дискового пространства и высокая скорость передачи данных.
Приведем пример ввода видеоданных c разрешением 720 × 576, частотой кадров 30 кадров/сек., и цветностью 24 бита. Для передачи 1 секунды видео потребуется пропускная способность (в Мбитах/сек. = 106 бит) 720 × 576 × 24 × 30 / 106 = 298,5984 Мбит/сек., т. е. около 37,3 Мбайт/сек., также дополнительная нагрузка ложится при передаче звука.
Современные жесткие диски имеют более высокие показатели скорости считывания/записи, однако для хранения 1 часа (3600 сек.) видео потребуется достаточно большой объем – 37,3 Мбайт/сек. × 3600 сек. = 134280 Мбайт, это около 131 Гбайта.
Все это обусловило использование различных алгоритмов сжатия видеоинформации с различной степенью потери качества.
MJPEG. Одним из первых стандартов сжатия был MJPEG (Motion JPEG), который основывается на отдельном кодировании каждого кадра и объединении полученной последовательности в файл (формат AVI). Компрессия кадров осуществляется по JPEG-алгоритму (Joint Photographers Expert Group), когда каждая картинка разбивается на блоки размером по 88 пикселей и представляется в векторной форме путем дискретного косинусного преобразования и высокочастотной фильтрации полученного спектра. В результате на границах блоков нарушается гладкость изображения, поэтому характерным признаком JPEG является блочная структура. По сути AVI-файл представляет собой последовательность независимых JPEG-рисунков (отсюда и название MJPEG, то есть Motion JPEG). Преимуществами является: покадровое редактирование ролика, настраиваемый уровень сжатия, невысокие вычислительные затраты на кодирование и декодирование. К недостаткам относится невозможность создания AVI-файлов размером более 4 Гбайт из-за ограничений структуры файла. Для преодоления этого ограничения применяются различные ухищрения. Их реализация может существенно различаться, но в конце концов она сводится к созданию нескольких взаимосвязанных файлов.
Стандарт MPEG. Стандарт сжатия MPEG разработан Экспертной группой кинематографии (Moving Picture Experts Group – MPEG). Основным принципом работы алгоритма является устранение временной избыточности, которой в той или иной степени обладает тот или иной видеопоток. Дело в том, что смежные кадры чаще всего содержат одни и те же объекты сцены, что позволяет ограничиться только передачей межкадровых различий.
При тех же скоростях передачи данных MPEG обеспечивает значительно лучшее качество изображения по сравнению с MJPEG. Сначала путем все тех же JPEG-преобразований уменьшается избыточность внутри кадра, а затем алгоритмы MPEG, анализируя происходящие в различных кадрах изменения, осуществляют дальнейшее сжатие, уже практически без потери качества. Избыточность устраняется с помощью метода компенсации движения (motion compesation), то есть основным носителем видеоданных является какой-то один ключевой кадр, а некоторое количество других смежных кадров восстанавливается из него путем применения специального алгоритма.
MPEG определяет три типа кадров: ключевые (Intra frames, I-кадры), зависимые (Predicted frames, P-кадры) и двусторонние (Bi-directional, B-кадры). Ключевые кадры, как уже говорилось, являются основой MPEG-файла. Они записываются с высоким разрешением и обеспечивают произвольный доступ к информации. Каждый зависимый кадр описывается как ссылка на предшествующий ему ключевой и другой зависимый кадр и имеет среднюю степень сжатия. Двусторонние же кадры имеют наибольшую степень сжатия и двунаправленную ориентацию, ссылаясь как на предыдущие, так и на последующие кадры.
Как и MJPEG, MPEG тоже позволяет записывать звуковое сопровождение. Звук также подвергается компрессии, которая устраняет из звукового потока неслышимые или плохо слышимые составляющие аналогично алгоритму MP3. Благодаря таким преобразованиям удается уменьшить размер данных больше чем в 100 раз при не очень значительной потере качества, хотя она и заметна (особенно это касается звука). Недостатком стандарта является его асимметричность, то есть для кодирования нужны значительные объемы сложных вычислений, в то время как восстановление (декодирование) может быть выполнено на сравнительно маломощных аппаратных средствах. Наибольшее распространение алгоритм получил в области бытовой записи фильмов, так как там необходимо обеспечивать большой коэффициент сжатия при приемлемом качестве. MPEG первоначально стал широко применяться в Video CD. MPEG-2 активно используется в спутниковых телевизионных системах и является базовым для DVD-Video. MPEG-4 обладает более высокой степенью сжатия, что позволило использовать его для передачи данных через сеть Интернет и в некоторых спутниковых телевизионных системах.
MPEG-4 состоит из нескольких частей (parts), которые определяют различные спецификации для работы с видео. Наиболее известные: MPEG-4 part 2 (Xvid), MPEG-4 part 10 (x264, H.264). H.264 является базовым для формата записи на безленточные носители видео с высоким разрешением (High Definition).
Другие характеристики видеобластеров. Кроме стандарта сжатия, который используют устройства захвата видеоизображения, есть также еще ряд параметров, влияющих на их качество, возможности и в конечном счете на цену:
1. Представление видеосигнала. Телевизионный низкочастотный аналоговый сигнал является композитным, то есть представляет собой результат сложения яркостного сигнала Y, двух цветовых поднесущих, модулированных цветоразностными сигналами U и V, которые образуют сигнал цветности C (Chronoinance), а также синхроимпульсов. Для обеспечения совместимости цветного и черно-белого телевидения сигналы цветности передаются в полосе частот сигнала яркости. Поэтому необходимо разделение этих сигналов на принимающей стороне с помощью различных фильтров. Эффективное разделение сигналов цветности и яркости возможно с помощью специальных гребенчатых фильтров, однако они весьма сложны и дороги, поэтому обычно применяются только в достаточно дорогой профессиональной или полупрофессиональной аппаратуре.
В бытовых устройствах, рассчитанных на массового пользователя, чаще ограничиваются простыми и дешевыми полосовыми фильтрами, заметно снижающими четкость изображения. В первых видеомагнитофонах и камерах использовались форматы VHS (Video Home System, 1980 год) и Video-8, которые работают только с композитными сигналами, при этом разрешение составляет не более 240–280 твл (телевизионных линий).
Более эффективным оказывается использование не единого композитного сигнала, а двух Y/C, где Y – сигнал яркости с синхроимпульсами, а C – сигнал цветности. Такой сигнал называют S-Video, он применяется в форматах S-VHS и Hi-8. Такую технику обычно относят к полупрофессиональной, она обеспечивает разрешение около 400 твл, что уже несколько лучше, чем традиционный телевизионный эфир.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 |


