Лекция 4: МУЛЬТИМЕДИЙНЫЕ ТЕХНОЛОГИИ
В-1. Формы представления графической информации в компьютере
Компьютер может обрабатывать только числа, поэтому рисунки должны быть представлены в цифровом виде, или, как принято говорить, закодированы.
По способу кодирования информации различаются растровые и векторные рисунки.
Растровые рисунки
Для кодирования рисунок разбивают на небольшие одноцветные части. Все цвета, использованные в изображении, нумеруют, и для каждой части записывают номер ее цвета. Запомнив последовательность расположения частей и номер цвета для каждой части, можно однозначно описать любой рисунок. Однако количество цветов в природе бесконечно, и приходится похожие цвета нумеровать одинаковыми числами. В зависимости от количества используемых цветов, можно закодировать более или менее реалистичное изображение. Понятно, что, чем меньше цветов в рисунке, тем меньше номеров приходится использовать и тем проще закодировать изображение. В самом простом случае используется только черный и белый цвет. Для кодирования черно-белых рисунков достаточно двух цифр, и кодирование монохромных изображений не представляет большой трудности.
Рассмотрим процесс преобразования рисунка в цифровую форму на простом примере (Слайд №_4). Возьмем черный крест на белом фоне, и попробуем представить запись его компьютерного аналога. Вначале приведем предлагаемый рисунок к прямоугольной форме для единообразия. Чтобы выделить прямоугольную рамку, захватывающую весь рисунок представим крест, вписанным в квадрат белого цвета.
Все рисунки в компьютерах имеют прямоугольную форму. Для работы с любым изображением к нему добавляется фон, превращающий рисунок в прямоугольник.
Крест можно разбить на девять равных частей, каждая из которых будет иметь однородный цвет - черный или белый. Обозначим черный цвет единицей, а белый – нулем.

Запишем все получившиеся цифры, начиная с левой части верхнего ряда. Мы получили число . Это и есть компьютерный код нашего рисунка. Однако из этого кода неясно, какого размера должна быть каждая часть рисунка. Поэтому договоримся, что разделим рисунок на небольшие части заданного размера справа. Теперь частей стало значительно больше, и компьютерный код стал длиннее- и так далее. Зато любой компьютер, получив этот код и зная, что каждая цифра означает цвет небольшого элемента изображения заданного размера, легко восстановит рисунок.
Рисунки, закодированные описанным способом, называются растровыми изображениями, растрами или битмапами, от английского слова bitmap - набор бит. Части, на которые разбиваются изображения, называют пикселями (Picture Element - элемент рисунка). Пиксели часто называют точками. Рисунок из множества пикселей можно сравнить с мозаикой. Из большого количества разноцветных камешков собирается произвольная картина (Слайд 5)

Если для представления каждого пикселя в черно-белом рисунке достаточно одного бита, то для работы с цветом этого явно не достаточно. Однако подход при кодировании цветных изображений остается неизменным. Любой рисунок разбивается на пиксели, то есть небольшие части, каждая из которых имеет свой цвет. Например, рисунок (Слайд 5) можно разбить более чем на тысячу частей, или пикселей. Так как в рисунке присутствует больше двух цветов, каждая часть изображения будет представлена в памяти компьютера не одним, а несколькими битами. В зависимости от количества бит, отведенных для кодирования каждого пикселя, в изображении может присутствовать от двух до десятков миллионов цветов.
Объем информации, описывающий цвет пикселя, определяет глубину цвета. Чем больше информации определяет цвет каждой точки в рисунке, тем больше вариантов цвета существует. Понятно, что для рисунков в естественном цвете требуется больший объем памяти. Чтобы представить более шестнадцати миллионов цветов, информация о каждой точке рисунка должна занимать четыре байта, что в тридцать два раза больше, чем для монохромного рисунка. Пока говорилось, что пиксель - маленькая часть рисунка. А каков размер пикселя? Не определив размер пикселя, невозможно построить изображение на основе закодированных данных. Если же мы зададим размер, то без проблем восстановим закодированный рисунок.
Однако на практике не используют размер пикселей, а задают две другие величины: размер рисунка и его разрешение. Размер описывает физические габариты изображения, то есть его высоту и ширину. Можно задать размеры в метрах, миллиметрах, дюймах или любых других величинах. Но в компьютере чаще всего размер задается в пикселях. Например, размер рисунка фотоаппарата с папкой (Слайд 5) равен 45 на 40 пикселей. При отображении на мониторе и печати на принтере каждый пиксель представляется отдельной точкой, если оборудование не делает специальных преобразований. На старых мониторах, с крупным зерном кинескопа, рисунок получится большим, а на современном принтере, в котором используются мельчайшие точки, рисунок получится очень маленьким. А каким он должен быть на самом деле? Для этого задается разрешение изображения. Разрешение - это плотность размещения пикселей, формирующих изображение, то есть количество пикселей на заданном отрезке. Чаще всего разрешение измеряется в количестве точек на дюйм - dpi (Dot Per Inch). Например, если мы укажем, что наш рисунок компьютера имеет разрешение 72 dpi, это означает, что на каждом дюйме может разместиться семьдесят два пикселя. Таким образом, ширина и высота рисунка будут равны немногим больше половины дюйма, или около четырнадцати миллиметров. При отображении рисунков на мониторе, используют разрешение от 72 dpi до 120 dpi. При печати самым распространенным разрешением является 300 dpi, но для получения высококачественных отпечатков на можно использовать и большее разрешение.
Разбив рисунок на пиксели, описав цвет каждого пикселя и задав разрешение, мы полностью закодируем любой рисунок. Имея эту информацию, любая компьютерная программа сможет восстановить исходное изображение. Теперь, когда Вы познакомились с принципами представления рисунков на компьютере, можно разобраться, почему только современные персональные компьютеры способны работать с качественной графикой.
Как уже отмечалось, чтобы получить в рисунке естественные цвета, следует использовать для кодирования каждого цвета четыре байта. Современные цветные принтеры печатают изображения с разрешением 2880 dpi. Для представления с таким разрешением и глубиной цвета рисунка, размером А4 обычный лист бумаги, потребуется около трех гигабайт. Даже для современных компьютеров это слишком много. Но рисунки размерами по 50 Мб обрабатываются без особенных затруднений. Фотография размером четыре на шесть дюймов и глубиной цвета 24 бита может занять 395 Кб, если используется разрешение 75dpi, или и более 35 Мб, при использовании разрешения 720 dpi.
Понятно, что при большем разрешении один и тот же рисунок разбивается на большее количество точек, что существенно улучшает его качество, однако работать с большими файлами становится довольно трудно.
Растровые изображения достаточно широко используются в вычислительной технике. Фотографии и рисунки, введенные в компьютер, хранятся именно в виде растровых изображений. Большинство рисунков во всемирной компьютерной сети Интернет представляют собой растровые файлы. Имеется множество программ, предназначенных для работы с растровыми рисунками. Зная способ кодирования изображения, программа для работы с графикой может воспроизвести его на экране монитора или распечатать на принтере. С помощью специальных программ - графических редакторов - вы можете отредактировать изображение.
Растровые изображения обладают одним очень существенным недостатком: их трудно увеличивать или уменьшать, то есть масштабировать. При уменьшении растрового изображения несколько соседних точек преобразуются в одну, поэтому теряется разборчивость мелких деталей изображения. При увеличении растрового изображения увеличивается размер каждой точки, поэтому появляется эффект, при котором на контрастных краях изображения появляется заметная ступенька (Слайд 6).

Такой эффект называется ступенчатым и ухудшает качество изображения. Кроме того, растровые изображения занимают много места в памяти и на диске. Чтобы избежать указанных проблем, изобрели, так называемый, векторный способ кодирования изображений.
Векторные рисунки
В векторном способе кодирования геометрические фигуры, кривые и прямые линии, составляющие рисунок, хранятся в памяти компьютера в виде математических формул и геометрических абстракций, таких как круг, квадрат, эллипс и подобных фигур. Например, чтобы закодировать круг, не надо разбивать его на отдельные пиксели, а следует запомнить его радиус, координаты центра и цвет. Для прямоугольника достаточно знать размер сторон, место, где он находится, и цвет закраски. С помощью математических формул можно описать самые разные фигуры. Чтобы нарисовать более сложный рисунок, применяют несколько простых фигур. В сложных рисунках может быть несколько тысяч простых фигур.

Например, взяв прямоугольник с закругленными краями и закрасив его в черный цвет, добавив три белых прямоугольника и еще один черный, также с закругленными краями, мы можем получить рисунок трехдюймовой дискеты (Слайд 7).
Любое изображение в векторном формате состоит из множества составляющих частей, которые можно редактировать независимо друг от друга. Эти части называются объектами. Так как с помощью комбинации нескольких объектов можно создавать новый объект, объекты могут иметь достаточно сложный вид
Размеры, кривизна и местоположение для каждого объекта хранятся в виде числовых коэффициентов. Благодаря этому появляется возможность масштабировать изображения с помощью простых математических операций, в частности простым умножением параметров графических элементов на коэффициент масштабирования. При этом качество изображения остается без изменений (Слайд 8). Используя векторную графику, можно не задумываться о том, готовите ли вы миниатюрную эмблему или рисуете двухметровый транспарант.

Вы работаете над рисунком совершенно одинаково в обоих случаях. В любой момент вы можете преобразовать изображение в любой размер без потерь качества. Важным преимуществом векторного способа кодирования изображений является то, что размеры графических файлов векторной графики имеют значительно меньший размер, чем файлы растровой графики. Однако есть и недостатки работы с векторной графикой. Прежде всего, некоторая условность получаемых изображений. Так как все рисунки состоят из кривых, описанных формулами, трудно получить реалистичное изображение. Для этого понадобилось бы слишком много элементов, поэтому рисунки векторной графики не могут использоваться для кодирования фотографий. Если попытаться описать фотографию, размер полученного файла окажется больше, чем соответствующего файла растровой графики.
Большинство простых графических программ работает с растровой графикой. Для работы с векторной графикой используются мощные специальные графические редакторы, с которыми работают профессионалы. Однако в последнее время многие графические редакторы позволяют работать как с растровой, так и с векторной графикой.
Работа с цветом
Цвет играет большую роль при отображении графических данных, поэтому каждый дизайнер должен знать, как генерируются цвета на компьютере и какие ограничения возникают при использовании цвета втом числе и на Web-страницах. Определим понятия субтрактивной цветовой модели, аддитивной
Субтрактивная модель
В реальном мире цветовые эффекты возможны благодаря наличию пигмента. Пигмент — это вещество, реагирующее на свет. При отсутствии света отсутствует и цвет. Без пигмента невозможно изменять цвет.
Субтрактивная модель описывает формирование цветов в реальном мире. Модель называется субтрактивной потому, что при прохождении света через вещество или при отражении от него некоторые цвета поглощаются. Поглощение происходит за счет наличия пигмента в красках, чернилах и многих других веществах.
В субтрактивной модели определены три основных цвета: красный, желтый и синий. Все остальные цвета формируются на базе трех основных цветов. Дополняющими называются цвета, при смешивании которых получается серый цвет. Такими цветами являются красный и зеленый. Дополняющие цвета располагаются на противоположных частях цветового круга. Цветовой круг — это круговая диаграмма, описывающая основные и дополняющие цвета.
Аддитивная модель
Цвета на экранах мониторов и других устройств отличаются от цветов, присутствующих в реальном мире. Возможности монитора по отображению цвета ограничены. Монитор компьютера не поглощает свет, а излучает его. Принцип формирования цвета на экране компьютерного терминала описывается моделью аддитивного синтеза.
При аддитивном синтезе цвет создается путем проецирования на экран лучей различного цвета и различной интенсивности. Для формирования цветов в компьютере используются три основных цвета: красный, зеленый и синий. Чтобы понять принцип формирования цвета, представьте себе, что на экран направлены три лазерных луча различного цвета. В результате их смешивания формируется новый цвет.
Модель, в которой используются красный (Red), зеленый (Green) и синий (Blue) цвета, называется RGB-моделью. Почему основные цвета транзитивной модели отличаются от основных цветов аддитивной модели? Дело в том, что в транзитивной модели свет поглощается, а в аддитивной модели — генерируется. Если в реальном мире вы смешается красный и зеленый цвета, то получите коричневый цвет. На экране компьютера при смешивании тех же цветов получается желтый цвет.
Отображение цвета на экране компьютера
В воспроизведении цвета участвуют следующие компоненты компьютера:
- центральный процессор;
- графическая видеокарта;
- монитор.
Качество отображения цвета зависит от характеристик этих компонентов. Если возможности хотя бы одного из них оказываются недостаточными, требуемый цвет может быть воспроизведен лишь приближенно.
Различные аппаратные платформы и операционные системы предоставляют разные возможности по отображению цвета. Высококачественное представление цветов обеспечивают операционная система Macintosh и все версии Windows, созданные после Windows 3.1. Способность к воспроизведению цвета стандартной машины UNIX несколько ниже. Как перспективным дизайнерам Вам необходимо понимать природу ограничений, действующих при отображении цвета. Чтобы разобраться в этом вопросе, рекомендуется проанализировать возможности своего компьютера.
Цветовое пространство
Если вы уже работали с Photoshop или другими графическими программами, вам, наверное, знакомы методы управления графикой, базирующиеся на понятии цветового пространства. Один из способов представления цветового пространства, условно показанный на слайде 9, называется CMYK (Cyan, Magenta, Yellow, Black). Cyan - голубой, Magenta - пурпурный, Yellow - желтый, black - черный. Строго говоря, Magenta не является пурпурным цветом. Точное название этого цвета - фуксин, но в компьютерной литературе и в программах принято называть этот цвет пурпурным. В разновидности этой модели, называемой CMY, отсутствует черный цвет, но она применяется значительно реже. Пространство CMYK используется при выводе на принтер.
Кроме того, при работе с графикой используются следующие системы представления цвета:
Черно-белые изображения. Поддерживаются белый, черный и оттенки серого цвета.
Индексированные цвета. Поддерживается ограниченная палитра цветов, определенных разработчиком.
RGB. Используется при формировании изображений на экране монитора.

Как было сказано ранее, при отображении графики на экране используется процесс аддитивного синтеза. Каждый цвет создается путем смешивания красного, зеленого и синего света в различных пропорциях. Чтобы получить белый цвет, надо смешать свет максимальной интенсивности (255) от красного, зеленого и синего источников.
R=255
G-255
В=255
Этот набор значений также записывается следующим образом:
RGB=255,255,255.
Для генерации черного цвета интенсивность каждого из источников должна быть минимальной, т. е. равна 0.
R=0
G=0
В=0
или
RGB=0,0,0.
Шестнадцатеричное представление цвета
Для того чтобы эффективно работать с цветом на HTML-страницах, вам надо представить RGB-значения в шестнадцатеричном виде.
В шестнадцатеричной системе используются 16 цифр, которые представляются символами от 0 до 9 и от А до F. В HTML цвет кодируется шестью шестнадцатеричными цифрами. Первые две из шести цифр задают интенсивность красного цвета, вторые две — интенсивность зеленого цвета и последние две — соответствуют синему цвету. Значение 00 означает отсутствие света, а значение FF соответствует наибольшей его интенсивности. Например, чистый красный цвет представляется шестнадцатеричным значением #FF0000; это означает, что интенсивность красного цвета максимальна, а зеленый и синий цвета вовсе отсутствуют. Соответственно белый цвет представляется значением #FFFFFF, а черный — #000000. Шестнадцатеричное представление цвета всегда начинается с символа "#".
На слайде 10 показано окно программы-конвертера, представляющей значения RGB в десятичном и шестнадцатеричном виде. Код этой программы находится на компакт-диске.

Web-ориентированная палитра
Web-ориентированная палитра состоит из 216 цветов, которые корректно отображаются различными броузерами, выполняющимися на разных платформах и работающих с различными мониторами. Если вы будете использовать цвета за пределами данной палитры, могут возникать проблемы с отображением цветов некоторыми броузерами.
Предположим, что в качестве цвета фона вы выберете светло-голубой, а текст отображаете темно-синим цветом. На высокоуровневой платформе, использующей 24-битовое представление цвета и поддерживающей более 16 миллионов цветов, текст будет существенно отличаться от фона. На низкоуровневой машине с ограниченными возможностями для представления цвета светло-голубой и темно-синий будут заменены доступными оттенками синего цвета и не исключено, что текст будет сливаться с фоном.
Во многих системах используются специальные методы имитации полутонов, которые, однако, искажают изображение. Чтобы избежать имитации полутонов, следует выбирать цвета из Web-ориентированной палитры. Несмотря на то, что в ней присутствуют лишь 216 цветов, с их помощью можно создавать изображения достаточно высокого качества.
В-2. Основы обработки аудиоинформации в ПЭВМ
Так как компьютер работает с числами, звуки и музыка должны быть представлены в цифровом виде, или, как принято говорить, закодированы. Произвольная аудиоинформация при кодировании занимает много места, потому часто используют сжатые аудиоформаты. Музыка занимает меньше места, так как хорошо формализуется - ее можно записать с помощью нот.
Представление звука
Звук представляет собой волну, распространяющуюся в атмосфере, и воспринимаемую человеком с помощью органов слуха. Громкость звука - это его кажущаяся сила. Измеряется громкость в децибелах (дБ). Громкость обычного разговора около 50 дБ, шум на улице часто превышает 70 дБ, а громкость взлетающего самолета составляет 120 дБ. Порог чувствительности человеческого уха около 20 дБ.
Характеризуется звуковая волна изменением во времени частоты и амплитуды сигнала. Графически звуковая волна описывается кривой, задающей зависимость амплитуды от времени (Слайд №4).

Слайд №4 – Звуковые волны
Частота основных колебаний определяет высоту звука. Но звуки одной частоты могут иметь разный тембр.
Чтобы закодировать звук (Слайд №5, верхняя часть), необходимо измерять амплитуду сигнала через определенные промежутки времени. На каждом временном отрезке определяется средняя амплитуда сигнала. Графически такое преобразование описывается множеством столбиков (Слайд №5, в центре).



Слайд №5 – Кодирование звука
При восстановлении исходной кривой ее вид будет искажен (Слайд №5, справа). Искажения тем больше, чем больше ширина столбиков, то есть чем реже мы определяем текущую амплитуду. Чем промежутки времени меньше, тем выше будет качество закодированного звука. Частота, с которой определяется амплитуда сигнала, называется частотой дискретизации.
Амплитуда сигнала, определенная в каждый момент времени, также должна быть представлена в числовом виде. В простейшем случае можно использовать один бит - есть звук или его нет. Но на практике такое кодирование не имеет смысла. Минимально для кодирования амплитуды отводятся восемь бит - один байт, что позволяет описать двести пятьдесят шесть уровней громкости. Качество звука при этом получается не слишком высокое. Если и частота дискретизации невелика, то при воспроизведении будут присутствовать сильные искажения. Значительно лучшее качество получается при использовании двух байт, что позволяет задать более шестидесяти пяти тысяч разных значений амплитуды. В большинстве случаев двух байт достаточно для получения высококачественной записи звука, хотя в последнее время иногда применяют 24 бита - три байта для кодирования амплитуды сигнала.
А какую частоту дискретизации следует использовать? Научные исследования показали, что для кодирования звуков следует использовать частоту вдвое большую, чем частота кодируемого звука. Так как человек воспринимает звуки в диапазоне частот от 01.01.010 Гц, то для качественного кодирования необходимо использовать частоту вдвое большую, чем 20000, то есть 40000 Гц. Принято иметь некоторый запас, поэтому для качественного кодирования звука используется частота дискретизации 44100 Гц, а в последнее время и 48000 Гц.
Если мы хотим записать стереозвук, то следует одновременно кодировать два независимых канала звука. При этом, чтобы получить хорошее качество, нужно использовать два байта для кодирования и частоту дискретизации 44100 Гц для каждого из каналов. Именно так кодируется звук на компакт-дисках. При этом одна минута закодированного звука займет более 10 Мб.
Для повышения качества кодирования используют более высокие частоты дискретизации, до 96000 Гц, однако такое качество требуется исключительно при работе в профессиональных звукозаписывающих студиях, а для любителей вполне хватит качества компакт-дисков.
В некоторых случаях можно обойтись более низким качеством, сравнимым с качеством записи диктофона. Если вы хотите закодировать голос, не предъявляя повышенных требований к качеству звучания, можно использовать один байт при кодировании и один монофонический канал. Частоту дискретизации также можно понизить. Чтобы разбирать отдельные слова и понимать их смысл, достаточно частоты дискретизации 8000 Гц. С такими параметрами минута закодированного звука займет менее 480 Кб, что тоже не так уж и мало.
Музыка в компьютере
Современные компьютеры часто используются при создании и воспроизведении музыки. Можно музыкальное произведение закодировать, как любой другой звук, но это займет очень много места. Кроме того, возникнут трудности при изменении партий отдельных инструментов. Проще указать инструмент и задать, какую ноту и как долго он должен играть. Например, указано, что одну секунду на фортепиано играется нота «До». Для воспроизведения музыки компьютер синтезирует разнообразные звуки, которые издают музыкальные инструменты.
В компьютерной музыке повсеместно используется аббревиатура MIDI, которая расшифровывается как Musical Instrument Digital Interface (Цифровой интерфейс музыкальных инструментов). Имеется стандарт, описывающий основные используемые инструменты. Он называется GM (General MIDI - единый MIDI). В стандарте описаны пятнадцать групп мелодических инструментов и одна группа ударных инструментов. Мелодический набор состоит из пианино, органов, гитар, струнных, духовых и тому подобных инструментов. За всеми инструментами закреплены номера, например, нулевой номер имеет акустический рояль. Кроме GM, в последнее время используются новые стандарты, описывающие больше инструментов и задающие дополнительные параметры озвучивания. Наиболее часто используются стандарты GS (General Synth - единый синтез), XG (Extended General - единый расширенный) и GM2 (General MIDI 2). Все эти стандарты не заменяют собой GM, а лишь дополняют его новыми инструментами и эффектами. Несмотря на то, что инструменты и тембры ;тандартизованы в GM, a MIDI-файл содержит только номера инструментов и тембров, этот файл по-разному будет воспроизводиться на разных звуковых картах. Это объясняется несколькими причинами. В стандарте описаны только названия инструментов и тембров. Такие параметры звука, как громкость, окраска и другие не определены и выбираются производителями звуковых карт произвольно.
Кроме того, на качество воспроизведения звука сильно сказывается метод, которым этот звук воспроизводится. Основная сложность заключается в том, чтобы компьютер наиболее реалистично воспроизвел описанную ноту, с учетом особенностей звучания выбранного инструмента. Применяют два основных метода синтеза звуков.
Более простой метод называется частотным синтезом (FM-синтез). Для каждой ноты каждого инструмента определена частота и амплитуда звука, и звуковая плата компьютера синтезирует звук. Метод достаточно прост в реализации и позволяет сгенерировать звучание самого необычного инструмента. Однако при этом синтезированные звуки получаются не слишком похожими на звучание реальных инструментов. В современных звуковых платах частотный синтез не используется.
Значительно лучше использовать волновую таблицу (Wave Table). В таблице записаны закодированные звуки реальных инструментов. При этом используется метод кодирования, описанный выше, то есть кодирование амплитуды звукового сигнала через короткие промежутки времени. Например, если требуется воспроизвести удар по тарелке, звуковая плата проигрывает небольшой фрагмент, записанный в определенном месте таблицы. Фрагменты называют сэмплами (samples). Инструменты с малой длительностью звучания обычно записываются полностью, а для остальных может записываться лишь начало, конец звука и небольшая средняя часть, которая затем проигрывается в цикле в течение нужного времени. Такое кодирование обеспечивает предельную реалистичность звучания классических инструментов и простоту получения звука. Однако волновые таблицы могут занимать много места в памяти. До недавнего времени дороговизна памяти ограничивала применение такого способа воспроизведения музыки, однако в последнее время память подешевела, и волновые таблицы используются в большинстве современных звуковых плат. Так как музыка, представленная в цифровом виде, не требует преобразований, к компьютеру можно напрямую подключить цифровые синтезаторы. Наигрывая мелодию на синтезаторе, вы вводите в компьютер последовательность нот. Также синтезаторы позволяют проигрывать композиции, созданные на компьютере. Загрузив в синтезатор сэмплы из волновой таблицы, вы сможете извлекать самые необычные звуки при нажатии клавиш. Большинство синтезаторов имеют богатые возможности настройки.
В последнее время стало модным караоке, и в компьютере стали кодировать музыку вместе с текстом. Фактически караоке является вариантом MIDI. Музыка закодирована обычным способом, но дополнительно добавлен текст, заменивший описание одного из инструментов.
Сжатие аудиоданных
Хотя частота дискретизации при кодировании звукового сигнала по компьютерным меркам не очень велика, объем получающихся цифровых данных достаточно большой. Так, одна минута записи при кодировании информации с музыкального компакт-диска будет занимать около 10 Мб. Чтобы уменьшить объем, занимаемый цифровыми аудиоданными, применяют различные методы сжатия информации, в частности алгоритмы MPEG. Например, применение сжатия по алгоритму MPEG-1 Layer 3, чаще называемого МРЗ, позволяет уменьшить объем данных более чем в десять раз, при сохранении качества звука, близкого к audio-CD. В последнее время популярным становится формат WMA (Windows Media Audio), поддерживаемый последними версиями операционных систем Windows и современными переносными устройствами. Развитием стандарта МРЗ является МРЗРго, но он пока недостаточно распространен.
В обоих стандартах используется метод сжатия по психоакустической модели, то есть из исходного звукового сигнала удаляется информация, малозаметная на слух, после чего сигнал сжимается обычными методами, которые реализованы в программах - архиваторах. При таком методе кодирования неизбежно искажение исходного сигнала, а значит - потеря качества. Степень потери качества можно регулировать, однако при увеличении качества неизбежно вырастет объем информации. Основной характеристикой, характеризующей качество записи, является скорость потока данных, поступающих для декодирования. Часто этот параметр называется битрейтом (bitrate - частота битов).
Битрейт изменяется в килобитах в секунду и может составлять до 320 Кбит/с. В большинстве случаев вполне хватает более низких битрейтов, 192 или даже 128. Битрейт ниже 48 Кбит/с существенно ухудшит качество и его не следует применять для записи музыки. Для записи речи можно использовать меньший битрейт. Качество диктофона можно получить при битрейте, равном 8 Кбит/с. Искажения при кодировании в форматах МРЗ и WMA во многом зависят от характера музыкального материала. Симфоническая музыка требует большего битрейта, а танцевальная - меньшего. Наиболее популярным битрейтом при кодировании музыкальных композиций считается 128 Кбит/с, дающий хорошее качество записи и позволяющий сжимать исходную запись более чем в десять раз.
Несмотря на то, что формат МРЗ не единственный из форматов сжатия звука, именно его чаще всего используют на практике. Это объясняется тем, что данный формат имеет целый ряд преимуществ. Формат МРЗ является свободно распространяемым и кодирование информации не требует лицензирования. Кроме того, написано большое количество удобных программ для работы с музыкой в этом формате.
В-3 Основы технологии работы с видеоинформацией
Все существующие методы отображения движущихся изображений, записанных на пленке или в каком-либо цифровом запоминающем устройстве, базируются на инертности зрительного восприятия – задержке реакции глаза на зрительный раздражитель, из-за которой возникают остаточные изображения. Благодаря инертности зрительного восприятия последовательность неподвижных изображений, демонстрируемая глазу с достаточно высокой скоростью (выше той, которая называется частотой слияния мельканий), воспринимается, как непрерывный зрительный образ, а не как отдельные изображения. Если последовательные изображения отличаются незначительно, любое плавное изменение будет восприниматься, как движение элементов изображения. Частота слияния мельканий зависит от яркости изображения относительно среды наблюдения, но в среднем она составляет порядка 40 изображений в секунду. Ниже этой частоты будет ощущаться эффект мерцания, который станет заметнее при уменьшении частоты, пока, наконец, ощущение движения будет полностью утрачено и мы будем воспринимать последовательность неподвижных изображений.
Существует два способа генерации движущихся изображений в цифровой форме для мультимедийной продукции. Во-первых, с помощью видеокамеры можно записать последовательность кадров реального движения в реальном мире. Во-вторых, можно создать все кадры по отдельности либо с помощью компьютера, либо записывая по одному неподвижные изображения. В первом случае мы будем использовать слово видео, а во втором — анимация. Поскольку и видео, и анимация являются разновидностью движущихся изображений, они имеют некоторые общие свойства, хотя и отличаются с технической точки зрения. Для лент с природным движением необходимо как записывать изображения достаточно быстро, чтобы получить убедительное представление движения в реальном времени, так и взаимодействовать с оборудованием, которое удовлетворяет требованиям и стандартам, определенным для широковещательного телевидения (хотя при воспроизведении видео на компьютере эти требования и стандарты, в основном, несущественны). Ситуация усложняется еще и тем, что в различных странах используются различные стандарты.
Как будет показано ниже, видео существенно ограничивает возможности обработки, хранения и передачи данных компьютерных систем. Также оно должно соответствовать ожиданиям потребителей, которые обычно формируются широковещательным телевидением. Пожалуй, видео – это та часть мультимедийного производства, которая в настоящее время сильнее всего меняется технически. Обычно видео, предназначенное для воспроизведения на бытовом оборудовании, воспроизводится при сниженных частотах смены кадров, возможно, с заметной дрожью из-за пропущенных кадров, в окнах, гораздо меньших минимального экрана домашнего телевизора; при этом часто проявляются видимые артефакты сжатия. Чтобы преодолеть такие ограничения на компьютерах с низкой производительностью, нужно искать компромиссы за счет качества изображения. Таким образом, видео нужно благоразумно использовать в мультимедийной продукции, предназначенной для маломощных платформ. Пользователей, которые применяют широковещательное цифровое телевидение, не впечатлит то, что пренебрежительно (хотя и справедливо) описывается как "танцующие почтовые марки". Следовательно, хорошая видеопродукция для широкой аудитории требует тщательного выбора материала и режима представления, не акцентирующего внимания на ее дефектах.
Современные фильмы демонстрируются со скоростью 24 кадра в секунду, но кинопроекторы оборудованы устройством (обтюратором), которое прерывает демонстрацию, реально отображая каждый кадр дважды, так что скорость демонстрации кинофильма в действительности составляет 48 кадров в секунду. В странах, в которых для теле - и видеотрансляции используется система NTSC, кадры отображаются 30 раз в секунду, но скорость обновления изображения реально удваивается, поскольку каждый кадр разбивается на две чересстрочные половины (поля или полукадры), которые отображаются попеременно (см. ниже). Системы PAL и SECAM работают аналогично с частотой 50 полукадров (25 кадров) в секунду. Когда изображения выводятся на компьютерный монитор, можно выбирать частоту их отображения. При относительно высокой частоте обновления изображение не мерцает, поэтому в цифровых дисплеях не нужны чересстрочные полукадры. Однако изображения должны выводиться достаточно быстро, чтобы создавалась иллюзия движения. Минимальной достаточной частотой является частота 12-15 кадров в секунду, хотя предпочтительны все же более высокие частоты.
Чтобы хранить и обрабатывать видео на компьютере, необходимо закодировать его особым образом. Это сделать довольно сложно, так как объем информации, передаваемой в единицу времени, очень велик. Компьютерное видео появилось значительно позднее компьютерного звука.
Видеоинформация в компьютере
Кодирование звукового сопровождения видео ничем не отличается от кодирования звука, изученного нами в предыдущей теме. Изображение в видео состоит из отдельных кадров, которые меняются с определенной частотой. Кадр кодируется как обычное растровое изображение, то есть разбивается на множество пикселей. Закодировав отдельные кадры и собрав их вместе, мы сможем описать все видео.


