Второй метод использует принципы акустического моделирования голосового тракта человека. Речь составляется из формантных частотных полос, которые создаются полосовыми фильтрами. Суммарный выходной сигнал формантных фильтров достаточно близко соответствует частотному спектру человеческой речи. Но такая речь звучит, как голос робота, разборчивость ее оставляет желать лучшего.

Этот метод универсален: с его помощью можно синтезировать любые слова, иметь неограниченный словарь, так как речь создается из отдельно генерируемых звуков. Синтезатор может быть реализован программным путем.

Наиболее распространенный способ возбуждения синтезатора формантных частот состоит в использовании отдельных, поддающихся идентификации звуков речи, называемых фонемами.

Фонемный синтезатор образует последовательность фонем, которая при воспроизведении на акустическом устройстве вывода звучит как речь.

Фонемный синтез речи практически не требует дополнительной аппаратуры; он может быть реализован на ЭВМ стандартной конфигурации программным путем.

Речь разделяется на отдельные элементарные части - фонемы. Например, в английском языке выделяются такие фонемы для гласных звуков, как ее, i, eh и др. (табл.7.1).

Таблица 7.1

Фонемы гласных звуков английского языка

Фонема

Произношение

F1

F2

F3

ее

feet

250

2300

3000

i

hid

375

2150

2800

eh

head

550

1950

2600

ае

had

700

1800

2550

ah

tot

775

1100

2500

aw

talk

575

900

2450

u

Took

425

1000

2400

00

Tool

275

850

2400

F1, F2, F3 - три основные формантные частоты, наблюдаемые в спектрограмме, При произношении Средним Мужским голосом.

НЕ нашли? Не то? Что вы ищете?

Но кроме гласных в речи человека существуют фрикативные, взрывные и носовые согласные. Кроме того, каждая фонема имеет вариации - аллофоны.

В русском языке согласные фонемы бывают мягкие и твердые, глухие и звонкие (шумные, сонорные, губные, зубные, альвеолярные, велярные).

Третий метод использует словарь, который создается голосом человека, но в память записывается не оцифрованный акустический сигнал, а его частотные параметры, при этом уменьшается объем памяти, занимаемый словарем. Синтез же речи производится интегральными микросхемами, генерирующими заданный набор частот с заданными амплитудами и смешивающими их.

Программное обеспечение для работы со звуковой информацией

Для работы со звуковой информацией необходимо соответствующее программное обеспечение: музыкальные редакторы, “говорящие машины”, речевые и аудиоредакторы.

Музыкальные редакторы служат для:

1. Ввода звукового эффекта в ОП ЭВМ

● с нотного листа (кодирование нотной записи с помощью клавиатуры);

● подбором мелодии по слуху;

● загрузкой мелодии с внешнего носителя (магнитофона, радиоприемника, телевизора).

2. Воспроизведения мелодии при нажатии клавиш ЭВМ (режим клавесина).

3. Автоматической нотной записи вводимой мелодии.

4. Оформления мелодии в виде программы для включения ее в состав презентации или использования для индикации хода вычислительного процесса.

5. Воспроизведения мелодии на акустическом устройстве вывода или на профессиональной аппаратуре, подключенной к ПЭВМ.

6. Для профессиональной обработки введенной мелодии (оркестровка, оранжировка,..), вывода нотной записи.

7. Для машинного синтеза музыки.

8. Для оформления мелодии видеоэффектами на экране ЭВМ (цветомузыка, многоканальная индикация громкости,...).

Простые музыкальные редакторы обеспечивают одноголосое воспроизведение и имеют простое управление, ориентированное на неподготовленного пользователя (MUSMAKER - МГУ, редактор мелодий PIANOMAN,...).

Более сложные редакторы (Scream Tracker, Whacker Tracker,...) ориентированы на пользователей, имеющих представление о принципах создания музыкальных произведений (в том числе многоголосой музыки).

Задача всякого редактора “Для начинающих” обычно состоит в том, чтобы помочь преодолеть страх новичка перед “чистым листом” и быстро перейти к самостоятельному творчеству. Назначение музыкального редактора для домашнего компьютера - помочь человеку “услышать свою внутреннюю музыку” (т. е. свое представление о том, что он хочет получить).

Музыкальные редакторы предоставляют для начала работы блоки, более крупные, чем отдельные ноты.

Музыкальный редактор Scream Tracker (ST) поддерживает собственный формат цифровой музыки и формат *.Mod, предназначенный для программной имитации частотного синтеза с использованием волновых таблиц и алгоритмов.

ST является freeware - продуктом фирмы PSI. Выпущена третья версия (ST3) этого редактора, но дальнейшую работу по совершенствованию и развитию этой программы фирма не ведет. ST реализован под DOC.

В конце 1995 г. московская фирма “Элекай” (разработчик) совместно с фирмой “Русс” (разработчик и издатель) произвели “развлекающий и обучающий” программный продукт, предназначенный для сочинения музыки:

Маэстро+. Он может использоваться как любителями, так и профессионалами на достаточно мощном IBM-совместимом мультимедиа компьютере.

Музыкальный редактор позволяет работать с ним человеку, который не имеет понятия о нотах, а свою “внутреннюю” музыку если и слышит, то довольно смутно.

В Маэстро+ реализованы алгоритмы “искусственного интеллекта”, позволяющие создавать гармоничную, порой неожиданную музыку. Интеллектуальность компьютера помогает “навести” человека на новую музыкальную тему, оформить ее.

Маэстро+ состоит из трех основных модулей, соответствующих уровню музыкальной подготовки пользователя:

● Music Adviser - для начинающих;

● Music Mirror - имеет расширенный набор возможностей и предназначен для “продвинутого” пользователя;

● Mirror Station - для квалифицированных пользователей и профессионалов-музыкантов.

В качестве “строительного материала” музыкальный редактор имеет заготовки около 800 различных инструментов, около 50 готовых мелодий и спецэффектов, не менее 10 сложных авторских композиций.

Объем системы довольно велик, поэтому реализован Маэстро+ на компакт-диске.

Маэстро+ работает в защищенном режиме DOS, обеспечиваемом расширителем памяти фирмы “Элекай”. Требует PC не хуже 486DXL2 66.

Все три модуля музыкального редактора объединяются программой-меню, выполненной в виде компьютерной игры. Документация содержит руководство пользователя, набор уроков для освоения всех трех модулей.

Предполагается, что следующая версия будет работать под Windows, использовать формат “.WAV” (волновой Windows-формат) и укомплектована конвертером MEDI.

Музыкальный редактор “Band-in-a-Box” оперирует понятием “стиль”, под которым понимается некоторый набор готовых музыкальных фрагментов. Создавая свою композицию, пользователь расставляет на каждом канале и для каждого отрезка времени свои параметры: какой фрагмент использовать, каким инструментом, в какой гамме и с какой скоростью его играть. В память машины можно ввести мелодию, наигранную на клавиатуре. Можно играть и во время исполнения компьютером композиции, используя возможности ЭВМ как “электронный аккомпанемент”; при этом программа “подыгрывает” человеку (который является ведущим), пока он активен и импровизирует в паузах.

Говорящие машины и речевые редакторы используются для воспроизведения речи по введенному тексту и настройки ПЭВМ (громкость, тембр, скорость звучания, мужской-женский голос,...).

Обычно говорящие машины загружаются в оперативную память и остаются резидентами. Обращение к ним осуществляется нажатием “горячих клавиш”. При использовании говорящей машины в целях обучения (например, произношению) она может “проговаривать” всю текстовую информацию, возникающую на экране. Но такое использование говорящей машины сильно снижает производительность ЭВМ.

Речевые редакторы позволяют перенастраивать режимы работы говорящей машины, воспроизводить на экране осциллограмму речи, ставить метки на осциллограмме, воспроизводить речь между поставленными метками, вырезать и вставлять речевые фрагменты и так далее.

Аудиоредакторы не специализируются на каком-либо виде звуковой информации. Функции такие же, как у речевых редакторов, без настройки говорящей машины. В состав Windows входят такие аудиоредакторы, как Sound Recorder и Mediapleer.

Глава 8. ВНЕШНИЕ ЗАПОМИНАЮЩИЕ УСТРОЙСТВА (ВЗУ)

ВНЕШНИЕ ЗАПОМИНАЮЩИЕ УСТРОЙСТВА (ВЗУ)

В качестве внешней памяти ПЭВМ используются накопители на магнитных дисках (НМД), накопители на магнитных лентах (НМЛ) - стриммеры и оптические ЗУ.

НМД бывают двух типов: НГМД - на гибком магнитном диске (с носителем-дискетой) и НМД - на жестком магнитном диске (типа “Винчестер”).

НМД имеют значительно больший объем внешней памяти и высокое (почти на порядок) быстродействие, чем НГМД. Но НГМД имеют съемные магнитные носители - дискеты (компактные, на которых легче организовать архивное хранение данных и программ).

НМЛ обычно бывают кассетного типа и используют либо компакт-кассеты для бытовых магнитофонов (емкость 1 кассеты от 500 Кбайт до 1,5 Мбайта), либо видеокассеты (для стриммеров) с многодорожечной записью. Емкость их измеряется в десятках и сотнях мегабайт.

ВЗУ связываются с МП через системную магистраль при помощи устройства управления (контроллера).

Контроллер необходим для двух целей:

● управления ВЗУ;

● связи с МЛ и ОП.

НМД и оптические ЗУ представляют собой устройства с циклическим доступом к информации. НМЛ представляют собой устройства с последовательным доступом.

Время доступа к информации в ВЗУ намного превосходит время обращения к ОН. ВЗУ являются относительно медленными устройствами электромеханического типа.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50