Компания Korg, к сожалению, пока не проявляет особой активности на рынке компьютерного и мультимедиаоборудования. Она лицензировала ряду производителей свою технологию волнового синтеза АI-2, в том числе таким компаниям, как Media Vision и Formosa Industrial Computing, Inc. В продаже появлялось несколько до черних плат типа Wave Blaster, использующих этот синтезатор и 4Мбайт ПЗУ с отличной подборкой GM-инструментов. Но из-за отсутствия рекламы внимание на них обратили только искушенные профессионалы. Информации о новых разработках и компьютерных продуктах пока не поступало.

Ensoniq

Компания Ensoniq еще один производитель профессионального музыкального оборудования, который одним из первых решил попробовать свои силы и на мультимедийном поприще. В 1995 г. звуковые платы семейства Soundscape получили достаточно широкое распространение в мире, их даже использовали некоторые крупные производители компьютеров, например Gateway2000 и Midwest Micro. Но затем появились новые фавориты (Yamaha, Turtle Beach Systems), и популярность этих плат за последний год практически сошла на нет.

Звуковая плата Soundscape Elite использует ту же технологию и специализированные DSP процессоры, что и профессиональные музыкальные инструменты Ensoniq: сэмплеры серии ASR, синтезаторыTS10/12 и эффектпроцессоры семейства DP. Она обладает достаточно хорошим волновым синтезом (на мой взгляд, это лучший 2Мбайт инструментарий из используемых в звуковых платах), имеет мощный эффектпроцессор и вполне приемлемые аудиопараметры. Но Soundscape уже явно не способна претендовать на соответствие современным требованиям: на плате не предусмотрена возможность расширения оперативной памяти для загрузки собственных сэмплов, очень неудобно управление эффектпроцессором и постояние задерживается выпуск свежих драйверов. Довольно плохо реализована поддержка Sound Blaster (только 8 бит, моно и без ADPCM), хотя родной 16битный формат Soundscape теперь присутствует во всех новых играх. Младшая версия Soundscape поставляется без эффектпроцессора, а в остальном мало отличается от Elite.

НЕ нашли? Не то? Что вы ищете?

Наибольшего внимания из этого семейства заслуживает дочерняя плата Soundscape DB, которая при низкой цене (менее100 долл.) предоставляет тот же волновой синтез, что и Elite.

Характеристики звуковой платы Ensoluq Soundscape Elite:

§  Волновой синтезатор OTTO.

§  32голосная полифония, 16 Midi-каналов.

§  Микропроцессор Motorola 68ЕСООО, MPU401 MIDIинтерфейс.

§  487 инструментов, сжатых в 2 Мбайт ПЗУ, в том числе 128 для
General Midi, GS и МТ3


2, 7 комплектов ударных и 61 вариация ударных.

§  ESP (DSP) эффектпроцессор(до трех эффектов одновременно).

§  16-битные аудиоконвертеры, частота дискретизации от 4 до 48 кГц (моно/стерео), отношение сигнал/шум (SNR): 83 дБ.

§  Поддержка следующих алгоритмов сжатия: MS ADPCM, А-law и u-Law.

§  Аппаратная поддержка SoundBlaster и Windows Sound System.

§  Совместима с Microsoft DirectX, обеспечивает режим полного дуплекса под управлением Windows 95.

§  4 CD-ROM интерфейса (IDE ATAPI, Sony, Mitsumi, Panasonic).

§  Драйверы для Windows 3.х,95, NT.

В 1997 г. Ensoniq делает ставку на новую звуковую плату. 50 Soundscape VIVO 90. По замыслу разработчиков, она должна при минимальной цене (около 100 долл.) обеспечить пользователю не только полный спектр мультимедиа функций (в том числе качественный волновой синтез и 16-битный звук), но и добротные аудиопараметры с отношением сигнал/шум на уровень 90 дБ, чего так не хватает в современных «шумных» звуковых платах, совместимых с Sound Blaster. Новая плата поддерживает Plug &Play и DirectX под управлением Windows 95, легко соединяется с модемом, ТВ-тюнером и другими мультимедиа устройствами. При низкой цене это хорошая альтернатива 16-битным FM-платам, особенно если вы собираетесь использовать ее в основном для игр.

Характеристики звуковой платы Ensoniq Soundscape VIVO 90:

§  Волновой синтезатор OTTO.

§  32голосная полифония, 16 Midi-каналов.

§  317 инструментов, сжатых в 1 Мбайт ПЗУ, в том числе 128 для General Mid и МТ32, 7 комплектов ударных и 61 вариация ударных.

§  16-битные аудиоконвертеры, частота дискретизации от 4 до 48 кГц (моно/стерео), отношение сигнал/шум: 90дБ.

§  Поддержка следующих алгоритмов сжатия: MS ADPCM, А-law и u-Law.

§  Аппаратная поддержка SoundBlaster Pro и Windows Sound System.

§  Совместима с Microsoft DitectX, обеспечивает режим полного дуплекса под управлением Windows 95.

§  Драйверы для DOS, Windows3.x.95, NT

Creative Technology Lid.

Есть разные компании. Одни во главу угла ставят техническое совершенство и качество своих продуктов, стараясь за счет новых технологий и лучших продуктов выиграть в конкурентной борьбе.

18 ноября 1996 года на выставке Comdex в Лаc-Вегасе была представлена последняя новинка этой фирмы плата AWE64.Вообще цифры, оказывается, значат многое. В свое время появление SB32 вслед за SB16 вызвало много разговоров о новом поколении «32 битных звуковых плат». Люди привыкли, что 32-битная игровая приставка лучше, чем 16-битная, что 64-битный графический акселератор быстрее 32 битного. Потом стало ясно, что 32 это уже не разрядность, а число Midi голосов, и большинство других звуковых плат тоже имеют 32 голоса, а качество звука определяется совсем другими параметрами (качеством инструментальных библиотек в ПЗУ, аудиохарактеристиками и отношением сигнал/шум). Поэтому появлениe AWE64 закономерно, ведь никто не будет спорить, что 64 лучше, чем 32. Ясно, что вскоре все производители последуют вслед за Creative и появится большое количество 64-голосных звуковых плат. Но давайте по смотрим, что это реально нам даст.

Характеристики звуковой платы Sound Blaster AWE64:

§  Волновой синтезатор E-mu 8000.

§  Технология Sondius WaveGuide.

§  Технология Creative WaveSynth для программного волнового синтеза.

§  Расширение ОЗУ до 28 Мбайт, технология подгрузки инструментов SoundFont.

§  Аппаратная совместимость с Sound Blaster, SB Pro, SBI6, SB32 и AWE32.

§  64голосйая полифония, до 32 Midi-каналов.

§  DSP эффектпроцессор, до трех эффектов одновременно.

§  Технология трехмерного звука (30 Positional Audio).

§  Совместима с Microsoft DirectX, обеспечивает режим полного дуплекса под управлением Windows 95.

Сразу видно, что AWE64 это не новая плата, а скорее несколько доработанный вариант AWE32. За счет модификации синтезатора Е-mu 8000 достигается аппаратно-программная реализация 64 голосов. Но говорить о настоящей 64-голосной полифонии, вероятнее всего, не стоит. Заслуживает внимания технология WaveGuide компании Sondius, которая позволяет на основе физического акустического моделирования придавать инструментам более реальное звучание. Но трудно сказать, насколько она улучшает впечатление от музыки кому-то понравится, а кому-то, возможно, и нет. В остальном перед нами обычный AWE32, или, точнее, Vibra16 с оставшейся практически без изменения 16-битной аудиочастью. Для многих неприятной новостью станет то, что оперативная память на плате теперь наращивается не обычными SIMM, а специальными модулями, которые Creative будет производить самостоятельно. Специальная версия AWE64 Gold является своеобразным «подарочным» вариантом, в комплект которого уже входит 4 Мбайт ОЗУ, цифровой разъем S/PDIF и позолоченные RCA-разъемы.

Дополнительная комплектация Sound Blaster AWE64 Gold:

§  4МбайтОЗУ.

§  Загружаемые GMинструментальные SoundFont банки (объемом2, 3,5 и 4 Мбайт).

§  Цифровой вывод аудио и Midi через S/PDIE

§  Позолоченные RCAразъемы.

§ 


Улучшенные аудиопараметры.

Advanced Gravis

Приятно наблюдать, как справедливость наконец торжествует.
Вот уже четыре года звуковой формат Ultrasound, разработанный компанией Advanced Gravis, пробивает себе дорогу в мире Sound Blaster совместимых плат. Прошедший 1996 г стал решающим в этой борьбе. Альянс Advanced Gravis с AMD позволил интегрировать технологию Ultrasound в новый волновой синтезатор и DSP процессор AMD Interwave. Появившаяся вслед плата Gravis Ultrasound PnP получила широкое распространение и была наконец-то признана официальными кругами (в том числе несколько раз она входила в пятерку призеров по тестам журнала Multimedia World), что окончательно утвердило новый стандарт. GUS PnP, на мой взгляд, является идеальной звуковой платой для мультимедиа и игр. При доступной цене качество ее звучания может поспорить с более дорогими волновыми синтезаторами (YamahaSW60XG, Tropez Plus, ТВ Pinnacle),ну а 16-битный звук с аппаратным микшированием до 32 цифровых каналов в играх и MOD-трекерах просто вне конкуренции. Новые драйверы (версия 2.0) существенно облегчили установку и настройку платы в среде Windows 95, поэтому теперь GUS PnP очень проста и удобна в эксплуатации.

Характеристики звуковой платы Ultrasound PnP:

§  Волновой синтезатор и DSP:AMDlnterwave.

§  Поддержка режима Gfl (Ultrasound) при наличии ОЗУ.

§  32голосная полифония, 16 Midi каналов.

§  Аппаратное микширование до 32 цифровых аудиоканалов.

§  128 GM инструментов, GS-нaбор (1Мбайт ПЗУ).

§  Загружаемый GM инструментальный банк (192 инструмента, объем 5,6 Мбайт).

§  Расширение ОЗУ до 8 Мбайт, динамическая технология подгрузки инструментов.

§  DSP эффектпроцессор (ревербератор, хорус) при наличии ОЗУ.

§  16-битные аудиоконвертеры, частота дискретизации от 4 до 48 кГц (моно/стерео), отношение сигнал/шум: более 80 дБ.

§  Поддержка следующих алгоритмов сжатия: MS ADPCM, А-Law и u-Law.

§  Аппаратная эмуляция Sound Blaster, Ultrasound, Roland Sound Canvas и MT32.

§  Совместима с Microsoft DirectX, обеспечивает режим полного дуплекса под управлением Windows 95.

§  Драйверы для Windows 3.х, 95,Windows NT (планируются), OS/2.

§  Enhanced IDE (ATAPI) интерфейс CD-ROM.

И последняя новость от Advanced Gravis. Выпускается новая звуковая плата Ultrasound Extreme. В ней разработчики учли все пожелания, которые были высказаны пользователями всего мира в конференциях Internet.

Характеристики звуковой платы Ultrasound Extreme:

§  Волновой синтезатор: GF l.

§  FMсинтезатор: ESS AudioDrive.

§  32голосная полифония, 16 Midi каналов.

§  Аппаратное микширование до 32 цифровых аудиоканалов.

§  Загружаемый инструментальный банк General Mid (192 инструмента, объем 5,6 Мбайт)

§  1 Мбайт ОЗУ, динамическая технология подгрузки инструментов.

§  16-битные аудиоконвертеры, частота дискретизации от 4 до 48 кГц (моно/стерео), отношение сигнал/шум: более 80дБ.

§  Поддержка следующих алгоритмов сжатия: MS ADPCM, А-Law и u-Law.

§  Аппаратная поддержка SoundBlaster Pro, Ultrasound, Windows Sound System, Roland Sound Canvas и MT32.

§  Совместима с Microsoft DirectX, обеспечивает режим полного дуплекса под управлением Windows 95.

§  Драйверы для Windows 3.х, 95,Windows NT (планируются), OS/2.

§  Enhanced IDE (ATAPI) CD-RОМ интерфейс.

ТеrrаТес Electronic GmbH

Немецкие компании сейчас очень агрессивно продвигают свою продукцию на ировой рынок. Успех продукции фирмы Mire наглядно продемонстрировал, что европейская технология и качество могут успешно конкурировать с американскими и азиатскими производителями. Представляем новые звуковые платы компании TerraTec, которая в 1997 г. планирует начать их продажу и в России.


SoundSystem Maestro 32/96. Эта звуковая плата по своим параметрам и возможностям во многом похожа на Tropez Plus компании Turtle Beach Systems. Профессиональный волновой синтез с 4 Мбайт GM/GS инструментариеми специализированным эффект процессором MFX, два аппаратных интерфейса MPU401, дополнительный разъем WaveBlaster для подключения второго синтезатора. Тщательно написанное программное обеспечение и драйверы, гарантирующие полный комфорт при установке (Plug &Play) и контроль всех аппаратных функций. Хорошо продумана архитектура и разводка платы, благодаря чему достигнуты очень приличные аудиохарактеристики. Имеются два внешних линейных входа и микрофонный усилитель. К сожалению, на плате не предусмотрена возможность расширения ОЗУ для динамической подгрузки собственных звуков и инструментов.

Характеристики звуковой платы SoundSystem Maestro 32/96:

§  Волновой синтезатор: 32голосная полифония, 16 MIDI каналов.

§  32канальный Fm синтезатор (40P+), использует эффектпроцессор.

§  Два MPU401 MIDI интерфейса.

§  393 инструмента, сжатых в 4Мбайт ПЗУ, в том числе для General id, GS и МТ32, 8 комплектов ударных.

§  MFX DSP эффектпроцессор (до трех эффектов одновременно).

§  16-битные DOCаудиоконвертеры, частота дискретизации от 5 до 48 кГц (моно/стерео), отношение сигнал/шум: более 85 дБ.

§  Поддержка следующих алгоритмов сжатия: MS ADPCM, А-Law и u-Law

§  Аппаратная поддержка SoundBlaster/Pro, Windows Sound System, Roland Sound Canvas (SC55 MKII, Seel/RAP IO/SCD 15).

§  Совместима с Microsoft DirectX, обеспечивает режим полного дуплекса под управлением Windows 95.

§  Драйверы для DOS, Windows.

§  WaveBlaster-разъем.

§  Enhanced IDE (ATAPI) интерфейс CDROM.

AudioSystem EWS64 - Это первая звуковая плата, которая вслед за AWE64 компании CreativeLabs предлагает пользоваголосовую полифонию. Имеется 5Мбайт ОЗУ, расширяемое до 64 Мбайт с помощью обычных 72-контактных SIMMмодулей. Кроме WAV за базовый формат загружаемых сэмплов приняты файлы от AKAI-SI000. Благодаря специальному редактору EWS SoundEdltorих можно будет редактировать с помощью резонансных и LFO фильтров. Поддерживается мультисэмплирование и динамическое кэширование патчей. Мощная архитектура DSP процессора позволяет в режиме реального времени применять различные эффекты к любым аудиоисточникам. Контроль осуществляется программно, предусмотрены разичные алгоритмы, в томчисле холл, хорус, искажение, задержка, многополосный квалайзер(EQ), V Space (расширение стереобазы) и обработка голоса. Из других особенностей хочется отметить аппаратное микширование до 64 аудиоканалов подобно тому, как это реализовано в формате Ultrasound, высококачественные аудиоконвертеры, возможность подключениямодуля цифрового ввода/вывода в формате S/PDIF. Предусмотрена установка нескольких плат EWS64 в один компьютер.

Характеристики звуковой платыAudioSystemEWS64:

§  Волновой синтезатор: 64голосная полифония, до 32 MIDIkaналов.

§  20канальный FMсинтезатор(40P+), использует эффектпроцессор.

§  Два MPU401 Midинтерфейса АДТ.

§  357 инструментов, сжатых в 1 Мбайт ПЗУ, в том числе для General Midi, GS и МТ32, восемь комплектов ударных.

§  5МбайтОЗУ, расширение до 64 Мбайт, технология динамическойподгрузки инструментов и кэширования патчей.

§  Используемые форматы загружаемых сэмплов: AKAI SI000,Microsoft WAV.

§  Поканальный DSP эффект процессор (до трех эффектов одновременно).
Два 16битных аудиоконвертера на запись, частота дискретизацииот 5 до 48 кГц моно/стерео), отношение сигнал/шум: более 85 дБ.

§  Микрофонный стереовход, два аналоговых стереовыхода (18 бит).

§  Enhanced IDE (ATAPI) интерфейс CDROM.

§  Разъем для Wave Blaster.

§  Порт для джойстика, 5-штырьковый DIN MIDI интерфейс.

§  Поддержка следующих алгоритмов сжатия: MS ADPCM, А-law и u-Law CCITT

§  Аппаратная поддержка SoundBlaster Pro и Windows Sound System, Roland Sound Canvas (SC55 MKII, Seel/RAP10/SCD15).

§  Совместима с Microsoft DirectX/DirectSound, обеспечивает режим полного дуплекса под управлением Windows 95.

§  Драйверы для DOS, Windows 3.x, 95.

§  Дополнительный 5 дюймовый модуль для цифрового ввода/вывода звука в формате S/PDIF (один вход и два выхода, до 20 бит).

И в заключении хотелось бы добавить, что качество звука все равно определяется качеством колонок или наушников. Фирма Yamaha производит
активные колонки по собственной технологии Yamaha Active Servo Technology System. Bce колонки снабжены защитой от внешних магнитных полей, что позволяет размещать их где угодно, не опасаясь помех от монитора или других устройств.


Колонки YST-M1O служат для качественного воспроизведения звука в диапазоне от 80 Гц до 20 Кгц. Мощность колонок - 10 Вт.

Колонки YST-MSW1O SubWoofer предназначены, в первую очередь, для воспроизведения низкочастотного, басового звука. Их диапазон частот - от 35 Гц до 10 КГц. Мощность колонки - 25 Вт. Для получения максимально качественного воспроизведения звука любой частоты Yamaha рекомендует применять колонки этих двух типов вместе.

Прилагающийся к колонкам комплект кабелей позволяет, при желании, подключать колонки к бытовой звуковоспроизводящей аппаратуре.

4.6. Эпилог

Как видите, есть, из чего выбирать, а ведь это еще не конец списка... Тенденции развития рынка звуковых карт поистине ошеломляющи. И действительно, чуть ли не каждый день можно найти для себя что-то новое и интересное. В заключение хочу обратить ваше внимание на то, что идеальной звуковой платы на мой взгляд, не существует. Ведь у каждой есть свои преимущества и недостатки.

В своем обзоре я рассмотрел звуковые платы, представляющие интерес не только с точки зрения их использования в играх на РС, но и в профессиональных целях. К примеру такие фирмы, как Turtle Beach Systems и Yamaha Media Technology Division выпускают профессиональное звуковое оборудование для PС представляющее большой интерес для музыкантов, поэтому, если уж кто - нибудь решится всерьез заняться музыкой, то я посоветовал бы остановить свой выбор именно на продукции одной из этих фирм.

ТЕМА 5. ТЕХНОЛОГИЯ СОЗДАНИЯ ПОЗИЦИОНИРУЕМОГО 3D-ЗВУКА.

5.1. Основные сведения

Звуковое сопровождение компьютера всегда находилось несколько на втором плане. Большинство пользователей более охотно потратят деньги на новейший акселератор 3D графики, нежели на новую звуковую карту. Однако за последний год производители звуковых чипов и разработчики технологий 3D звука приложили немало усилий, чтобы убедить пользователей и разработчиков приложений в том, что хороший 3D звук является неотъемлемой частью современного мультимедиа компьютера. Пользователей убедить в пользе 3D звука несколько легче, чем разработчиков приложений. Достаточно расписать пользователю то, как источники звука будет располагаться в пространстве вокруг него, т. е. звук будет окружать слушателя сов всех сторон и динамично изменяться, как многие потянутся за кошельком. С разработчиками игр и приложений сложнее. Их надо убедить потратить время и средства на реализацию качественного звука. А если звуковых интерфейсов несколько, то перед разработчиком игры встает проблема выбора. Сегодня есть два основных звуковых интерфейса, это DirectSound3D от Microsoft и A3D от Aureal. При этом если разработчик приложения предпочтет A3D, то на всем аппаратном обеспечении DS3D будет воспроизводиться 3D позиционируемый звук, причем такой же, как если бы изначально использовался интерфейс DS3D. Само понятие "трехмерный звук" подразумевает, что источники звука располагаются в трехмерном пространстве вокруг слушателя. Это основа. Далее, что бы придать звуковой модели реализм и усилить восприятие звука слушателем, используются различные технологии, обеспечивающие воспроизведение реверберации, отраженных звуков, окклюзии (звук прошедший через препятствие), обструкции (звук не прошел через препятствие), дистанционное моделирование (вводится параметр удаленности источника звука от слушателя) и масса других интересных эффектов. Цель всего этого, создать у пользователя реальность звука и усилить впечатления от видео ряда в игре или приложении. Не секрет, что слух это второстепенное чувство человека, именно поэтому, каждый индивидуальный пользователь воспринимает звук по-своему. Никогда не будет однозначного мнения о звучании той или иной звуковой карты или эффективности той или иной технологии 3D звука. Сколько будет слушателей, столько будет мнений. В данной статье мы попытались собрать и обобщить информацию о принципах создания 3D звука, а также рассказать о текущем состоянии звуковой компьютерной индустрии и о перспективах развития. Мы уделим отдельное внимание необходимым составляющим хорошего восприятия и воспроизведения 3D звука, а также расскажем о некоторых перспективных разработках. Некоторые данные в статье рассчитаны на подготовленного пользователя, однако, никто не мешает пропустить нудные формулы тем, кому это не интересно или давно надоело в институте.

Итак, наверняка почти все слышали, что для позиционирования источников звука в виртуальном 3D пространстве используются HRTF функции. Ну что же, попробуем разобраться в том, что такое HRTF и действительно ли их использование так эффективно.

Сколько раз происходило следующее: команда, отвечающая за звук, только что закончила встраивание 3D звукового интерфейса на базе HRTF в новейшую игру; все комфортно расселись, готовясь услышать "звук окружающий вас со всех сторон" и "свист пуль над вашей головой"; запускается демо версия игры и… и ничего подобного вы просто не слышите!

HRTF (Head Related Transfer Function) это процесс посредством которого наши два уха определяют слышимое местоположение источника звука; наши голова и туловище являются в некоторой степени препятствием, задерживающим и фильтрующим звук, поэтому ухо, скрытое от источника звука головой воспринимает измененные звуковые сигналы, которые при "декодировании" мозгом интерпретируются соответствующим образом для правильного определения местоположения источника звука. Звук, улавливаемый нашим ухом, создает давление на барабанную перепонку. Для определения создаваемого звукового давления необходимо определить характеристику импульса сигнала от источника звука, попадающего на барабанную перепонку, т. е. силу, с которой звуковая волна от источника звука воздействует на барабанную перепонку. Эту зависимость называют Head Related Impulse Response (HRIR), а ее интегральное преобразование по Фурье называется HRTF.

Если вас интересует научное объяснение, то нет проблем, оно будет ниже. Если вас пугают формулы или вы их уже видеть не можете, просто пролистайте пару экранов вниз.

Правильнее характеризовать акустические источники скоростью распространяемых ими звуковых волн V(t), нежели давлением P(t) распространяемой звуковой волны. Теоретически, давление, создаваемой идеальным точечным источником звука бесконечно, но ускорение распространяемой звуковой волны есть конечная величина. Если вы достаточно удалены от источника звука и если вы находитесь в состоянии "free field" (что означает, что в окружающей среде нет ничего кроме, источника звука и среды распространения звуковой волны), тогда давление "free field" (ff) на расстоянии "r" от источника звука определяется по формуле

Pff(t) = Zo V(t - r/c) / r

где Zo это постоянная называемая волновым сопротивлением среды (characteristic impedance of the medium), а "c" это скорость распространения звука в среде. Итак, давление ff пропорционально скорости в начальный период времени (происход "сдвиг" по времени, обусловленный конечной скоростью распространения сигнала. То есть возмущение в этой точке описывается скоростью источника в момент времени отстоящий на r/c - время которое затрачено на то, чтобы сигнал дошел до наблюдателя. В принципе не зная V(t) нельзя утверждать характера изменения скорости при сдвиге, т. е. произойдет замедление или ускорение) и давление уменьшается обратно пропорционально расстоянию от источника звука до пункта наблюдения.

С точки зрения частоты давление звуковой волны можно выразить так:

Pff(f) = Zo V(f) exp(- i 2 pi r/c) / r

где "f" это частота в герцах (Hz), i = sqrt(-1), а V(f) получается в результате применения преобразования Фурье к скорости распространения звуковой волны V(t). Таким образом, задержки при распространении звуковой волны можно охарактеризовать "phase factor", т. е. фазовым коэффициентом exp(- i 2 pi r /c). Или, говоря словами, это означает, что функция преобразования в "free field" Pff(f) просто является результатом произведения масштабирующего коэффициента Zo, фазового коэффициента exp(- i 2 pi r /c) и обратно пропорциональна расстоянию 1/r. Заметим, что возможно более рационально использовать традиционную циклическую частоту, равную 2*pi*f чем просто частоту.

Если поместить в среду распространения звуковых волн человека, тогда звуковое поле вокруг человека искажается за счет дифракции (рассеивания или иначе говоря различие скоростей распространения волн разной длины), отражения и дисперсии (рассредоточения) при контакте человека со звуковыми волнами. Теперь все тот же источник звука будет создавать несколько другое давление звука P(t) на барабанную перепонку в ухе человека. С точки зрения частоты это давление обозначим как P(f). Теперь, P(f), как и Pff(f) также содержит фазовый коэффициент, чтобы учесть задержки при распространении звуковой волны и вновь давление ослабевает обратно пропорционально расстоянию. Для исключения этих концептуально незначимых эффектов HRTF функция H определяется как соотношение P(f) и Pff(f). Итак, строго говоря, H это функция, определяющая коэффициент умножения для значение давления звука, которое будет присутствовать в центре головы слушателя, если нет никаких объектов на пути распространения волны, в давление на барабанную перепонку в ухе слушателя.

Обратным преобразованием Фурье функции H(f) является функция H(t), представляющая собой HRIR (Head-Related Impulse Response). Таким образом, строго говоря, HRIR это коэффициент (он же есть отношение давлений, т. е. безразмерен; это просто удобный способ загнать в одну букву в формуле очень сложный параметр), который определяет воздействие на барабанную перепонку, когда звуковой импульс испускается источником звука, за исключением того, что мы сдвинули временную ось так, что t=0 соответствует времени, когда звуковая волна в "free field" достигнет центра головы слушателя. Также мы масштабировали результаты таким образом, что они не зависят от того, как далеко источник звука расположен от человека, относительно которого производятся все измерения.

Если вы готовы пренебречь этим временным сдвигом и масштабированием расстояния до источника звука, вы можете просто сказать, что HRIR это давление воздействующее на барабанную перепонку, когда источник звука является импульсным.

Напомним, что интегральным преобразованием Фурье функции HRIR является HRTF функция. Если известно значение HRTF для каждого уха, мы можем точно синтезировать бинауральные сигналы от монофонического источника звука (monaural sound source). Соответственно, для разного положения головы относительно источника звука задействуются разные HRTF фильтры. Библиотека HRTF фильтров создается в результате лабораторных измерений, производимых с использованием манекена, носящего название KEMAR (Knowles Electronics Manikin for Auditory Research, т. е. манекен Knowles Electronics для слуховых исследований) или с помощью специального "цифрового уха" (digital ear), разработанного в лаборатории Sensaura, располагаемого на голове манекена. Понятно, что измеряется именно HRIR, а значение HRTF получается путем преобразования Фурье. На голове манекена располагаются микрофоны, закрепленные в его ушах. Звуки воспроизводятся через акустические колонки, расположенные вокруг манекена и происходит запись того, что слышит каждое "ухо".

HRTF представляет собой необычайно сложную функцию с четырьмя переменными: три пространственных координаты и частота. При использовании сферических координат для определения расстояния до источников звука больших, чем один метр, считается, что источники звука находятся в дальнем поле (far field) и значение HRTF уменьшается обратно пропорционально расстоянию. Большинство измерений HRTF производится именно в дальнем поле, что существенным образом упрощает HRTF до функции азимута (azimuth), высоты (elevation) и частоты (frequency), т. е. происходит упрощение, за счет избавления от четвертой переменной. Затем при записи используются полученные значения измерений и в результате, при проигрывании звук (например, оркестра) воспроизводится с таким же пространственным расположением, как и при естественном прослушивании. Техника HRTF используется уже несколько десятков лет для обеспечения высокого качества стерео записей. Лучшие результаты получаются при прослушивании записей одним слушателем в наушниках.

Наушники, конечно, упрощают решение проблемы доставки одного звука к одному уху и другого звука к другому уху. Тем не менее, использование наушников имеет и недостатки. Например:

Многие люди просто не любят использовать наушники. Даже легкие беспроводные наушники могут быть обременительны. Наушники, обеспечивающие наилучшую акустику, могут быть чрезвычайно неудобными при длительном прослушивании.

Наушники могут иметь провалы и пики в своих частотных характеристиках, которые соответствуют характеристикам ушной раковины. Если такого соответствия нет, то восприятие звука, источник которого находится в вертикальной плоскости, может быть ухудшено. Иначе говоря, мы будем слышать преимущественно только звук, источники которого находится в горизонтальной плоскости.

При прослушивании в наушниках, создается ощущение, что источник звука находится очень близко. И действительно, физический источник звука находится очень близко к уху, поэтому необходимая компенсация для избавления от акустических сигналов влияющих на определение местоположения физических источников звука зависит от расположения самих наушников.

Использование акустических колонок позволяет обойти большинство из этих проблем, но при этом не совсем понятно, как можно использовать колонки для воспроизведения бинаурального звука (т. е. звука, предназначенного для прослушивания в наушниках, когда часть сигнала предназначена для одного уха, а другая часть для другого уха). Как только мы подключим вместо наушников колонки, наше правое ухо начнет слышать не только звук, предназначенный для него, но и часть звука, предназначенную для левого уха. Одним из решений такой проблемы является использование техники cross-talk-cancelled stereo или transaural stereo, чаще называемой просто алгоритм crosstalk cancellation (для краткости CC).

Идея CC просто выражается в терминах частот. На схемы выше сигналы S1 и S2 воспроизводятся колонками. Сигнал Y1 достигающий левого уха представляет собой смесь из S1 и "crosstalk" (части) сигнала S2. Чтобы быть более точными, Y1=H11 S1 + H12 S2, где H11 является HRTF между левой колонкой и левым ухом, а H12 это HRTF между правой колонкой и левым ухом. Аналогично Y2=H21 S1 + H22 S2. Если мы решим использовать наушники, то мы явно будем знать искомые сигналы Y1 и Y2 воспринимаемые ушами. Проблема в том, что необходимо правильно определить сигналы S1 и S2, чтобы получить искомый результат. Математически для этого просто надо обратить уравнение:

На практике, обратное преобразование матрицы не является тривиальной задачей.

При очень низкой частоте звука, все функции HRTF одинаковы и поэтому матрица является вырожденной, т. е. матрицей с нулевым детерминантом (это единственная помеха для тривиального обращения любой квадратной матрицы). На западе такие матрицы называют сингулярными. (К счастью, в среде отражающей звук, т. е. где присутствует реверберация, низкочастотная информация не являются важной для определения местоположения источника звука).

Точное решение стремиться к результату с очень длинными импульсными характеристиками. Эта проблема становится все более и более сложной, если в дальнейшем искомый источник звука располагается вне линии между двумя колонками, т. е. так называемый фантомный источник звука.

Результат будет зависеть от того, где находится слушатель по отношению к колонкам. Правильное восприятие звучания достигается только в районе так называемого "sweet spot", предполагаемого месторасположения слушателя при обращении уравнения. Поэтому, то, как мы слышим звук, зависит не только от того, как была сделана запись, но и от того, из какого места между колонками мы слушаем звук.

Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13