На приемной стороне сигнал-параметры управляют двумя синтезаторами линейного типа (см. рис. 14). На вход линии задержки первого синтезатора подается сигнал от источника речевых колебаний, т. е. от генератора ОТ или генератора шума, а на вход линии задержки второго синтезатора подается сигнал с выхода первого синтезатора. Каждый из синтезаторов имеет управляемую частотную характеристику:

Если на вход первого синтезатора подается спектр ![]()
, то спектральная огибающая выходного сигнала будет:
![]()
В результате этой операции происходит «квадрирование» огибающей спектра, получаемая спектральная огибающая становится близкой к исходной как по формантным кривым, так и вследствие устранения ложных формант. Экспериментально доказано, что в данном случае разборчивость лучше по сравнению с линейным вокодером.
3. Корреляционные вокодеры.
Одним из недостатков полосных и частично гармонических вокодеров является интерференция между составляющими спектра и возникновение временных сдвигов между составляющими спектра в полосных вокодерах из-за применения полосовых фильтров в синтезаторах. Одной из попыток избежать влияния эффектов фазовых сдвигов является применение корреляционных методов анализа речевого сигнала и соответствующего синтеза. Этот метод близок к методу гармонических вокодеров с анализом огибающей энергетического спектра речи.
Между функцией корреляции и энергетическим спектром сигнала имеется вполне определенная связь. Это дает возможность по функциям корреляции находить ординаты спектральной огибающей и наоборот. Если известны дискретные отсчеты функции корреляции анализируемого сигнала ![]()
то ординаты огибающей энергетического спектра:

где i – номер ординаты огибающей спектра; ![]()
– разность частот между соседними ординатами. Блок-схема алгоритма определения функции корреляции речевого сигнала изображена на рисунке 15:

Рисунок 15 - Блок-схема алгоритма определения функции корреляции
Отсчеты функции корреляции, взятые с некоторым шагом ![]()
, (a – нормирующий коэффициент), ![]()
, могут рассматриваться как вокодерные сигнал-параметры либо самостоятельно, либо пересчитанными в
ординаты энергетического спектра согласно формуле (5).
Число вычисленных отсчётов автокорреляционной функции должно быть не менее требуемого числа ординат спектра. При синтезе следует иметь в виду, что в данном случае получаются ординаты энергетического спектра, а не спектра амплитуд. Последний может быть получен путем операции, обратной квадрированию (вычисления квадратного корня). Однако эта операция приводит к искажениям речевого сигнала из-за неточности получения огибающей спектра амплитуд речевого сигнала. Можно применять огибающую энергетического спектра в синтезаторе вместо огибающей спектра амплитуд, при этом качество синтезированного сигнала снижается незначительно.
Сигнал на выходе синтезатора имеет вид ![]()
с амплитудой:

где b – постоянная величина.
Применение корреляционного анализатора огибающей в вокодерах дает возможность компрессии представления речевого сигнала примерно в 10 раз, т. е. так же, как и в случае полосных вокодеров. Возможно, что при этом способе может быть несколько повышено качество синтезированной речи. Однако у данного метода есть и недостатки. Одним из них является расширение динамического диапазона сигнал-параметров, т. е. сигналов, поступающих в линию связи, что обусловлено вдвое более широким диапазоном изменения энергетического спектра по отношению к спектру амплитуд. Соответственно суживаются форманты, увеличиваются провалы между ними и т. п. Большинство из этих явлений может быть устранено применением компрессии динамического диапазона (вдвое) до выделения корреляционных функций. На рисунке 15 в анализатор корреляционного вокодера включен блок, обозначенный ![]()
. В корреляционных вокодерах целесообразно применять двойное преобразование типа ![]()
, т. е. «извлекать» корень четвертой степени с квадрированием в синтезаторе.
Одним из перспективных методов сжатия речевого сигнала является метод, во многом сходный с гармоническими и корреляционными, но отличающийся от них тем, что при корреляционном анализе и синтезе в качестве приближающих функций используются полиномы Лагерра. Представляя мгновенное корреляционное преобразование в виде:

Где ![]()
, j — индекс полинома Лагерра, ![]()
имеет смысл конечного интервала разложения. В отличие от корреляционных вокодеров общего вида, такие вокодеры называют Чебышевскими. Выделение параметров огибающей происходит аналогично предыдущему методу, т. е. на каждый из умножителей подаются исходный и задержанный сигналы, а на выходе каждого из каналов сигнал интегрируется с помощью фильтров НЧ. Коэффициенты на выходе анализатора (рис. 16) аналогичны коэффициентам Фурье. Данные коэффициенты представляют энергетический
спектр.

Рисунок 16 – Анализатор
Применение приближений с помощью функций Лагерра улучшает качество вокодеров, поскольку при данном методе масштаб по оси частот более близок к субъективному, являясь функций арктангенса частоты, так как мгновенный коэффициент передачи равен:

Где ![]()
![]()

Рисунок 17 – Синтезатор
В современных условиях ортогональные вокодеры могут быть легко реализованы на цифровой основе путём применения цифровых фильтров.
4. Гомоморфные вокодеры.
Принцип действия гомоморфных вокодеров навеян результатами теории гомоморфных систем. Гомоморфной называется система, инвариантная к свёртке, то есть, для которой выполняется обобщённый принцип суперпозиции по отношению к свёртке. Это означает, что если на вход гомоморфной системы воздействует сигнал ![]()
, являющийся свёрткой двух сигналов ![]()
, то выходом системы является сигнал ![]()
который можно выразить через свёртку двух сигналов ![]()
. Здесь ![]()
выходные сигналы гомоморфной системы, если на её вход воздействуют отдельно ![]()
соответственно. Для гомоморфного оператора Н, описывающего систему выполняется равенство:
![]()
Важным аспектом теории гомоморфных систем является то, что любая из них может быть представлена в виде последовательного соединения трёх систем, как это изображено на рисунке 18:

|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 6 7 8 9 10 11 12 13 |


