Федеральное государственное бюджетное учреждение науки Санкт-Петербургский институт информатики и автоматизации Российской академии наук (СПИИРАН)

РОНЖИН

Андрей Леонидович

Разработка адаптивного метода Робастного понимания слитной речи на основе интегральной обработки данных

Специальность 05.13.18 – Математическое моделирование, численные методы и комплексы программ

Диссертация на соискание ученой степени

Кандидата/Доктора технических наук

Санкт-Петербург

2012

Положения, выносимые на защиту

1.  Разработка модуля интегральной адаптации, осуществляющего взаимосогласованную, оперативную корректировку всех баз данных модели понимания. Разработка метода аллофонной адаптации к голосу и акустической обстановке.

2.  Разработка метода распознавания слитной речи, робастного по отношению к грамматическим отклонениям в произнесенной фразе.

3.  Модификация базовой модели интегрального понимания для возможности ввода слитной речи и интегральной адаптации.

Реализация результатов работы

1.  Разработанные речевые технологии были реализованы в промышленно выпускаемых электронных словарях Language Teacher Partner американской фирмы Ectaco. В частности, раздел коррекции произношения, голосовой перевод с русского языка на английский в модели 586ER.

2.  Совместно с мексиканским университетом UNAM, была создана реальная модель голосового управления роботом через сеть Интернет на основе алгоритмов робастного понимания речи.

3.  По проекту МНТЦ-EOARD Проект № 000P, задача 4 создана модель голосового управления подвижным объектом.

4.  Исследования, отраженные в диссертации, поддержаны грантом СПбНЦ «Разработка методов автоматического перевода устной речи», а также грантом по ФЦП «Интеграция»: Образовательно-исследовательский центр языка и речи, № 000.81.

Основные результаты

1.  Разработан алгоритм интегральной адаптации модели сквозного понимания речи, позволяющий реализовать взаимосвязанную настройку параметров системы на всех уровнях обработки речевого сообщения. Это делает систему гибкой по отношению к изменениям в задаче и условиям функционирования.

2.  Предложен метод аллофонной адаптации к голосу диктора и акустической обстановке, позволяющий учитывать не только спектральные особенности голоса, но и манеру формирования звуков речи (фонем, аллофонов).

3.  Разработан алгоритм распознавания слитной речи, робастный к грамматическим отклонениям, что позволяет обеспечить процессы понимания естественного языка и создавать системы человеко-машинной коммуникации с дружественным интерфейсом.

4.  Модифицирована базовая модель интегрального понимания для того, чтобы обеспечить слитный ввод речи и интегральную адаптацию. В результате создана адаптивная модель робастного понимания слитной речи.