Федеральное государственное бюджетное учреждение науки Санкт-Петербургский институт информатики и автоматизации Российской академии наук (СПИИРАН)
РОНЖИН
Андрей Леонидович
Разработка адаптивного метода Робастного понимания слитной речи на основе интегральной обработки данных
Специальность 05.13.18 – Математическое моделирование, численные методы и комплексы программ
Диссертация на соискание ученой степени
Кандидата/Доктора технических наук
Санкт-Петербург
2012
Положения, выносимые на защиту
1. Разработка модуля интегральной адаптации, осуществляющего взаимосогласованную, оперативную корректировку всех баз данных модели понимания. Разработка метода аллофонной адаптации к голосу и акустической обстановке.
2. Разработка метода распознавания слитной речи, робастного по отношению к грамматическим отклонениям в произнесенной фразе.
3. Модификация базовой модели интегрального понимания для возможности ввода слитной речи и интегральной адаптации.
Реализация результатов работы
1. Разработанные речевые технологии были реализованы в промышленно выпускаемых электронных словарях Language Teacher Partner американской фирмы Ectaco. В частности, раздел коррекции произношения, голосовой перевод с русского языка на английский в модели 586ER.
2. Совместно с мексиканским университетом UNAM, была создана реальная модель голосового управления роботом через сеть Интернет на основе алгоритмов робастного понимания речи.
3. По проекту МНТЦ-EOARD Проект № 000P, задача 4 создана модель голосового управления подвижным объектом.
4. Исследования, отраженные в диссертации, поддержаны грантом СПбНЦ «Разработка методов автоматического перевода устной речи», а также грантом по ФЦП «Интеграция»: Образовательно-исследовательский центр языка и речи, № 000.81.
Основные результаты
1. Разработан алгоритм интегральной адаптации модели сквозного понимания речи, позволяющий реализовать взаимосвязанную настройку параметров системы на всех уровнях обработки речевого сообщения. Это делает систему гибкой по отношению к изменениям в задаче и условиям функционирования.
2. Предложен метод аллофонной адаптации к голосу диктора и акустической обстановке, позволяющий учитывать не только спектральные особенности голоса, но и манеру формирования звуков речи (фонем, аллофонов).
3. Разработан алгоритм распознавания слитной речи, робастный к грамматическим отклонениям, что позволяет обеспечить процессы понимания естественного языка и создавать системы человеко-машинной коммуникации с дружественным интерфейсом.
4. Модифицирована базовая модель интегрального понимания для того, чтобы обеспечить слитный ввод речи и интегральную адаптацию. В результате создана адаптивная модель робастного понимания слитной речи.


