Отзыв о магистерской диссертации «Cнятие омонимии вида наречие/существительное и предлог/существительное при автоматическом переводе русскоязычных текстов»

Партнерка на США и Канаду по недвижимости, выплаты в крипто

30% recurring commission
Выплаты в USDT
Вывод каждую неделю
Комиссия до 5 лет за каждого referral

Отзыв о магистерской диссертации

«Cнятие омонимии вида наречие/существительное и предлог/существительное при автоматическом переводе русскоязычных текстов»

студентки кафедры математической лингвистики

филологического факультета СПбГУ

Колотиловой Янины Леонидовны

В круге задач, связанных с автоматическим (автоматизированным) переводом текстов с одного языка на другой, особое место занимает проблема различного рода омонимии – как морфологической, так и синтаксической. С точки зрения системы машинного перевода омонимия, т. е. графическое совпадение различных языковых единиц, проявляется на всех уровнях анализа текста – на уровне морфем, форм слов, слов, словосочетаний и предложений. В данный момент не существует общего способа разрешения неоднозначностей данного вида, в связи с чем является целесообразным разработка системы правил снятия омонимии, для каждого языка своих.

Автором работы был реализован набор правил снятия морфологической омонимии вида «наречие/существительное» и «предлог/существительное» на материале корпусов газеты «Коммерсант» (18 млн слов) и Национального корпуса русского языка (более 300 млн слов). Из корпусов были извлечены 4144 контекста, из которых в 433 системой ПРОМТ омонимия была снята неправильно. Автором проведен анализ данных контекстов и предложена система правил, позволяющая снять практически все неоднозначности из данной выборки.

Разработанная система правил легко представима в формальном виде и предназначена для интеграции в систему машинного перевода ПРОМТ, а также в другие системы машинного перевода.

Особо следует отметить безусловную практическую пользу исследования, профессионализм автора в вопросах компьютерной лингвистики, хороший стиль изложения и оформления работы.

В то же время хотелось бы отметить следующие недостатки работы:

1. По какому принципу отбирались омонимы для исследования? "Список омонимов был получен в ходе работы с системой при анализе случаев неправильного анализа входного предложения". В работе в Приложении 2 приводятся лишь 20 омонимов, а как же остальные? Или они верно разбираться ПРОМТом?

2. То же с контекстами - выборка хорошая, но вдруг найдутся другие контексты, где правила не сработают?

3. Каким образом делался перевод контекстов - предложение переводилось ПРОМТ-ом "само по себе" или внутри некоего большого текста? В последнем случае, гипотетически, должно переводиться лучше. Или в данном случае это не существенно?

4. Для нескольких классов у вас указано только правило снятия омонимии на наречие (Существительное в пред. п. /наречие), на предлог (Существительное в род. п. /предлог; Существительное в тв. п./предлог c временным значением), или сформулированы для конкретных омоформ (рядом; типа). А что с остальными?

5. Вопрос по результатам работы - в итоговой таблице (Приложение 2) не указано, на сколько % новые правила улучшили результат разбора данных контекстов, что остается для читателя неизвестным.

Однако указанные недостатки не умаляют высокого качества выполненной работы и могут служить направлением для дальнейшего развития системы.

Ст. преп. кафедры математической лингвистики,

А.

Основные порталы (построено редакторами)

Домашний очаг

Дом • Дача • Садоводство • Дети • Активность ребенка • Игры • Красота • Женщины • (Беременность) • Семья • Хобби
Здоровье: • Анатомия • Болезни • Вредные привычки • Диагностика • Народная медицина • Первая помощь • Питание • Фармацевтика
История: СССР • История России • Российская Империя
Окружающий мир: Животный мир • Домашние животные • Насекомые • Растения • Природа • Катаклизмы • Космос • Климат • Стихийные бедствия

Справочная информация

Документы • Законы • Извещения • Утверждения документов • Договора • Запросы предложений • Технические задания • Планы развития • Документоведение • Аналитика • Мероприятия • Конкурсы • Итоги • Администрации городов • Приказы • Контракты • Выполнение работ • Протоколы рассмотрения заявок • Аукционы • Проекты • Протоколы • Бюджетные организации
Муниципалитеты • Районы • Образования • Программы
Отчеты: • по упоминаниям • Документная база • Ценные бумаги
Положения: • Финансовые документы
Постановления: • Рубрикатор по темам • Финансы • города Российской Федерации • регионы • по точным датам
Регламенты
Термины: • Научная терминология • Финансовая • Экономическая
Время: • Даты • 2015 год • 2016 год
Документы в финансовой сфере • в инвестиционной • Финансовые документы - программы

Техника

Авиация • Авто • Вычислительная техника • Оборудование • (Электрооборудование) • Радио • Технологии • (Аудио-видео) • (Компьютеры)

Общество

Безопасность • Гражданские права и свободы • Искусство • (Музыка) • Культура • (Этика) • Мировые имена • Политика • (Геополитика) • (Идеологические конфликты) • Власть • Заговоры и перевороты • Гражданская позиция • Миграция • Религии и верования • (Конфессии) • Христианство • Мифология • Развлечения • Масс Медиа • Спорт (Боевые искусства) • Транспорт • Туризм
Войны и конфликты: Армия • Военная техника • Звания и награды

Образование и наука

Наука: Контрольные работы • Научно-технический прогресс • Педагогика • Рабочие программы • Факультеты • Методические рекомендации • Школа • Профессиональное образование • Мотивация учащихся
Предметы: Биология • География • Геология • История • Литература • Литературные жанры • Литературные герои • Математика • Медицина • Музыка • Право • Жилищное право • Земельное право • Уголовное право • Кодексы • Психология (Логика) • Русский язык • Социология • Физика • Филология • Философия • Химия • Юриспруденция

Мир

Регионы: Азия • Америка • Африка • Европа • Прибалтика • Европейская политика • Океания • Города мира
Россия: • Москва • Кавказ
• Регионы России • Программы регионов • Экономика

Бизнес и финансы

Бизнес: • Банки • Богатство и благосостояние • Коррупция • (Преступность) • Маркетинг • Менеджмент • Инвестиции • Ценные бумаги: • Управление • Открытые акционерные общества • Проекты • Документы • Ценные бумаги - контроль • Ценные бумаги - оценки • Облигации • Долги • Валюта • Недвижимость • (Аренда) • Профессии • Работа • Торговля • Услуги • Финансы • Страхование • Бюджет • Финансовые услуги • Кредиты • Компании • Государственные предприятия • Экономика • Макроэкономика • Микроэкономика • Налоги • Аудит
Промышленность: • Металлургия • Нефть • Сельское хозяйство • Энергетика
Строительство • Архитектура • Интерьер • Полы и перекрытия • Процесс строительства • Строительные материалы • Теплоизоляция • Экстерьер • Организация и управление производством