Лабораторная работа7. Программа машинного перевода Promt
Цель работы: извлечение терминологии и практика работы с памятью переводов.
1. Извлечение терминологии.
Программа “Менеджер терминологии”, которая открывается командой из главного меню Настройка перевода | Извлечь терминологию из текста, предназначена для автоматизации поиска в текстах терминов, их извлечения и сохранения для дальнейшей обработки.
· Чтобы добавить файлы для анализа, нажмите кнопку Добавить на панели инструментов или выберите в меню команду Файл | Добавить (клавиши Ctrl+N). В диалоге “Выбрать тексты” указываются добавляемые файлы, язык, на котором написан текст добавляемых документов. Нажмите кнопку OK. Если параметры программы были предварительно настроены и их не нужно менять, нажмите кнопку Обработать. Иначе, после нажатия кнопки OK настройте параметры и запустите обработку с помощью соответствующей команды меню или кнопки на панели инструментов. Чтобы настроить параметры приложения, нажмите кнопку Параметры на панели инструментов или выберите в меню команду Сервис | Параметры (Shift+O). Откроется диалог “Параметры”, который содержит параметры настройки. Чтобы восстановить значения параметров по умолчанию, выберите команду Сервис | Установить параметры по умолчанию (клавиши Shift+D). При закрытии приложения сохраняются все изменения параметров. После изменения параметров нужно повторно выполнить анализ.
· Чтобы начать анализ и обработку добавленных документов, нажмите кнопку Продолжить на панели инструментов или выберите в меню команду Выполнить | Продолжить (Shift+R). Чтобы прервать анализ, нажмите на панели инструментов кнопку Прервать или выберите в меню команду Выполнить | Прервать (Shift+S). После завершения анализа отображается результирующая таблица, вид и содержимое которой зависят от заданных параметров обработки и отображения. Чтобы открыть панель контекста (если она не открыта) и просмотреть найденные примеры для выделенного ТК, нажмите кнопку Панель контекста на панели инструментов или выберите в меню команду Вид | Панель контекста (Shift+C). Терминологические кандидаты выделяются в контексте красным цветом. Чтобы получить статистику по ТК, нажмите кнопку Статистика по ТК на панели инструментов или выберите в меню команду Вид | Статистика по ТК. Добавьте найденные ТК в пользовательский словарь, что позволит в будущем получать их перевод.
· Для занесения термина в словарь, нажмите на нем дважды, укажите, в какой словарь добавляется термин и нажмите Создать. Создайте словарную статью и нажмите Сохранить.
· Команды сохранения файла с терминами доступны в меню Файл. Команды Сохранить (Ctrl+S) или Сохранить как сохраняют список всех ТК с переводами и сведениями о частотности. Команда Сохранить ТК сохраняет только список ТК. Сохраните файл со списком ТК и откройте его для просмотра.
2. Подключение базы ТМ.
В программе PROMT можно создавать и использовать при переводе базы ТМ, предварительно подключив их к переводу и установив нужный порядок следования в списке подключенных баз.
· Для создания базы переводческой памяти или добавления записи в существующую на вкладке Настройка перевода | Редактировать настройки нажмите на закладке TM. Будут показаны подключенные и неподключенные базы TM. Нажмите на базе TM правой кнопкой мыши и выберите из локального меню Создать новую. То же можно выполнить на панели “Настройки перевода” открыв вкладку TM. Перед созданием новой переводческой базы следует установить языковую пару на вкладке Перевод, поскольку база будет создаваться для этой языковой пары. При выборе имени переводческой базы рекомендуется записать языковую пару в имя базы, например, New EnRu. Добавление записей в активную базу выполняется для выделенного текста выбором Настройка перевода | Добавить в translation memory (F10).
· Для редактирования переводческой базы нажмите на TM правой кнопкой мыши и выберите из локального меню Открыть. После этого открывается окно “Менеджер баз Translation Memory ”. Содержание базы TM можно открыть двойным нажатием на имени базы. Информация в базах ТМ системы PROMT представлена в виде записей, хранящихся в специальном формате и состоящих из сегментов (предложений) исходного текста и их переводов.
· Задайте направление перевода Русский-Английский. На вкладке Настройка перевода | Редактировать настройки |TM посмотрите, какие базы TM доступны. Подключите к переводу базу Business RU-En. Создайте новую базу переводов и подключите ее к переводу.
3. Поиск в ТМ.
Для поиска в базе TM слова или фразы ее нужно ввести в поле “Найти:” и нажать кнопку Найти. Задаются следующие параметры поиска:
· учитывать регистр;
· поле для поиска (оригинал или перевод);
· направление поиска (вниз или вверх);
· регулярные выражения (для формирования запроса поиска можно использовать подстановочные знаки: “*” замещает неограниченное количество символов, “?” замещает один символ).
· найдите в базе записи с фразой “новый каталог”.
4. Создание и выполнение запросов.
Запрос предназначен для поиска в базе TM записей, отвечающих определенным условиям. Результат поиска представляет собой выборку из базы TM, которая отображается на вкладке в рабочей области.
· Нажмите на имени базы переводов Business RU-En в левой панели правой кнопкой мыши и выберите Открыть. Откроется окно “Менеджер баз Translation Memory” для поиска и редактирования записей.
· Для создания запроса на панели Базы Translation Memory в окне “Менеджер баз Translation Memory” нажмите правой кнопкой мыши по названию базы TM, к которой нужно создать запрос, и выберите команду Новый запрос, введите название для нового запроса и нажмите клавишу Enter.
· На панели Свойства запроса задайте тип и параметры запроса. Панель Свойства запроса содержит раскрывающийся список для выбора типа запроса и две группы параметров: Поля и Настройки. Набор доступных параметров зависит от выбранного типа запроса. В группе Поля задаются основные критерии поиска (в зависимости от выбранного типа запроса): Оригинал – текст, который нужно найти в исходном тексте записей базы TM; Перевод – текст, который нужно найти в переводах записей базы TM. Задайте, например, конкорданс (поиск записей, в которых исходный текст содержит хотя бы одно слово из текста, заданного в запросе), и Оригинал для поиска в оригинальном тексте записей.
· В правой части панели Поля напечатайте текст запроса, например “новый каталог”.
· Для выполнения запроса нажмите дважды левой кнопкой мыши по названию запроса, либо выберите в контекстном меню запроса команду Выполнить запрос. Будут найдены все записи, содержащие хотя бы одно из заданных слов. Закройте окно “Менеджер баз Translation Memory”.
5. Перевод с использованием баз ТМ.
Все основные операции с базами ТМ в системе PROMT выполняются в режиме использования баз ТМ. Для включения данного режима выполните одно из следующих действий:
· установите флажок Использовать ТМ на вкладке Translation Memory в диалоговом окне “Настройки перевода”, которое открывается выбором Настройка перевода | Редактировать настройки;
· в главном меню системы PROMT выберите Настройка перевода | Редактировать тематики. В окне диалога “Тематики” на вкладке TM установите флажок Использовать ТМ;
· установите флажок Использовать ТМ на вкладке Translation Memory панели “Настройки перевода”.
· Поиск сегментов в базах ТМ при переводе выполняется в соответствии с установленным для текущего документа или тематики минимальным процентом совпадения искомого фрагмента текста с полем Оригинал баз ТМ. Процент совпадения при переводе задается на панели “Настройки перевода” на вкладке TM | Настройки. Задайте совпадение 75%. Если процент совпадения для сегмента оказывается больше заданного в настройках, то производится автоматическая подстановка перевода из подключенной базы ТМ. При этом оригинал и перевод из TM выделяются подчеркиванием, цвет которого различен для случаев 100%-ного и неполного совпадения: по умолчанию серый для 100%-ного (exact match) совпадения и коричневый для неполного совпадения (fussy match).
· Для поиска отдельного сегмента в TM, нажмите правой кнопкой на сегменте и выберите Справка по базам TM или на вкладке “Настройка перевода” нажмите Найти в Translation Memory в группе “Translation Memory”. Процент совпадения для этого поиска указывается на панели “Справочная информация”. Задайте этот процент равным 50% и выполните в TM поиск похожих сегментов. На панели “Справочная информация” на вкладке Translation Memory отображается искомый сегмент, найденные сегменты в TM с отличиями, сегмент перевода и процент совпадения.
6. Создание и заполнение баз ТМ.
· Чтобы создать новую базу, нажмите правой кнопкой в окне баз на вкладке TM на панели “Настройки перевода” или в окне диалога “Настройки перевода” и выберите Создать новую. Входной и выходной языки задаются на этапе создания базы ТМ и не могут быть изменены в дальнейшем.
· Чтобы добавить запись в базу TM нужно выделить оригинал и перевод и на вкладке Настройка перевода в группе “Translation Memory” нажать Добавить в Translation Memory | Выделенный текст (F10). Переведенный документ можно целиком добавить в TM командой Добавить в Translation Memory | Весь документ (Ctrl+F10).
· Создайте новую TM и добавьте в нее 2-3 записи.
· Откройте созданную TM, нажав на ней правой кнопкой мыши и выбрав из локального меню Открыть, и посмотрите за имеющиеся записи.
7. Экспорт и импорт.
· Чтобы экспортировать переводческую базу PROMT необходимо выделить все записи в окне Translatiom Memory Manager, а затем экспортировать выделенные записи в формате. tmx (Translation Memory eXchage) командой База TM | Экспортировать | Выделенные записи и в окне сохранения задать тип файла “Формат TMX” (*.tmx). База в формате обмена .tmx затем может быть импортирована в другую программу переводческой памяти.
· Чтобы импортировать переводческую базу в PROMT необходимо создать новую пустую базу с соответствующим именем в окне “Менеджер баз Translation Memory”, а затем импортировать базу в формате *.tmx командой База TM | Импортировать и сохранить новую базу.
· Экспортируйте созданную TM, а затем импортируйте ее. Удалите созданную TM, выбрав команду Удалить из локального меню этой базы.
8. В программе PROMT выберите Файл | Создать для открытия окна перевода. Файлу документа по умолчанию присваивается имя “Документ1”.
· Задайте направление перевода “Русский – английский”, тематика “Общая лексика”.
· Введите в окно исходного текста следующий текст:
Уважаемые коллеги! Мы готовы работать с вами. Наш новый каталог для Вас уже подготовлен. К сожалению товаров, заказанных Вами, нет уже на складе. Мы сожалеем о задержке и сделаем все возможное, чтобы ускорить исполнение заказа. Наша компания примет на себя все дополнительные расходы. Чек на комиссионные Вы найдете в приложении. Мы уверены, что Вам понравится товар предложенный в качестве альтернативы. К нашему письму мы прилагаем документы на вывоз, счёт в 3-х и накладную в 2-х экземплярах. Просим извинить за задержку. С наилучшими пожеланиями. Менеджер отдела продаж. |
· Переведите текст (Перевод | Перевести документ) без подключенных специализированных словарей; проанализируйте перевод.
· Подключите специализированный словарь “Контракты” (Настройка перевода | Редактировать настройки | Словари), переведите текст и сравните перевод с предыдущим.
· Для использования TM установите флажок Использовать ТМ на вкладке Настройка перевода | Редактировать настройки в диалоговом окне “Настройки перевода”, или установите флажок Использовать ТМ на вкладке Translation Memory панели “Настройки перевода”. Подключите базу TM “Business RuEn” на панели “Настройки перевода” на вкладке TM | Базы TM.
· Нажмите кнопку Настройки, задайте процент совпадения при перевода 100% и установите флажок “Показывать в переводе фактический процент совпадения”.
· Переведите документ снова; обратите внимание на найденные в TM переводы.
· Задайте процент совпадения при переводе 75% и переведите текст снова; проанализируйте перевод.
· Задайте процент совпадения при перевода 50% и переведите текст снова; сравните перевод с предыдущим вариантом.
· Отредактируйте перевод.
· Сохраните перевод.
Вопросы для самостоятельной работы
1. Как и для чего выполняется извлечение терминологии?
2. Каким образом терминологический кандидат добавляется в пользовательский словарь?
3. Как можно сохранить список ТК?
4. Как и для чего используются базы переводов?
5. Как подключить базу переводов для перевода текста?
6. Что нужно сделать для создания TM?
7. Каким образом в TM добавляются записи?
8. Как выполняется редактирование TM?
9. Как устанавливается минимальный процент совпадения?
10. Можно ли использовать TM в противоположном языковом направлении?
11. Что произойдет, если в базе TM найден неточно совпадающий фрагмент текста?
12. Как и для чего выполняется запросы в TM?
13. Как создается новая TM?
14. Каким образом можно импортировать и экспортировать TM?


