УДК 811.111’37

ТЕКСТОВАЯ ПОЛИСЕМАНИЧНОСТЬ И МАШИННЫЙ ПЕРЕВОД

[1]

Национальный исследовательский Иркутский государственный технический университет, 664074, 3.

Статья посвящена многоаспектности текста, которая создается за счет как лингвистических, так и экстралингвистических факторов. Многоаспектность текста, которая легко воспринимается человеком, является главной причиной, почему на данном этапе развития науки компьютер не может создать текст перевода, который обладал бы адекватной информативной и семантической наполненностью.

Библиогр. 5 назв.

Ключевые слова: семантика текста; многоуровневость организации текста; машинный перевод; алгоритм перевода; вариативность понимания; специализированный перевод.

THE TEXT POLYSEMANTICISM AND MACHINE TRANSLATION.

D. Pletnikova

National Research Irkutsk State Technical University,

83 Lermontov St., Irkutsk, 664074.

The article is devoted to multiple-aspect organization of a text caused by linguistic and extra linguistic factors. Multiple-aspect organization of a text, which is easy apprehended by a man, is the main reason why it is unable for computer to create an adequate text of translation containing informative and semantic fullness.

5 sources.

Key words: semantics of a text, multilevel organization of a text, machine translation, algorithm of translation, variation of understanding, specialized translation.

Исследование процессов понимания, осмысления и интерпретации информации, существующей в виде различных письменных и устных текстов, является одним из важнейших направлений в современной науке о языке. В последнее время особую актуальность приобретает проблема неоднозначности семантики текста в связи с тем, что современный мир представляет собой пространство глобальной информатизации. На современного человека оказывают постоянное воздействие потоки информации, которую ему необходимо осмыслить, интерпретировать и активно использовать в своей повседневной деятельности. Нередко возникает и «опасность неоднозначного толкования однозначной информации». Здесь уместно вспомнить высказывание известного отечественного психолингвиста и психолога о том, что «объективное понимание текста, то есть одинаковое для разных людей чтение, невозможно вообще» [1, с. 307]. Поскольку, подчиняясь, с одной стороны, определенным объективным законам речемыслительной деятельности, понимание текста, с другой – является субъективным процессом. Текст – это продукт речемыслительной деятельности, образование сложное по своей внешней и внутренней структуре.

НЕ нашли? Не то? Что вы ищете?

Многоуровневость его организации обусловливает множественность подходов и направлений изучения самого текста и процессов его понимания. Одним из них является исследование многозначности семантики текста в связи с проблемами понимания речевого сообщения. Особую значимость при изучении этих вопросов приобретают исследования текста и текстовых характеристик, влияющих на интерпретацию его содержания и смысла. В нашей работе мы придерживаемся концепции , согласно которой текст представляет собой комплекс языковых, речевых и интеллектуальных факторов в их связи и взаимодействии [2, с. 4]. Многоаспектность самого текста можно считать одним из факторов, осложняющих понимание и, как результат, приводящих к вариативности его смысла. Одной из особенностей текста является то, что он представляет собой не просто набор лексических единиц в той или иной последовательности или отношениях, а является комплексным стимулом для актуализации значений его внутренней формы.

В современных теориях понимания различают восприятие и понимание текста. Оба процесса являются многоуровневыми. Некоторые исследователи смысловое восприятие делят на два уровня – это восприятие материальной формы текста (открытой для непосредственного восприятия и наблюдения) и переход к образу его содержания (внутренняя форма текста) [3, с. 129]. Для нас интерес представляет собственно понимание, в процессе которого осуществляется переход к образу содержания текста, причем главная роль отводится механизмам, связанным с оперированием элементами системы знаний, а также с действием механизмов оценки, прогнозирования и т. д. Очевидно, что вариативность понимания текста создается за счет экстралингвистического фактора актуализации информации, привлекаемой реципиентом для дальнейшего осмысления речевого произведения (фоновые знания). Так же многоаспектность самого текста можно считать одним из факторов, осложняющих понимание, и как результат, приводящих к вариативности его смысла.

Перевод с одного языка на другой, как особый процесс межъязыковых преобразований, затрагивает в комплексе разные уровни языка: морфологию, лексику, синтаксис, семантику. Следовательно, модель перевода должна отражать иерархию языковых уровней, причем некоторым оптимальным образом. Усилия разработчиков машинного перевода сегодня направлены на то, чтобы получить полностью автоматизированный высококачественный машинный перевод с максимальным использованием семантического уровня языка. Другими словами, перевод требует полного восприятия когнитивных аспектов текста оригинала. Это означает, что компьютер должен принимать язык и ассимилировать языковые явления таким же образом, как делает это человек, для того чтобы разрешить проблему текстовой полисемантичности и создать текст, который обладал бы необходимой информативной и семантической наполненностью.

В целом можно следующим образом описать работу машины-переводчика: она прочитывает очередную фразу, формулирует для себя ее смысл и передает ее на другой язык, пытаясь сохранить лексические и структурные особенности исходного текста. При этом задействуются данные из той области знания, к которой принадлежит текст. Также во время перевода используется опыт перевода предыдущих частей этого текста. Для решения столь сложной задачи используется лингвистическое обеспечение (словари, данные о грамматике), математико-алгоритмическое обеспечение (формальные теоретические модели представления данных и алгоритмы переработки данных), программное обеспечение (реализующее вышеозначенные алгоритмы), информационное обеспечение (базовые сведения о предметной области перевода) и логическое обеспечение (правила логического вывода, используемые при анализе синтезе текста для работы со знаниями из предметной области). В результате мы имеем набор программ, облегчающих труд переводчика, которые условно можно подразделить на две основные группы: электронные словари (electronic dictionary) и системы машинного перевода (machine translation system). Однако возможен ли высококачественный машинный перевод на данном этапе развития науки?

Рассмотрим и сравним примеры перевода специализированного текста Computer Graphics, выполненного Google и Prompt:

Computer graphics means the use of computers to produce pictorial images. The images produced can be printed documents or animated motion pictures, but the term computer graphics refers particularly to images displayed on a monitor. Monitor can display graphics as well as alphanumeric data. A computer-graphics system basically consists of a computer to store and manipulate images, a monitor, various input and output devices, and a graphics software package - i. e., a program that enables a computer to process graphic images by means of mathematical language. A computer displays images on the phosphor-coated surface of a graphics display screen by means of an electron beam that sweeps the screen many times each second. Those portions of the screen energized by the beam emit light, and changes in the intensity of the beam determine their brightness and hue. The brightness of the resulting image fades quickly, however, and must be continuously "refreshed" by the beam, typically 85 times per second.

Google:

Компьютерная графика означает использование компьютеров для получения живописного изображения. Изображений производится можно напечатать документы или анимированных фильмов, но термин компьютерной графики относится особенно к изображениям отображается на мониторе. Монитор способен отображать графику, а также буквенно-цифровые данные. Компьютерной графики системы в основном состоит из компьютера для хранения и редактирования изображений, монитор, различных устройств ввода и вывода, и графический пакет программного обеспечения - т. е. программа, которая позволяет компьютеру для обработки графических изображений с помощью математического языка. Компьютер отображает изображения на фосфор покрытием поверхности графики экран с помощью электронного пучка, что зачисток экране много раз в секунду. Те части экрана под напряжением от света испускает луч, и изменения в интенсивности пучка определяют их яркость и оттенок. Яркость результирующего изображения исчезает быстро, однако, и необходимо постоянно "обновилась" пучком, как правило, 85 раз в секунду.

Prompt:

Компьютерная графика означает использование компьютеров производить иллюстрированные изображения. Произведенные изображения могут быть напечатанными документами или оживляемыми кинофильмами, но термин компьютерная графика относится особенно к изображениям, показанным на мониторе. Монитор может показать графические так же как алфавитно-цифровые данные. Система компьютерной графики в основном состоит из компьютера, чтобы сохранить и управлять изображениями, монитором, различными устройствами входа и выхода, и графическим пакетом программ - то есть, программа, которая позволяет компьютеру обработать графические изображения посредством математического языка. Компьютер показывает изображения на покрытой фосфором поверхности графического экрана дисплея посредством электронного луча, который охватывает экран много раз каждую секунду. Те части экрана, возбужденного лучом, излучают свет, и изменения в интенсивности луча определяют свою яркость и оттенок. Яркость получающегося изображения исчезает быстро, однако, и должна быть непрерывно "освежена" лучом, как правило, 85 раз в секунду.

Сопоставительный анализ показывает, что обе программы, в первую очередь, не справились с английскими синтаксическими комплексами (инфинитивными и причастными конструкциями), с многофункциональностью служебных слов, а также очевидна проблема с переводчески релевантными особенностями отдельных слов. Таким образом, оба перевода нельзя назвать адекватными. Тем не менее, программа Prompt намного лучше справилась с переводом.

В случае специализированного перевода, кроме того, что переводчик должен владеть терминологией, он еще должен иметь представление о принятых за рубежом стандартах обозначений тех или иных понятий. Например, возьмем всем известное слово file. В англо-русском словаре находим следующие варианты перевода этого слова: «напильник», «ловкач», «приятель», « файл», «скоросшиватель», «подшивка», «архив», «шеренга» и т. д. Понятно, что переводчик должен уметь ориентироваться во всем тексте. Иначе искажается смысл текста, и выходят казусы, очень похожие на следующий: фраза «Bus error, core dumped» (системное сообщение о зависании) может быть переведена как «Ошибка автобуса, сердечник вывален в кучу». Однако неспособность компьютера воспринять, осознать и рационально применить знание реального мира таким же образам, как это делает человек, не означает, что компьютер бесполезен при переводе. Необходимо только помнить, что любой машинный перевод требует значительной редакторской правки.

Библиографический список

1. Жинкин формирования смысла и содержания текста. М.: Лабиринт, 1998. C. 146–162.

2. Новиков : семь дихотомических признаков // Теория и практика речевых исследований. М.: Изд-во МГУ. 1999. C. 132–144.

3. К вопросу о смысле текста в связи с проблемами его многозначности // Коммуникативно-функциональное описание языка: сб. науч. статей. Уфа: Изд-во БашГУ, 2005. С.127–132.

4. Кирсанова стратегии понимания как способы обработки текстовой информации // Вопросы обучения иностранному языку: методика, лингвистика, психология. Уфа: Изд-во РИС УГАТУ, 2005. С.162–165.

5. Кирсанова текста как основная характеристика его семантики // Вопросы обучения иностранному языку: методика, лингвистика, психология. Уфа: Изд-во РИС УГАТУ, 2007. С.165–171.

[1] , студентка факультета кибернетики, гр. АСУ-08-1, е-mail:*****@***ru

Pletnikova Dariya, the third year student of the Faculty of Computer Science of the National Research Irkutsk State Technical University. E-mail:*****@***ru