Партнерка на США и Канаду по недвижимости, выплаты в крипто
- 30% recurring commission
- Выплаты в USDT
- Вывод каждую неделю
- Комиссия до 5 лет за каждого referral
БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи
УДК 372.881
Трофимова
Марина Анатольевна
Применение ИТ в исследовании фразеологии (на материале английского и русского языков)
Выпускная работа по
«Основам информационных технологий»
Магистранта кафедры английского языкознания
Специальность: 1– германские языки
Научные руководители:
доктор филологических наук, профессор ,
старший преподаватель
Минск 2012
Оглавление
Оглавление. 2
Перечень условных обозначений. 3
Введение. 4
Глава 1 Информационные технологии и лингвистика. 6
1.1 Взаимодействие и взаимовлияние ИТ и лингвистики. 7
Глава 2 Методика исследования. 10
2.1 Основные электронные словари и тезаурусы.. 10
2.1.1 Наиболее известные электронные словари. 11
Глава 3 Использование электронных словарей при изучении фразеологического состава языка 15
3.1 Использование ЭС в исследовании фразеологии. 15
3.1.1 Эффективность использования ЭС при изучении фразеологии. 15
Заключение. 19
Библиографический список. 20
. 22
Предметный указатель. 22
23
Интернет ресурсы в предметной области исследования. 23
. 25
Действующий личный сайт. 25
26
Граф научных интересов. 26
. 27
Тестовый вопрос по ОИТ. 27
Приложение E.. 28
Презентация магистерской диссертации. 28
Перечень условных обозначений
BNC – British National Corpus
MT – machine translation
АПТ – автоматическое понимание текста
ИТ – информационные технологии
КПК – карманный персональный компьютер
ПК – персональный компьютер
СМИ – средства массовой информации
ЭС – электронный словарь
Введение
Вряд ли кто-либо осмелится оспорить известный афоризм Гераклита «Всё течёт, всё изменяется». Да и он вряд ли предполагал, что его изречение с каждым годом будет только приобретать актуальность. Но факт остаётся фактом. Мир и жизнь в нём стремительно несётся вперёд, остаётся только успевать следить за всеми нововведениями, изобретениями и новшествами.
Но больше всего в этом смысле (в смысле скорости развития) выделяется область информационных технологий. Вот, например, несколько интересных фактов: телефону потребовалось 55 лет для того, чтобы количество его пользователей достигло пятидесяти миллионов человек; телевидение вышло на аналогичный уровень пользователей за 13 лет; а Интернету понадобилось для этого всего 3 года [1].
«Сегодня специалист с высшим образованием должен свободно ориентироваться в мировом информационном пространстве, иметь необходимые знания и навыки поиска, обработки и хранения информации с использованием современных информационных технологий, компьютерных систем и сетей» [21, 21]. Но это мнение уже прошлого столетия! Сегодня любой житель планеты со средним уровнем дохода может приобщиться к миру виртуальному, где ему открываются невероятные возможности.
ИТ не только упрощают жизнь, но и делают её разнообразной, интересной, насыщенной, и соответствующей стандартам современного общества. «Становление современного информационного общества приводит к коренным изменениям во всех сферах жизни и деятельности человека» [15, 3].
В лингвистических исследованиях ИТ становятся незаменимыми помощниками, которые помогают не только усовершенствовать систему получения, обработки, передачи информации, но и ускорить сам процесс. Искусственный интеллект совершает непосильную для человеческого ума работу в кротчайшие сроки, оставляя исследователю максимум свободы для творчества. Современный лингвист уже и не представляет своего научного творчества без ИТ. В исследовании фразеологических единиц любого языка использование информационных технологий является неотъемлемой частью, ведь это оптимизирует весь научный процесс, стимулируя получение качественного результата.
Всё вышесказанное подтверждает актуальность выбранной темы. Анализ возможностей применения ИТ в лингвистике и эффективности их использования в лингвистических исследованиях, в частности фразеологического состава английского и русского языков, являются целью данной работы. Для достижения поставленной цели сформулированы следующие задачи:
изучить специализированную литературу по теме применения ИТ в лингвистике;
охарактеризовать основные электронные словари и тезаурусы;
рассмотреть словарные источники, подходящие для использования в процессе исследования фразеологического состава любого языка.
Объектом исследования является процесс изучения фразеологического состава современного английского языка.
Предметом – использование информационных технологий при исследовании английской фразеологии.
Общая концепция работы заключается в том, чтобы выявить электронные словари, наиболее эффективные и часто используемые в лингвистических исследованиях в целом и в изучении фразеологизмов, в частности.
Глава 1
Информационные технологии и лингвистика
По теме применения ИТ в области лингвистических исследований создано немалое количество литературных источников, среди которых следует отметить следующие: учебные пособия «Основы искусственного интеллекта для лингвистов» и «Информационные технологии в лингвистике» и , «Применение информационных технологий в исследовании учебных текстов» , «Компьютерная обработка лингвистических данных» , «Автоматическое понимание текстов: системы, модели, ресурсы» .
Учебное пособие «Основы искусственного интеллекта для лингвистов» - это современный взгляд на понятие искусственного интеллекта и его роль в лингвистических исследованиях. В нём внимание акцентируется на «необходимости глубокой интеграции ИТ с лингвистическими и психологическими знаниями в рамках искусственного интеллекта» [16, 10], ведь с каждым днём технологии неудержимо рвутся вперёд и «в ближайшем будущем мощь любого государства будет определяться не уровнем развития промышленности, новизной и эффективностью её технической базы, а уровнем информатизации общества» [16, 9] Авторы отмечают, что «современное состояние исследований по искусственному интеллекту характеризуется нарастанием интереса к этой проблеме со стороны специалистов широкого профиля, в том числе и филологов» [16, 10]. В книге рассмотрены процедуры формализации знаний человека, имеющего дело с текстами, написанными на естественном языке, и возможности использования полученных знаний для построения компьютерных систем, которые в дальнейшем способны синтезировать отдельные составляющие текста, а также тексты в целом. Таким образом, «книга не просто рассказывает о том, как решаются задачи с помощью компьютера, но приводит читателя к пониманию всего процесса решения такой интеллектуальной задачи – от её формулировки на русском языке до компьютерной программы, демонстрирующей результат» [16, 12].
В учебном пособии «Информационные технологии в лингвистике» «рассмотрены основные понятия современных (на 2004 год) информационных технологий, показаны возможности их использования в проведении лингвистических исследований, практической обработке текстов и обучении иностранным языкам на базе персональных компьютеров» [11, 2]. Это своего рода универсальный, созданный в помощь лингвисту комплекс, содержащий как теоретический материал по использованию ИТ и методов решения различных задач, так и практический материал с детальным описанием процедуры их выполнения. «Авторы сделали попытку объединения данных о современных подходах к общему понятию «информационные технологии» и применении этих подходов к решению лингвистических задач» [11, 190].
В статье «Применение информационных технологий в исследовании учебных текстов» «рассматривается применение квантитативных методов в изучении текста как статистической совокупности, а также описываются созданные на основе данных методов отечественные и зарубежные программы, предназначенные для анализа и лингвистической обработки текстов. Выделен ряд наиболее актуальных вопросов, требующих более детального изучения: это исследования в области читабельности с использованием ИТ и разработка соответствующего инструментария для классификации текстов по ряду областей знаний в зависимости от подготовленности читателя» [25].
В пособии «Компьютерная обработка лингвистических данных» изложен минимум знаний по информатике и ИТ. Наряду с базовыми понятиями, методами и приёмами использования средств вычислительной техники рассмотрены передовые информационные и коммуникационные технологии глобальных компьютерных сетей. Также изложены основные направления фундаментальных исследований и коммерческих разработок, находящихся на пересечении лингвистики, методов представления, обработки знаний и самых современных информационных технологий. Рассмотрены типичные и специфические приложения компьютерной лингвистики. Значительное место отводится классификации лингвистических программ, детально описаны их свойства и назначение.
«Автоматическое понимание текстов: системы, модели, ресурсы» - учебное пособие, в котором обобщается опыт создания российских и зарубежных систем, реализующих АПТ. Эти сложные интеллектуальные системы выделяются из множества систем, в которых просто используются автоматическая обработка текста, поскольку автора интересует именно качественный аспект понимания. К системам, реализующим это понимание текста, автором относятся системы машинного перевода, системы автоматического индексирования, системы информационного анализа массивов официальных документов и текстов СМИ, фактографические системы, системы общения на естественном языке с БД и другие сложные интеллектуальные системы.
Вышеперечисленные источники знаний – лишь малая часть в подтверждение взаимосвязанности ИТ и лингвистики, ИТ и филологии.
1.1 Взаимодействие и взаимовлияние ИТ и лингвистики
Лингвистика (языкознание, языковедение; от лат. lingua – язык) – наука, изучающая языки. Это наука о естественном человеческом языке вообще и обо всех языках мира как индивидуальных его представителях. Невообразимо интересная и нескончаемая наука: сколько всего было исследовано и сколько ещё предстоит исследовать! Но человек не настолько силён, чтобы охватить своими силами всё многообразие окружающей действительности. Именно поэтому на данном этапе современной науки ученые перешли ко взаимодействию человеческого разума и искусственного интеллекта электронных машин, что позволяет оптимизировать любой процесс. Более того, как отметил Терри Виноград, известный специалист по автоматической обработке текстов: «ЭВМ – это языковые машины: основа их могущества заключается в способности манипулировать лингвистическими знаками – символами, которым приписывается некоторый смысл» [11, 90].
«Слово «интеллект» является переводом на латынь древнегреческого слова нус, т. е. ум» [16, 14] «В качестве рабочего определения, удобного для последующего использования в разных задачах примем следующее [28, 222]: Интеллект – это а) способность понимать или обучаться на опыте; способность приобретать и сохранять знания; б) способность быстро и правильно реагировать на новую ситуацию; умение рассуждать при решении проблем, выборе образа действий и т. д.»
«Система искусственного интеллекта (интеллектуальная система) – это компьютерная система, способная получить такие результаты, которые традиционно порождаются в процессе интеллектуальной творческой деятельности человека» [14, 169]. Только это происходит быстрее и эффективнее.
В настоящее время под информационными технологиями (от англ. information technology) чаще всего понимают компьютерные технологии для хранения, преобразования, защиты, обработки, передачи и получения информации. Особое место в развитии ИТ занимают компьютеры, электронная почта и широкое использование компьютерных сетей [1]. Сегодня ИТ, действительно, играют если не важнейшую рол в жизни человека, то уж точно одну из первых. Никто из нас уже и представить себе не может жизнь без телефона (как говорится, «без него, как без рук»), без телевидения, компьютера, Интернета… Совершенно неясно, чем же занимались предыдущие поколения, когда у них появлялось свободное время?
Но все эти современные веяния могут быть использованы не только для развлечения и не только в свободное время. Компьютер и се сопутствующие функции в нём, а теперь ещё и глобальная сеть, как обязательное дополнение, - это как дополнительная голова и пара рук. Совместными усилиями человека и машины, естественного интеллекта и искусственного так скажем взаимовыгодный союз может добиться грандиозных результатов.
Меня, как лингвиста, в первую очередь интересует этот тип работы в лингвистике. На сегодняшний день взаимное влияние, распространение и необходимость использования ИТ в лингвистических исследованиях и лингвистических элементов для развития ИТ – очевидны.
«Информационные технологии в лингвистике – это совокупность законов, методов и средств получения, хранения, передачи, распространения, преобразования информации о языке и законах его функционирования с помощью компьютеров» [15, 8].
В лингвистике понятие ИТ относится в основном к задачам прикладной лингвистики:
создание систем искусственного интеллекта;
создание систем автоматического перевода;
создание систем порождения текстов;
создание систем обучения языку;
создание систем понимания устной речи;
создание автоматизированных информационно-поисковых систем;
разработка различных баз данных для гуманитарных наук;
разработка различного типа автоматических словарей;
разработка систем передачи информации в сети Интернет и т. д. [15, 8].
«Технология получения и распространения новых знаний уже неотделима от Internet» [15, 10]. Формируется инфраструктура, объединяющая в единое целое глобальные и местные телекоммуникационные каналы, радио, телевидение, телефонные линии связи (одна планета – одна сеть). Всё это не просто создаёт сверхинтеллект, а формирует новые измерения сознания, феномен сверхпсихологических изменений в личности человека [7, 39; 19, 6]. Для современного пользователя Интернет – это предмет обихода. Без него не обходится ни один вид деятельности человека XXI века. Суть сверхпсихологических изменений личности в том, что человек перестает ассоциировать себя как полноценную личность, не старается использовать свои внутренние возможности в полную силу, т. к. осознает чрезмерность потраченных усилий, если рядом есть столь универсальный помощник. Именно поэтому Интернету отводится наиважнейшее место в списке открытий относительно ИТ.
«Учёные разработали способ децентрализованной обработки информации в сети и нашли способы передачи такой информации на большие расстояния. Эти две особенности и характеризуют глобальные сети» [15, 178]. Разве можно теперь обойтись без глобальных сетей? Вопрос, конечно, риторический.
«Современная сеть Интернет представляет собой объединение крупных узлов. Каждый узел – это один или несколько мощных компьютеров-серверов. В целом в эту сеть входят миллионы компьютеров. Они могут относиться к разным аппаратным платформам, использовать различные операционные системы и различные форматы данных» [15, 179], но при этом служат одной цели: улучшению условий жизни и деятельности человека.
В области лингвистических исследований Интернет помог совершить громадный шаг вперёд, ведь это позволяет лингвисту, изучающему тот или иной текст, тот или иной язык, рассматривать объект своего исследования со всех сторон, сравнивать свои предположения и теории с исследованиями соотечественников и зарубежных авторов, не покидая рабочего места. Теперь все необходимые материалы для сохранения, использования, передачи, получения, сравнения, изменения, синтеза и анализа информации доступны «с одного клика».
Глава 2
Методика исследования
При написании данной работы были использованы различные методы исследования. Так, описательный метод, применяемый для изучения социального функционирования языка, для описания и анализа элементов и частей работающего языкового механизма, взаимодействует со структурным методом, центральной частью которого является познание языка как целостной функционирующей структуры. То есть с помощью структурного метода мы имеем возможность изучить систему в целом, охватывая разные аспекты, а с помощью описательного – вникнуть в изучение отдельных частей данной системы. Следовательно, использование методов исследования, которые как нельзя лучше дополняют друг друга, совершенствует сам процесс лингвистического исследования.
Анализ и синтез – методы, которые являются неотъемлемой частью любого лингвистического исследования. Первый позволяет выявить структуру объекта, а второй объединяет факты, полученные в ходе исследования, в одно целое. Таким образом, это ещё одна пара исследовательских методов, выступающих в помощь лингвисту.
Также одним из «парных методов» можно отнести и использование дедукции\индукции. Различие между ними состоит в том, что индуктивный подход предполагает переход от единичным факторов к общей системе, а при дедуктивном – наоборот: осуществляется переход от общего знания о данном предмете к единичному, или частному.
Стоит отметить также принцип комплексного подхода, основа которого - всестороннее изучение объекта исследования, и принцип объективности, взаимосвязь и единство используемых методов.
Метод сопоставительного анализа практически основополагающий, т. к. при изучении фразеологического состава в системе двух языков сопоставление, сравнение и анализ выявляемых единиц носит очень важный характер. С помощью этого метода лингвист может четко определить и сформулировать особенности и закономерности используемых языковых единиц.
2.1 Основные электронные словари и тезаурусы
Значения слов традиционно фиксируются в словарях. Словарь – это универсальный сборник слов, использующихся носителями языка, и он является необходимым не только для человека, занимающегося изучением представленного языка как иностранного, но и для человека, для которого данный язык считается родным. Очень редко встречаются представители того или иного языка, кто в совершенстве владеет всем многообразием языкового наследия.
Несомненно, у словарей есть огромное преимущество – возможность использования разными людьми, в разное время, с разными интенциями. Универсальный характер словарных статей является, конечно же, достоинством и определяющей чертой словаря. Но есть и отрицательная черта: устаревание изложенной информации. Мы помним, что «все течет, все изменяется», но напечатанный словарь никаких изменений не претерпевает, он может лишь переиздаваться с учетом дополнений и изменений некоторой информации, но этот процесс долгий и трудоемкий.
«Важно отметить, что несмотря на электронную форму словарей, пользователю доступна вся информация, имеющаяся в печатных словарях, в том числе и структурная. Кроме того, именно электронная форма словаря позволяет существенно ускорить поиск словарной статьи, а также открывает перед человеком принципиально новые возможности в работе над переводом текстов» [16, 78].
Каталог лингвистических программ и ресурсов в Сети размещён на сайте Русской виртуальной библиотеки. Автор – . Одним из тематических подразделов на этом сайте является «Словари и тезаурусы», в нем-то и представлен обширный список электронных словарей, используемых для решения разных лингвистических задач. Среди них: электронные версии словарей Даля, Ожегова, Зализняка, толковый словарь Merriam-Webster, British National Corpus (BNC), Bibliomania, электронные словари MediaLingua для ПК и КПК и многие другие. По совам составителя, при составлении данного списка внимание акцентировалось на бесплатных программах, доступных для загрузки и использования on-line [23].
В следующем разделе подробно остановимся на рассмотрении пяти наиболее известных и часто используемых словарей.
2.1.1 Наиболее известные электронные словари
«В качестве альтернативы бумажным словарям в проекте WordNet были предложены и апробированы компьютерные методы фиксации значений, основанные на экспликации семантических связей между словами средствами информационных технологий. Двуязычные и многоязычные словари, как бумажные, так и компьютерные, содержат сопоставительное описание лексических значений» [16, 77].
WordNet – это электронный тезаурус, отражающий все возможные толкования слов английского языка, и показывающий взаимосвязи между ними. Для каждого слова можно найти синонимы, объединенные в смысловые группы и получить ссылки на родовые (более общие) или производные понятия [5].
Словарь состоит из четырех сетей для основных знаменательных частей речи: существительных, глаголов, прилагательных и наречий. Базовой словарной единицей в этом словаре является не отдельное слово, а так называемый синонимический ряд (синсет), объединяющий слова со схожим значением и по сути своей являющимися узлами сети. Для удобства использования словаря человеком каждый синсет дополнен дефиницией и примерами употребления слов в контексте. Слово или словосочетание может появляться более чем а одном синсете и иметь более одной категории части речи. Каждый синсет содержит список синонимов или синонимичных словосочетаний и указатели, описывающие отношения между ним и другими синсетами.
WordNet можно свободно использовать и в коммерческих и научных целях.
Словарь «МультиЛекс» является ярким примером плодотворного сотрудничества традиционной и компьютерной отечественной лексикографии [16,78].
«Наиболее важной составляющей любого компьютерного словаря являетя лексическая база, на которой он построен. В основу вышеназванного словаря положены словари, которые считаются наиболее полными и авторитетными из имеющихся словарей соответствующей тематики. В отличие от предыдущих версий, которые подразумевали работу со словарем исключительно с компакт-диска, «МультиЛекс 3.5.» можно полностью установить на жёсткий диск, что заметно сокращает время поиска по словарю» [16, 78].
Электронный словарь «Английский МультиЛекс» - это совокупность современных общелексических словарей, в которую входят толковые и тематические англо-русские и русско-английские словари, в точности соответствующие самым востребованным печатным словарям. Все они включены в программу с впечатляющим набором функций, что позволяет легко получить адекватный перевод слов. До тридцати толковых и тематических словарей, посвященных экономике, финансам, банковскому делу, юриспруденции, технике и технологии, биологии и медицине, лингвострановедению. В словарях представлены подробные переводы с транскрипцией, ударениями, примерами употребления, синонимами и грамматической информацией, звуковые примеры произношения слов. Огромным плюсом использования данного словаря является возможность поиска не только по словам и словосочетаниям, но и по содержимому статей (возможность полнотекстового поиска), а также возможен поиск слов с неизвестным написанием. В общем, все эти функции создают практически идеальные условия для работы с электронными словарями «МультиЛекс».
Самым распространенным электронным словарем на сегодняшний день является ABBYY Lingvo. Это семейство электронных и печатных словарей, созданное российской компанией ABBYY. Многоязычная версия этого неповторимого словаря охватывает 15 языков – русский, украинский, английский, немецкий, французский, испанский, итальянскй, турецкий, латинский, китайский, португальский, татарский, казахский, шведский, польский и финский.
В этом словаре нет функции полнотекстового перевода, но что касается перевода слов и словосочетаний, то он более чем эффективен. В словарных статьях представлены и графические изображения слов, и транскрипции, и примеры произношения (а в некоторых словарях они озвучены профессиональными дикторами), и грамматическая информация, и перевод всех вариаций того или иного слова, и еще варианты контекстуального использования, что, естественно, помогает уловить суть самого значения слова, и в дальнейшем правильно его использовать. Ещё одна дополнительная функция – Lingvo Tutor, помогающий запоминать новые слова. Также существуют мобильные версии представленного словаря, что позволяет его использовать в любой удобный момент.
Таким образом, ABBYY Lingvo – величайший по своему содержанию и форме многоязычный и многофункциональный словарь.
В помощь лингвистам также создаются различные поисковые системы. «Поисковые системы первого рода, как правило, называют каталогами (предметными или тематическими – subject catalogues). Обычно такие каталоги создаются людьми в виде иерархических деревьев, на верхнем уровне которых стоят наиболее общие понятия: бизнес, политика, образование спорт, культура и т. д. Элементами нижнего уровня таких деревьев являются ссылки на конкретные web-страницы и серверы» [15, 184].
Примером такой поисковой системы можно назвать систему «Google» в рамках глобальной сети. С помощью нее можно найти всю необходимую пользователю информацию и не только в пределах города или страны, но и в любой точке земного шара, имеющей доступ в Интернет. «Обычно поиск в предметных каталогах осуществляется по ключевым словам» [30, 648]. Набирая ключевые слова в строку ввода, мы автоматически задаем параметры поиска и электронная система подбирает все подходящие варианты, выдаёт список ссылок на web-сайты, которые так или иначе связаны с ключевым словом (словосочетанием). В первую очередь выводятся с наибольшей степенью совпадения с искомым материалом, а дальше располагаются по убыванию.
Но мне хотелось бы остановиться на другой, сравнительно новой, функции этой поисковой системы – Google-переводчик (англ. Google Translate). Это веб-сервис компании Google, предназначенный для перевода части текста или веб-страницы на другой язык. Сервис включает в себя также перевод всей веб-страницы и даже одновременный поиск информации с переводом на другой язык, при этом перевод возможен на все доступные в мире языки. Но есть и ограничения. Этот инструмент может помочь читателю понять общий смысл содержания текста на иностранном языке, но он не предоставляет точных и грамматически верных переводов. Еще один минус работы – это использование в переводе даже нецензурных слов. Это происходит из-за того, что выдача вариантов контролируется статистическим алгоритмом. Поэтому, использование такого типа электронного переводчика возможно не во всех случаях [9].
Пятый всеми используемый электронный словарь – PROMT (PROject MT – проект машинного перевода). В настоящий момент переводчики PROMT существуют для английского, немецкого, французского, испанского, итальянского, португальского и русского языков. Хотя среди пользователей известен как система самого неправильного перевода, основной смысл текста передает. Для текстового перевода он, конечно, не достаточно эффективен, но при переводе отдельных слов или словосочетаний может оказать необходимую помощь. К основным возможностям этого переводчика относятся:
Перевод слов, словосочетаний и текстов;
Использование, редактирование и создание специализированных словарей и профилей перевода;
Интеграция в офисные приложения и веб-браузеры;
Проверка правописания;
Подключение баз Translation Memory и глоссариев [10].
Глава 3
Использование электронных словарей при изучении фразеологического состава языка
3.1 Использование ЭС в исследовании фразеологии
Очевидно, что работа, или любая другая профессиональная или творческая деятельность филолога-лингвиста значительно совершенствуется при помощи различного вида инструментов из области ИТ. И самыми распространенными являются электронные словари и электронные переводчики. Они ускоряют, облегчают и оптимизируют процесс перевода. Неудивительно, что использование ИТ повлияло и на изучение особой области лингвистики – фразеологии. Совершенно неясно, как справлялись со столь емким трудом первые «фразеоисседователи».
3.1.1 Эффективность использования ЭС при изучении фразеологии
На сколько же эффективно их использование при более узкой специализации пользователя?
Стоит отметить, что фразеология – одна из самых сложных с точки зрения перевода областей языка. Не являясь носителем языка, а лишь изучая его, невозможно в полном объеме охватить все устоявшиеся сочетания и фразеологические единицы. Ведь чаще всего переводчик использует дословный перевод, и лишь «подгоняет» его к окружающей действительности, облачая некий смысл в текст. Так вот в процессе такого перевода не всегда ясно, какое из сочетаний обладает реальным значением, а какое переносным, фразеологическим. Именно поэтому электронные словари – незаменимая вещь! В них содержатся словарные статьи с переводом как отдельных слов, словосочетаний, так и фразеологических единиц и оборотов.
Но не все электронные словари оказываются эффективными в равной степени. Для чистоты эксперимента возьмем известное нам фразеологическое выражение «as cool as a cucumber», что в русском языке имеет свой фразеологический аналог «спокоен как удав», и проверим каждый из словарей на правильность и полноту перевода данной единицы. Из рассмотренных нами ЭС самым достойным оказался словарь «МультиЛекс». В словарной статье по нашему запросу помимо основного перевода фразеологизма была включена и дополнительная информация: словарь-источник: стилистическая помета, первое употребление данного выражения, синонимичный ряд, примеры употребления в различных контекстах с переводом.

Рисунок 1 – Словарная статья из словаря «МультиЛекс»
Самым же неэффективным оказался словарь WordNet, так как в обширном списке его словарных статей для фразеологизма «as cool as a cucumber» места не нашлось. Экспликация опорного слова была выведена верно, с примерами его употребления в других сочетаниях, но функции рассмотрения этого выражения как устойчивого в словаре нет. Поэтому этот словарь может помочь лингвисту только в объяснении отдельных, ключевых опорных слов.

Рисунок 2 – Словарная статья из словаря «WordNet»
Три других словаря дают примерно одинаковую информацию. Полной ее не назовешь, но и недостаточной она не является. В этих словарях выражение «as cool as a cucumber» рассматривается не как набор самостоятельных слов, а как единое сочетание, что и обуславливает правильный перевод. Но словарь PROMT дает единственный вариант перевода: он верный, но не раскрывает полноту всего фразеологизма.

Рисунок 3 – Словарная статья словаря «PROMT»
Google Translate предоставляет три синонимичных русских эквивалента английскому устойчивому выражению, что позволяет с большей точностью определить его значение.

Рисунок 4 – Словарная статья словаря «Google Translate»
Словарь Lingvo также даёт несколько возможных вариантов перевода, но при этом еще предоставляет информацию о примерах использования данной конструкции.

Рисунок 5 – Словарная статья словаря «Lingvo»
Таким образом, иерархическая структура из пяти рассмотренных словарей выглядит так:
«МультиЛекс» - самый эффективный и полный словарь;
Lingvo – уступает по некоторым характеристикам, но не менее эффективен при переводе;
Google Translate – эффективен при переводе слов и словосочетаний;
PROMT – среднеэффективен при переводе слов и словосочетаний.
WordNet – эффективен только при переводе отдельных слов.
Заключение
Представленный реферат – это самостоятельное исследование эффективности применения ИТ в лингвистике, в частности в изучении фразеологического состава языка.
После изучения литературных источников было выявлено, что тема использования ИТ в лингвистических исследованиях активно разрабатывается различными авторами. Самые актуальные вопросы на сегодняшний день – ИТ в чтении, понимании и обработке текстов и устной речи, механизмы автоматического понимания устных и письменных текстов, машинный перевод, системы автоматического реферирования и аннотирования текстов, разработка баз данных и автоматических словарей различного типа.
Рассмотрение именно специфики ЭС было взято за основу при написании данного реферата, т. к. на сегодняшний день они являются незаменимыми помощниками филолога-лингвиста. Изучив несколько наиболее известных электронных словарей, была проверена их эффективность и полнота предоставляемой информации. На основе полученных результатов и была выстроена иерархическая структура электронных словарей по принципу убывания эффективности.
Проведенное исследование подтверждает эффективность использования информационных и компьютерных технологий в лингвистике, необходимость проведения исследований в рамках современной науки и в соответствии с новыми технологическими принципами. Самой высокой эффективностью в области изучения фразеологии обладают электронные словари, т. к. отличаются наибольшей полнотой и правильностью выдаваемой информации.
Задачи решены. Цель достигнута.
Библиографический список
1. E-Language // [Электронный ресурс]. – 2012. – Режим доступа: http://palkova. *****/linguistic. - Дата доступа: 21.11.2012.
2. Google Переводчик // Google [Электронный ресурс]. – 2009. – Режим доступа: http://translate. /?hl=ru. – Дата доступа: 21.11.2012.
3. Microsoft Office XP в целом: наиб. Полное рук-во / Ф. Новиков, А. Яценко. – СПб: БХВ-Петербург, 2002. – 917с.
4. Microsoft PowerPoint 2003: самоучитель / . – Москва, Санкт-Петербург, Киев: Диалектика, 2004. – 363с.
5. Princeton University / What is WordNet? [Электронный ресурс]. – 2012. – Режим доступа: http://wordnet. princeton. edu/. – Дата доступа: 21.11.2012.
6. Бесплатный онлайн переводчик текстов и сайтов PROMT ***** [Электронный ресурс]. – . Режим доступа: http://www. *****/. – Дата доступа: 21.11.2012.
7. Куда ведёт технология? // Компьютерра. – 2000. – №15.
8. Ботт, Э. Использование Microsoft Office XP. Специальное издание: Пер. с англ. / Э. Ботт, В. Леонард. – Москва: Изд. дом «Вильямс», 2002. – 912с.
9. Википедия – свободная энциклопедия / Google переводчик [Электронный ресурс]. – 2012. – Режим доступа: http://ru. wikipedia. org/wiki/Google_%D0%9F%D0%B5%D1%80%D0%B5%D0%B2%D0%BE%D0%B4%D1%87%D0%B8%D0%BA. Дата доступа: 21.11.2012.
10. Википедия – свободная энциклопедия / PROMT [Электронный ресурс]. – Режим доступа: http://ru. wikipedia. org/wiki/%D0%9F%D0%A0%D0%9E%D0%9C%D0%A2. – Дата доступа: 21.11.2012.
11. Работа с естественным языком//Современный компьютер. – М., 1986.
12. Всеволодова обработка лингвистических данных: учеб. Пособие / . – 2-е изд., испр. – М.: Наука: Флинта, 2007. – 96с.
13. Журин работы на компьютере / А. Журин. – М., 2005. – 607с.
14. Зарипов и искусственный интеллект // Число и мысль. Вып.3. – М. Знание, 1980.
15. Зубов технологии в лингвистике: Учеб. Пособие для студ. лингв. фак-тов высш. учеб. заведений/, – М.: Издательский центр «Академия», 2004. – 208с.
16. , Зубова искусственного интеллекта для лингвистов: Учеб. пособие. – М.: Университетская книга; Логос, 2007. – 320с.: ил.
17. Каймин : учеб. для студ. вузов, обуч. по естеств.-науч. напр. и спец. / . – М.: ИНФРА-М, 2000. – 232с.
18. Компьютерная лингвистика // Онлайн Энциклопедия «Кругосвет» [Электронный ресурс]. – . Режим доступа: http://www. *****/enc/gumanitarnye_nauki/lingvistika/KOMPYUTERNAYA_LINGVISTIKA. html. – Дата доступа: 21.11.2012.
19. Кинелев системы образования XXI века // Информатика и образование. – 2000. – № 5. – С. 2-7.
20. Крупнейший сборник онлайн словарей ***** / Словарь фразеологизмов русского языка онлайн [Электронный ресурс]. – 2012. Режим доступа: http://www. *****/slovar/frazeolog. html. - Дата доступа: 21.11.2012.
21. , , Воротницкий технологии в системе высшего образования // Информатика и образование. – 1999. - №3.
22. Леонтьева понимание текстов: системы, модели, ресурсы: учеб. пособие для студ. лингв. фак. вузов / . – М.: Академия, 2006. – 304с.
23. Логичев лингвистических программ и ресурсов в Сети / // Русская виртуальная библиотека [Электронный ресурс]. – . Режим доступа: http://www. *****/soft/catalogue/index. html. – Дата доступа: 21.11.2012.
24. Мечковская языка и история коммуникации: от клинописи до Интернета: курс лекций по общему языкознанию / . – М.: Флинта: Наука, 2009. – 584с.
25. Невдах информационных технологий в исследовании учебных текстов [Электронный ресурс]. – 2008. Режим доступа: http://fppo. *****/kmu/kmu6/%D0%92%D0%AB%D0%9F%D0%A3%D0%A1%D0%9A_6/Ready_%D0%B8%D0%BD%D1%84_%D1%82%D0%B5%D1%85%D0%BD/54_Nevdach_M_M. pdf. - Дата доступа: 21.11.2012.
26. Потапова информационные технологии и лингвистика: Учебное пособие. – Изд. 4-е, стереотипное. – М.: КомКнига, 2005. – 368с.
27. Симонович, . Базовый курс: учебник для вузов / . – 2-е изд. – Питер, 2007. – 640с.
28. Вычислительные машины и человеческий разум. – М.: Мир, 1967.
29. 250 секретов HTML и Web-дизайна: [перевод с английского] / М. Хольцшлаг. – М., 2006. – 490с.
30. Информатика. Информационные технологии. – М., 1998.
Приложение А
Предметный указатель
А
As cool as a cucumber – 15, 16, 17, 18
А
Автоматическое понимание текста – 3, 6, 7, 19, 21
И
Искусственный интеллект – 4, 20
Ф
Фразеологический состав – 4, 5, 10, 15, 19
Э
Электронный словарь – 3, 4, 5, 10,11, 12, 15, 19
Приложение Б
Интернет ресурсы в предметной области исследования
http://www. ***** Сайт международного научного периодического журнала "Мир науки, культуры, образования", включенного в "Перечень ведущих рецензируемых научных журналов и изданий РФ, в которых должны быть опубликованы основные научные результаты диссертаций на соискание ученых степеней доктора и кандидата наук". Рецензируемые разделы журнала: искусствоведение, история, культурология, медицина, педагогика, психология, социология, филология, философия, экология, экономика, юриспруденция. Свободный доступ к электронным версиям выпусков журнала.
http://www. *****/ Электронная библиотека, в которой содержатся различные книги, справочники, журналы и словари в электронном виде. Возможно бесплатное скачивание имеющихся ресурсов сайта.
http://www. gumer. info/ Электронная библиотека материалов гуманитарных наук, которая содержит более 5000 различных книг и статей. Удобные каталоги (именной, хронологический, по областям знаний); также имеется система поиска, что позволяет найти необходимый материал в считанные сроки.
http://www. ***** Интернет-версия ежемесячного научного журнала «Молодой ученый», предоставляющего аспирантам, докторантам, соискателям, молодым специалистам и ученым возможность опубликовать результаты своих научных исследований. Статистика сайта (на 08.11.2012): 45 номеров, 8649 научных статей, более 7000 авторов, 33 страны, 534 города. Языки журнала: русский, английский, немецкий, французский. На сайте представлены электронные версии всех номеров журнала, но нет возможности поиска отдельных статей (только в пределах одного журнала).
http://www. *****/ Филологический портал ***** создан 20 апреля 2001 года. Это попытка компактно представить в интернете различную информацию, касающуюся филологии как теоретической и прикладной науки. Центральным разделом портала является библиотека филологических текстов (монографий, статей, методических пособий).
http://en. wikipedia. org/wiki/As_cool_as_a_cucumber Страница в Википедии, созданная автором данной работы.

Рисунок 6 – PrintScreen страницы в Википедии.
http://www. Данный сайт представляет собой электронную библиотеку файлов (свыше 600000 экземпляров) различного формата (Word, PDF, MP3 и др.) самой разнообразной тематики. Здесь представлены учебники, журналы, конспекты лекций, энциклопедии, художественная литература и многое другое. В разработке сайта принимают участие студенты, аспиранты и преподаватели разных вузов России, Украины, Беларуси, Казахстана, стран ближнего и дальнего зарубежья. Здесь можно найти все необходимые материалы. Для скачивания файлов (исключительно бесплатный доступ!) необходимо пройти регистрацию через электронный ящик, в результате − каждому новому пользователю начисляется 100 баллов, на которые, в среднем, можно скачать 8-10 файлов в зависимости от их «стоимости». Очень хорошо структурирован каталог файлов (по областям знаний, в алфавитном порядке, в зависимости от языка текста и т. д.). Отсутствует возможность предварительного просмотра файлов.
Приложение В
Действующий личный сайт

Рисунок 7 – Print Screen главной страницы
Приложение Г
Граф научных интересов
Магистранта
Филологический факультет
Специальность «Германские языки»
Смежные
| Специальность
| Сопутствующие
|
Приложение Д
Тестовый вопрос по ОИТ
Тестовый вопрос по основам информационных технологий
<question type="close" id="078">
<text>01Перевод английского фразеологизма «As cool as a cucumber»:</text>
<answers type="request">
<answer id="313759" right="0"> Крут как огурец</answer>
<answer id="313760" right="0"> Спокоен как огурец</answer>
<answer id="313761" right="1"> Спокоен как удав</answer>
<answer id="313762" right="0"> Крут как удав</answer>
</answers>
</question>
<question type="close" id="078">
<text>01Эффективно ли использование ИТ в лингвистике:</text>
<answers type="request">
<answer id="313759" right="0"> Нет </answer>
<answer id="313760" right="0"> Не очень </answer>
<answer id="313761" right="1"> Да </answer>
<answer id="313762" right="0"> Затрудняюсь ответить </answer>
</answers>
</question>
Приложение E
Презентация магистерской диссертации




