ПРОГРАММА ДИСЦИПЛИНЫ «КОМПЬЮТЕРНЫЕ ТЕХНОЛОГИИ В ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЯХ»

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА

В «Федеральном государственном стандарте высшего образования» основной акцент в подготовке магистров сделан на компетентностный подход. Магистр по направлению подготовки «Лингвистика», профиль «Теория коммуникации и международные связи с общественностью (PR)» готовится к профессионально-практической; научно-методической; научно-исследовательской; организационно-управленческой деятельности в области лингвистического образования, межъязыкового общения, межкультурной коммуникации, лингвистики и новых информационных технологий.

С организационно-методической точки зрения курс «Компьютерные технологии в лингвистических исследованиях» построен на принципах логической последовательности изложения материала, взаимного сопряжения тем, умеренности, соотнесенной со временем освоения дисциплины, и повторяемости. Концентрированная подача материала составляет характерную особенность программы и обуславливает определенную целостность обучения.

Приступая к изучению дисциплины, студенты должны владеть следующими знаниями, умениями и компетенциями: уметь ориентироваться в системе общечеловеческих ценностей и учитывать ценностно-смысловые ориентации различных социальных, национальных, религиозных, профессиональных общностей и групп в российском социуме; использовать принципы культурного релятивизма и этических норм, предполагающие отказ от этноцентризма и уважение своеобразия иноязычной культуры и ценностных ориентаций иноязычного социума; владеть навыками социокультурной и межкультурной коммуникации, обеспечивающими адекватность социальных и профессиональных контактов; быть готовым к работе в коллективе, социальному взаимодействию на основе принятых моральных и правовых норм, проявлять уважение к людям, готовность нести ответственность за поддержание доверительных партнёрских отношений; осознавать значение гуманистических ценностей для сохранения и развития современной цивилизации; быть готовым принять нравственные обязательства по отношению к окружающей природе, обществу и культурному наследию; владеть наследием отечественной научной мысли, направленной на решение общегуманитарных и общечеловеческих задач; владеть культурой мышления, способностью к анализу, обобщению информации, постановке целей и выбору путей их достижения, владеть культурой устной и письменной речи.

НЕ нашли? Не то? Что вы ищете?

Полная учебная нагрузка составляет 72 академических часа, из которых 24 отводится на аудиторные занятия и 48 на самостоятельную работу студентов.

Контроль уровня знаний студентов предусматривает: а) текущий контроль по материалу проходимой темы; б) рубежный контроль; в) итоговый контроль в устной аттестации (зачет - 4 семестр).

1.  ЦЕЛИ И ЗАДАЧИ ДИСЦИПЛИНЫ

Целью курса «Компьютерные технологии в лингвистических исследованиях» является подготовка магистра к применению на практике знаний программных технологий анализа и обработки текстовой информации.

Для достижения этой цели с учетом возможностей ВУЗа и требованиями рынка труда решаются следующие задачи:

– формирование у студентов правильного представления о возможностях использования программных технологий анализа и обработки текстовых данных;

– развитие общекультурных компетенций выпускников.

2. МЕСТО ДИСЦИПЛИНЫ В СТРУКТУРЕ ООП

М.1. Общенаучный цикл

К изучению курса студенты приступают, получив степень бакалавра лингвистики и обладая навыками использования компьютерных программ различного типа (текстовые, вычислительные, графические редакторы).

3. ТРЕБОВАНИЯ К РЕЗУЛЬТАТАМ ОСВОЕНИЯ ДИСЦИПЛИНЫ

Процесс изучения дисциплины направлен на формирование следующих компетенций:

·  умеет работать с основными информационно-поисковыми и экспертными системами, системами представления знаний, синтаксического и морфологического анализа, автоматического синтеза, распознавания и понимания речи, обработки лексикографической информации и автоматизированного перевода, автоматизированными системами идентификации и верификации личности (ПК-21);

·  владеет методами когнитивного и формального моделирования естественного языка и методами создания метаязыков (ПК-22);

·  владеет современными методиками сбора, хранения и представления баз данных и знаний в интеллектуальных системах различного назначения с учетом достижений корпусной лингвистики (ПК-23);

·  владеет современными методиками разработки лингвистического обеспечения в автоматизированных системах различного профиля (ПК-24).

В результате изучения дисциплины студент должен:

Знать: методы моделирования естественного языка.

Уметь: эффективно решать задачи анализа и обработки текстовых массивов данных.

Владеть: методами компьютеризации лексикографических работ, навыками получения требуемого результата с наименьшими трудозатратами, современными методами и методиками исследования при целостном подходе к самому объекту изучения.

4. ОБЪЕМ ДИСЦИПЛИНЫ И ВИДЫ УЧЕБНОЙ РАБОТЫ

Общая трудоемкость дисциплины составляет 2 зачетные единицы.

Вид учебной работы

Всего часов

Семестры

4й семестр

1.

Аудиторные занятия (всего)

24

24

В том числе:

-

-

1.1.

Лекции

24

24

1.2.

Прочие занятия

В том числе:

-

-

1.2.2.

Практические занятия (ПЗ)

-

-

1.2.2.

Семинары (С)

-

-

1.2.3.

Лабораторные работы (ЛР)

-

-

Из них в интерактивной форме (ИФ):

12

12

2.

Самостоятельная работа (всего)

48

48

В том числе:

-

-

2.1.

Курсовой проект (работа)

-

-

2.2.

Расчетно-графические работы

-

-

2.3.

Реферат

-

-

2.4.

Подготовка и прохождение промежуточной аттестации

4

4

Другие виды самостоятельной работы

44

44

Общая трудоемкость (ак. часов)

72

72

Общая трудоемкость (зач. ед.)

2

2

5. СОДЕРЖАНИЕ ДИСЦИПЛИНЫ

5.1. Содержание разделов дисциплины

1. Обоснованность применения компьютерных технологий в лингвистике.

Обоснованность и необходимость применения компьютерных технологий в лингвистических исследованиях. Роль гуманитарного знания в формировании исследовательских подходов в компьютерной лингвистике. Междисциплинарный статус компьютерной лингвистики: ее связи с искусственным интеллектом, когнитивной наукой, теорией программирования. Основные направления применения компьютерных технологий в лингвистике. Оптимизация использования языка как средства массовой коммуникации. Оптимизация способов фиксации и хранения информации. Оптимизация способов передачи информации.

2. Теоретические основы применения компьютерных технологий в лингвистике.

Понятие модели в математике, кибернетике и лингвистике. Понятие модели и моделирования в лингвистических прикладных и теоретических задачах. Методы моделирования языка в компьютерной лингвистике. Классификации как основной инструмент лингвистического описания. Алгоритмы. Исчисления. Трансформационная порождающая грамматика как исчисление. Импликации, иерархии, прототипы. Формальные теоретико-множественные конструкции в морфологических исследованиях.

3. Основные направления применения компьютерных технологий в лингвистике. Компьютерный инструментарий лингвистичес-ких исследований.

Когнитивная наука как один из источников формирования категорий компьютерной лингвистики. Теория знаний. Способы представления знаний в компьютерных системах, работающих с естественным языком. Язык как механизм представления и обработки знаний. Процедурный и декларативный способы представления знаний. Категорийные понятия: фреймы, сценарии, семантические сети, сцена. Исследовательский инструментарий компьютерной лингвистики. Понятие о лингвистическом алгоритме. Языки программирования и лингвистические алгоритмы. Формальные языки представления текста как инструмент его автоматической обработки. Использование компьютерных средств обработки языковых данных. Использование различных средств и сред программирования. Метаязыки.

4. Автоматическая обработка письменного текста.

Математическая и статистическая структура текста. Применение точных методов к исследованиям языка и текстов. Автоматизированные системы обработки текста и их архитектура. Формальные языки представления текста как инструмент его автоматической обработки. Теория подъязыков.

5. Автоматизация анализа и синтеза текста. Этапы анализа текста.

Процедура преданализа. Автоматический морфологический анализ. Связь морфологического анализа со словарем, основные виды анализа. Автоматический синтаксический и семантический анализ. Основные способы, проблемы и результаты. Изображение, представление и обнаружение синтаксических структур. Поверхностный и глубинный синтаксический анализ. Связь синтаксиса с семантикой с точки зрения автоматического анализа и синтеза. Поверхностный и глубинный синтаксический анализ. Прагматический анализ. Построение прагматической структуры. Выявление текстовых структур. Межфразовые связи, текст как единое целое.

6. Синтез текста.

Задача синтеза как обратная по отношению к анализу. Понятие актантов действий. Основные методы автоматического синтеза речи: формантный синтез, КЛП - синтез, компилятивный синтез и их современные модификации. Лингвистическое обеспечение для автоматического синтеза речи: алгоритмы транскрибирования и кодировки текстов и аллофонная база данных.

7. Психолингвистическая обработка текста.

Необходимость применения компьютерных технологий при психолингвистической обработке текста. Психолингвистическая обработка текста, обусловленная особенностями диагностики. Компьютерная психолингвистическая система. Основные характеристики и требования. Лингвистический аспект контент - анализа. VAAL - как пример психолингвистической системы. Режимы работы.

8. Прикладная лексикология и лексикография.

Методы компьютеризации лексикографических работ. Машинные фонды национальных языков. Лексические проблемы информатики. Слово в машинной обработке. Автоматические словари и банки терминологических данных. Машинные фонды языков. Виды машинных словарей. Компьютерная лексикография. Текстовые и словарные базы данных как объект лингвистического исследования.

9. Информационный поиск.

Основные понятия информационного поиска. Ключевое слово, дескриптор, координатное индексирование. Информационно-поисковый язык, информационно-поисковые системы. Документальный и фактографический информационный поиск. Термин, терминология, терминоведение, терминография. Типы терминологических словарей. Многозначные слова в терминологических словарях. Словарь-тезаурус, его роль в поиске информации.

10. Системы машинного перевода.

Основные этапы разработки систем машинного перевода. История машинного перевода. Возникновение идеи машинного перевода (МП). Первые опыты. Роль вычислительной техники в появлении идеи МП. Основные этапы развития идеи МП. Три периода в развитии МП. Перевод с использованием способов кодирования смысла. Языки-посредники. Автоматический анализ и синтез для МП. Морфологический, синтаксический, лексический, семантический уровни анализа и синтеза текста для МП, достигнутые результаты и проблемы осуществления качественного машинного перевода. Лексический анализ и словари для МП. Словарь оборотов. Контекстологический словарь для алгоритмического разрешения лексической многозначности. Современное состояние и перспективы развития машинного перевода. Современные системы МП практического использования в России и за рубежом. Машинный перевод как часть технологии компьютерной обработки текста.

11. Автоматическая обработка звучащей речи.

Ментальное и физическое представление речевого сигнала: основные характеристики и принципиальные различия. Характер связи между ментальным и физическим представлениями. Основные методы автоматического распознавания речи: динамическое программирование, скрытые марковские цепи, нейроподобные сети. Подробная характеристика одного из этих методов. Лингвистический подход к автоматическому распознаванию речи. Метод чтения динамических спектрограмм как основа построения базы знаний (экспертная система) для лингвистического декодирования речевых сигналов

12. Лингвистическое обеспечение компьютерных систем различного назначения.

Искусственный интеллект. Лингвистические процессоры. Компьютерный интерфейс в лингвистических исследованиях. Учебные лингвистические автоматизированные системы: вопросно-ответные системы; диалоговые системы решения задач и системы обработки связных текстов. Технология построения гипертекстовых систем Проблема понимания текстов. Оживление текста.

13. Методологическое влияние компьютерных технологий на теоретическую лингвистику.

Рефлексия компьютерных моделей языка в лингвистических исследованиях. Способы верификации результатов исследования.

5.2. Разделы дисциплины и виды занятий

№ п/п

Наименование раздела дисциплины

Лекц.

Практические занятия и лабораторные работы

СРС

Всего

ПЗ/С

ЛР

Из них ИФ

1.   

Обоснованность применения компьютерных технологий в лингвистике.

1

-

-

-

3

4

2.   

Теоретические основы применения компьютерных технологий в лингвистике.

2

-

-

1

3

5

3.   

Основные направления применения компьютерных технологий в лингвистике. Компьютерный инструментарий лингвистических исследований.

2

-

-

1

4

6

4.   

Автоматическая обработка письменного текста.

2

-

-

1

3

5

5.   

Автоматизация анализа и синтеза текста. Этапы анализа текста.

2

-

-

1

4

6

6.   

Синтез текста.

2

-

-

1

3

5

7.   

Психолингвистическая обработка текста.

2

-

-

1

4

6

8.   

Прикладная лексикология и лексикография.

2

-

-

1

4

6

9.   

Информационный поиск.

2

-

-

1

3

5

10.   

Системы машинного перевода.

2

-

-

1

4

6

11.   

Автоматическая обработка звучащей речи.

2

-

-

1

4

6

12.   

Лингвистическое обеспечение компьютерных систем различного назначения.

2

-

-

1

4

6

13.   

Методологическое влияние компьютерных технологий на теоретическую лингвистику.

1

-

-

1

4

6

5.4. Описание интерактивных занятий

№ п/п

№ раздела дисциплины

Тема интерактивного занятия

Вид занятия

Трудо-емкость

(час.)

1.   

2

Теоретические основы применения компьютерных технологий в лингвистике.

Презентация преподавателя с последующим обсуждением и выступлениями студентов

1

 

2.   

3

Основные направления применения компьютерных технологий в лингвистике. Компьютерный инструментарий лингвистических исследований.

1

 

3.   

4

Автоматическая обработка письменного текста.

1

 

4.   

5

Автоматизация анализа и синтеза текста. Этапы анализа текста.

1

 

5.   

6

Синтез текста.

1

 

6.   

7

Психолингвистическая обработка текста.

1

 

7.   

8

Прикладная лексикология и лексикография.

1

 

8.   

9.

Информационный поиск.

1

 

9.   

10

Системы машинного перевода.

1

 

10.   

11

Автоматическая обработка звучащей речи.

1

 

11.   

12

Лингвистическое обеспечение компьютерных систем различного назначения.

1

 

12.   

13

Методологическое влияние компьютерных технологий на теоретическую лингвистику.

1

 

6. ЛАБОРАТОРНЫЙ ПРАКТИКУМ – НЕ ПРЕДУСМОТРЕН

7. ПРАКТИЧЕСКИЕ ЗАНЯТИЯ (СЕМИНАРЫ) – НЕ ПРЕДУСМОТРЕНЫ

8. МАТЕРИАЛЬНО-ТЕХНИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ДИСЦИПЛИНЫ

Методические пособия, компьютерные классы

·  компьютеры – системные блоки на базе процессоров Intel Core2Duo 1,8 Mhz;

·  мониторы – Samsung 152B,151P,171P, Greenwood LC550RD;

·  принтеры лазерные HP1005, 1022. 1100, 2015 струйные – Epson Photo750, HP 6127, Canon i850;

·  копировальные аппараты Xerox RX1035, Kyocera KM-2030;

·  сканеры – HP Scanjet 3500c, 2400, 3800;

·  проекторы Sony VPL-CX5, VPL-CX6, BenQ 620с.