МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ
Федеральное государственное бюджетное образовательное учреждение высшего
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ГУМАНИТАРНЫЙ УНИВЕРСИТЕТ
ИМЕНИ М. А. ШОЛОХОВА
Компьютерные технологии в лингвистическом образовании
Программа по факультативной дисциплине
по специальности 10.02.01 – Русский язык
Всего учебных часовЗЕТ)
Всего аудиторных занятий, час. 18
Всего часов на самостоятельную работу аспиранта 54
МОСКВА 2011_
Пояснительная записка
Дисциплина «Компьютерные технологии в лингвистическом образовании» является факультативной дисциплиной 2-го года обучения в аспирантуре и входит в образовательную составляющую структуры программы послевузовского профессионального образования (ФД. А.01). Программа дисциплины разработана на основе паспорта научной специальности 10.02.01 – «Русский язык» и программы кандидатского экзамена по специальности «Русский язык». Дисциплина складывается из лекций, посвященных различным аспектам компьютерной лингвистики и корпусной лингвистики и ориентирует аспирантов на решение задач, требующих комплексного применения лингвистических методов и методов компьютерной лингвистики. Курс призван развить у аспирантов интерес к изучению взаимодействия компьютерных наук и лингвистики как смежных гуманитарных дисциплин и научить их правильно применять приложения компьютерной лингвистики к широкому кругу проблем, связанных с синтезом и анализом текста, автоматической обработкой текста и информационно-поисковыми системами.
Основные цели и задачи дисциплины
Цель данного курса - ознакомление студентов с потенциалом компьютерной лингвистики как дисциплины, возникшей на стыке вычислительной математики, кибернетики и теоретической лингвистики, и выработка у студентов навыков применения компьютерных технологий при решении конкретных задач прикладной линвгистики.
Задачи:
- знать предмет, цели и задачи изучаемой дисциплины;
- усвоить основные понятия и термины курса;
- предъявить систему понятий, показывающую важнейшие принципы компьютерной лингвистики и возможность ее приложений в информационных системах и практической деятельности прикладного лингвиста, состоящей в моделировании фрагментов естественного языка и создании формально-логических моделей, имеющих лингвистическую интерпретацию;
- ознакомить аспирантов с основными понятиями компьютерной лингвистики и принципами аннотирования корпусов текстов.
Распределение часов учебных занятий по семестрам
Название дисциплины | Вид учебной работы | Кол-во часов | Семестры | |
Аудитор ные | Самост. работа | |||
Компьютерные технологии в лингвистическом образовании | Лекции | 18 | 54 | 3 |
Общий объем часов по дисциплине | 18 | 54 | 72 |
Содержание дисциплины
I. Вводная часть: Предмет и задачи математической лингвистики.
Математическая лингвистика, компьютерная лингвистика и компьютерные технологии. Основные этапы развития современной математической лингвистики и кибернетики с 1950-х гг. по настоящее время. Приложения компьютерной лингвистики в прикладных исследованиях. Понятия формального языка и формальной грамматики. Распознающие и порождающие грамматики. Классы формальных грамматик и их естественно-языковые соответствия. Неукорачивающие грамматики, грамматики непосредственных составляющих, контекстно-свободные грамматики, контекстно-зависимые грамматики. Категориальные грамматики. Структура подчинения и линеаризация. Синтаксические деревья и поддеревья. Грамматики зависимостей и грамматики составляющих. Древоприсоединяющие грамматики (Tree-adjoining grammars) Джоши и Минималистские грамматики Хомского и Стейблера. Мощность грамматики и проблема распознавания языков.
II. Лингвистический процессор и модели парсинга.
Уровневая структура естественного языка и лингвистический процессор. Модель «Смысл-Текст» как обоснование лингвистического процессора на основе грамматики зависимостей. Понятие автоматического (машинного) перевода. Системы «Этап», «Этап 2» и «Этап 3» и их применение для формализации русского языка. Понятия парсера и парсинга. Грамматически-ориентированные (grammar-driven) и корпусно-ориентированные (data-driven) модели парсера. Левое и правое ветвление синтаксической структуры. Понятие глубины памяти и гипотеза Ингве. Неоднозначные предложения и снятие омономии. Понятия перемещения поддерева (Move), слияния поддеревьев (Merge), скрэмблингов и Барьеров.
III.Компьютерная лингвистика и интеллектуальные технологии.
Информационно-поисковые системы. Понятия базы дазы данных и банка данных. Понятие информационно-поискового тезауруса. Структура статьи информационно-поискового тезауруса. Тезаурусы и базы данных в системах извлечения информации. Понятие языковой онтологии. Построение онтологии для фрагментов естественного языка. Компьютерная лингвистика и интеллектуальные технологии. Системы извлечения информации. (проходится на практических занятиях). Компьютерные технологии в распознавании речи. (проходится на практических занятиях, рекомендуется демонстрировать образцы работы компьютерных программ анализа речи). Синтез речи. Понятие речевого клона. (проходится на практических занятиях рекомендуется демонстрировать образцы работы компьютерных программ синтеза речи). Моделирование многофакторных процессов в языковой деятельности. Мультимодальные системы.
IV. Корпусная лингвистика.
Понятия корпуса текста. Аннотированные корпуса текстов естественных языков и их структура. Национальный корпус Русского языка, его структура и возможности навигации. Корпусная лингвистика и ее перспективы.
Лекционный курс
Порядковый номер лекции | Раздел, тема учебного курса, содержание лекции | Количество часов |
1. 2. 3. 4. 5. 6. 7. 8. | Тема 1. Предмет и задачи математической лингвистики 1.1. Введение. Понятия математической лингвистики, кибернетики, и компьютерной лингвистики. Зарождение математической лингвистики в 1950-е гг. как новой научной дисциплины, находящейся на стыке теоретической лингвистики и теории формальных языков. 1.2. Выделение классов формальных грамматик и их естественно-языковые соответствий Н. Хомским в 1950-х. Мощность грамматики и проблема распознавания формальных и естественных языков. Нетривиальные лингвистические и математические свойства Неукорачивающих грамматик, грамматик непосредственных составляющих, контекстно-свободных грамматик, контекстно-зависимые грамматик, категориальных грамматик, грамматик с автоматной памятью. Проблема выделения в естественном языке ядра, соответствующего определенным классам формальных грамматик. Распознающие и порождающие грамматики. Категориальные грамматики. 1.3. Проблема полноты распознавания. Порождающая способность как основа языковой деятельности. Формализация естественного языка и поиск интуитивных соответствий классам формальных грамматик как основные направления развития математической лингвистики. 1.4. Понятия дерева подчинения и виды синтаксических деревьев. Грамматика зависимостей и грамматика составляющих как два основных способа представления дерева подчинения. Эквивалентность двух способов представления дерева подчинения. Соотношение линейного порядка и иерархической структуры. Бинарные проективные деревья составляющих и их линвгистические свойства. Феномен непроективности и его проявления в естественных языках. Совершенствование теории формальных грамматик и математической лингвистики в гг. 1.5. Древоприсоединяющие грамматики (Tree-adjoining grammars) Джоши, и Минималистские грамматики Хомского и Стейблера. Понятия доминации, структурного приоритета, предшествования и непосредственного предшествования. Понятия перемещения поддерева (Move), слияния поддеревьев (Merge), скрэмблинга и Барьеров. Тема 2. Лингвистический процессор и модели парсинга 2.1. Уровневая структура естественного языка и лингвистический процессор. Модель «Смысл-Текст» – как обоснование лингвистического процессора на основе грамматики зависи мостей. 2.2. Понятие автоматического (машинного) перевода. Системы «Этап», «Этап 2» и «Этап 3» и их применение для формализации русского языка. Достижения отечественных и зарубежных линвистов в сфере машинного перевода. 2.3. Понятия парсера и парсинга. Грамматически-ориентированные (grammar-driven) и корпусно-ориентированные (data-driven) модели парсинга. Левое и правое ветвление синтаксической структуры. Неоднозначные предложения и снятие омономии. 2.4. Понятие глубины памяти и гипотеза Ингве. Алгоритмы отбора правильной синтаксической структуры. Время решения как критерий эффективности парсинга. Машина Тьюринга. Полиноминальное время решения. Тема 3. Компьютерная лингвистика и интеллектуальные технологии 3.1. Информационно-поисковые системы. Понятия базы дазы данных и банка данных. Реляционные базы данных и семантические сети. Глубинно-семантический уровень как семантическая сеть. 3.2. Понятие языковой онтологии. Предикатно-аргументные отношения как модель для построения языковой онтологии. Понятие информационно-поискового тезауруса. Отличие тезауруса от энциклопедического и толкового словаря. Структура статьи информационно-поискового тезауруса. Тезаурусы и базы данных в системах извлечения информации. Системы распознавания речи в прикладных исследованиях. Речевое портретирование. 3.3. Синтез речи: проблема выделения стандартных сегментных и супрасегментных блоков в корпусе текста. Речевые клоны и моделирование акцента. Сочетание лингвистических и статистических методов в интеллектуальных технологиях. Обучающие логические алгоритмы и тестирование систем. 3.4. Моделирование многофакторных процессов в языковой деятельности. Понятие мультимодальной системы. Применение виртуальных собеседников (роботов) в мультимодальных системах. Тема 4. Корпусная лингвистика 4.1. Понятия корпуса текста и корпусной лингвистики. Аннотированные корпуса текстов естественных языков и их структура. 4.2. Национальный корпус Русского языка, его структура и возможности навигации. Соотношение традиционной и корпусной лингвистики. 4.3. Проблема языковой нормы и соотношения синхронного и диахронного срезов в корпусах текстов. Панхронические тенденции и статистическая оценка узуса. 4.4. Понятие морфологической дезамбигуации. Синтаксическая и прагматическая дезамбигуация предложений. Разрешение неоднозначности в корпусах текстов со снятой амбигуацией. Понятия лемм и тэгов, наиболее распространенные системы тэггинга. | 6 4 5 3 |
Содержание и объем самостоятельной работы студентов
Разделы и темы рабочей программы самостоятельного изучения | Перечень домашних заданий и других вопросов для самостоятельного изучения | Сроки выполнения | Объём часов |
1 | 2 | 3 | 4 |
Тема 1. Математическая лингвистика и ее приложения. Тема 2. Формальные грамматики и их естественно-языковые соответствия. Тема 3. Лингвистический процессор Тема 4. Языковые онтологии Тема 5. Синтез речи и мультимодальные системы | Подготовка эссе на тему с конспектированием первоисточников: 1) Норберт Винер. Кибернетика, или управление и связь в животном и машине. 2-е изд., М., 1983; 2) Системология и языковые аспекты кибернетики. М.: Советское радио, 19, . Элементы математической лингвистики. М., Наука. 1969; 4) Введение в общий синтаксис. М: РГГУ, 2001; 5) Аспекты теории синтаксиса. Пер. с англ. М.: МГУ, 1972; 6) Математическая лингвистика. Отв. Ред. . М., 1973; 7) Ч. Мидоу. Анализ информационных систем. М., Прогресс, 1977. Перевод первоисточников: 1) Nirenburg S. and Raskin V. Ontological Semantics. Cambridge, MA: MIT Press, 2004; 2) Chomsky N. Rules and Representations, New York: Columbia University Press, 2005. Реферирование: 1) , Тестелец синтаксических ограничений в генеративной грамматике. // Фундаментальные направления современной американской лингвистики /, , . М: МГУ, 1997, С. 58-109; 2) . Формальные грамматики и языки. М., Наука, 1973; 3) Язык и интеллект. Сб. Пер. с англ. и нем. Сост. и вступ. статья . М., Прогресс, 1996; 4) , . Элементы математической лингвистики. М., Наука. 1969; 5) , . Математика помогает лингвистике. Книга для учащихся. Серия «Мир Знаний». М., Просвещение, 1994; 6) Ковтунова слов в русском языке. М.: Наука, 1976. Аннотированный обзор научной литературы по теме: 1) Лингвистический процессор для сложных информационных систем/ , , и др. М., Наука, 1992; 2) . Автоматическая обработка текста на естественном языке: модель согласования. М., Наука, 1990; 3) . Русский язык в модели «Смысл – Текст». Москва-Вена: Языки славянской культуры, 1995; 4) . Исследования по машинному переводу. М., Наука, 1979; 5) , , . Теоретические проблемы русского синтаксиса. Взаимодействие грамматики и словаря. М., Языки славянских культур, 2010. Подготовка докладов на предложенные темы на основе реферирования предложенных первоисточников: 1) Raskin, Victor, Hempelmann, Christian F., Taylor Julia M. Догадка или знание: два подхода к семантике при обработке естественного языка. // «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 6;, Онтология силовых процессов. // «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 192-199; 4) Квазисинонимы в лингвистических онтологиях. // «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010 , 137-312. Реферирование первоисточников: 1) . Введение в прикладную лингвистику. М.: УРСС, 2003; 2) , . Компьютерный синтез и клонирование речи. Минск.: Белорусская наука, 2008;3) Норберт Винер. Кибернетика, или управление и связь в животном и машине. 2-е изд., М., 1983; 4) , ,, Лукашевич выбор как многофакторный вероятностный процесс. «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 173-180. Составление реферата и подготовка доклада по источникам: , ,, Референциальный выбор как многофакторный вероятностный процесс. «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 173-180. | 6 8 10 12 10 5 3 |
Учебно-методические материалы по дисциплине
Основная литература
· , , . Теоретические проблемы русского синтаксиса. Взаимодействие грамматики и словаря. М., Языки славянских культур, 2010.
· , . Компьютерный синтез и клонирование речи. Минск.: Белорусская наука, 2008.
· «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010.
· «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 8 (15). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2009.
· «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 7 (14). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2008.
· «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 6 (13). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2007.
· «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 5 (12). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2006.
Дополнительная литература
· . Введение в прикладную лингвистику. М.: УРСС, 2003.
· Норберт Винер. Кибернетика, или управление и связь в животном и машине. 2-е изд., М., 1983.
· Системология и языковые аспекты кибернетики. М.: Советское радио, 1983.
· , . Элементы математической лингвистики. М., Наука. 1969.
· Лингвистический процессор для сложных информационных систем/ , , и др. М., Наука, 1992.
· . Автоматическая обработка текста на естественном языке: модель согласования. М., Наука, 1990.
· . Русский язык в модели «Смысл – Текст». Москва-Вена: Языки славянской культуры, 1995.
· Математическая лингвистика. Отв. Ред. . М., 1973.
· Язык и интеллект. Сб. Пер. с англ. и нем. Сост. и вступ. статья . М., Прогресс, 1996.
· Ч. Мидоу. Анализ информационных систем. М., Прогресс, 1977.
· . Исследования по машинному переводу. М., Наука, 1979.
· Stabler, E.: Derivational Minimalism. // LACL ’96: Selected Papers from the 1st International Conference on Logical Aspects of Computational Linguistics. Volume 1328 of Lecture Notes in Computer Science., London, UK, Springer-Verlag (1997) P. 68–95.
· Chomsky, N.: The Minimalist Program. The MIT Press, Cambridge, USA (1995).
· Chomsky, N.: Derivation by phase. //Kenstowicz, M., ed.: Ken Hale: A Life in Language. The MIT Press, Cambridge, USA (2001) 1–52
· Kobele, G., Michaelis, J.: Two type 0-variants of Minimalist Grammars. Jäger, G., Monachesi, P., Penn, G., Wintner, S., eds.: FG-MOL 2005: Proceedings of the 10th conference on Formal Grammar and the 9th Meeting on Mathematics of Language, Edinburgh, Scotland (2005).
· Frey, W., Gärtner, H.: On the treatment of scrambling and adjunction in
Minimalist Grammars. // Jäger, G., Monachesi, P., Penn, G., Wintner, S., eds.: Proceedings of the 7th Conference on Formal Grammar. (2002), 41–52.
· Michaelis, J., Gärtner, H.: A note on countercyclicity and Minimalist Grammars. // Jäger, G., Monachesi, P., Penn, G., Wintner, S., eds.: Proceedings of the 8th Conference on Formal Grammar. (2003), 103–114.
· Gärtner, H., Michaelis, J.: Some remarks on locality conditions and Minimalist Grammars. // Gärtner, H., Sauerland, U., eds.: Interfaces + Recursion = Language? Chomsky’s Minimalism and the View from Syntax and Semantics. Mouton de Gruyter, Berlin (2007), 161–195.
· Champollion, L.: Lexicalized non-local MCTAG with dominance links is NP-complete. // Penn, G., Stabler, E., eds.: Proceedings of Mathematics of Language 10. CSLI On-Line Publications, UCLA (2007).
· Sogaard, A., Lichte, T., Maier, W.: On the complexity of linguistically motivated extensions of tree-adjoining grammar. In: RANLP 2007: Proceedings of the Conference on Recent Advances in Natural Language Processing, Borovets, Bulgaria (2007).
· Kübler, S., McDonald, R. and Nivre, J. (2009) Dependency Parsing. Morgan and Claypool.
· Н. Хомский. Аспекты теории синтаксиса. Пер. с англ. М., МГУ, 1972.
· , . Общая Фонетика. М.:, РГГУ, 2001.
· -Ениколопова. Законы и правила русской интонации. Учебное пособие. М.: Флинта, 1999.
· , , . Основы общей фонетики. 4-е изд. СПб., 2004.
· . Формальные грамматики и языки. М., Наука, 1973.
· , . Математика помогает лингвистике. Книга для учащихся. Серия «Мир Знаний». М., Просвещение, 1994.
· , . Основы общего и машинного перевода. М., 1964.
· Основные направления структурализма. Отв. Ред. , . М., Наука, 1964.
· Anna Wierzbicka. O Języku – dla wszystkich. Warsawa, 1967.
· Raskin, Victor, Hempelmann, Christian F., Taylor Julia M. Догадка или знание: два подхода к семантики при обработке естественного языка. // «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 6
· Nirenburg S. and Raskin V. Ontological Sematics. Cambridge, MA: MIT Press, 2004.
· , Онтология силовых процессов. // «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 192-199.
· SUGGESTED UPPER MERGE ONTOLOGY (SUMO)
· Национальный корпус русского языка. http://*****/
· www. ontologyportal. org. (SUMO)
· www. opencyc. org (CYC)
· http://wordnet. princeton. edu (WordNet)
· , , Итеративное применение алгоритмов снятия частеречной омонимии в русском тексте. // «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, .
· Квазисинонимы в лингвистических онтологиях. // «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010 , 137-312.
· , , Синтаксический анализатор «Treevial». Принцип динамического ранжирования гипотез. «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 477-490.
· Michael I. Dehktyar, Alexander Ja. Dikovsky. Generalized Categorial Dependency Grammars // Pillars of Computer Science, 2008, P.230-255.
· Carl Pollard, Ivan A. Sag. Head-Driven Phrase Structure Grammar. Chicago: University of Chicago Press, 1994.
· Yorick Wilks. Is a Companion a distinctive kind of relationship with a machine? //«Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 659-668.
· Wilks Y. (ed). Artificial Companions in Society: scientific, economic, psychological and philosophical perspective. Amsterdam: John Benjamins. 2010.
· , ,, Референциальный выбор как многофакторный вероятностный процесс. «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 173-180.
· Кореферентные отношения в тексте – сравнительный анализ размеченных данных. //«Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 350-355.
· Hajicova Eva и др. PDT 2.0- Guide, UFLA & GKL, 2006. http://ufal. mff. cuni. cz./pdt2.0.
· De Groote, P., Morrill, G., Retoré, C., eds.: LACL ’01: Proceedings of the 4th International Conference on Logical Aspects of Computational Linguistics. Volume 2099 of Lecture Notes In Computer Science., London, UK, Springer-Verlag (2001).
· Jäger, G., Monachesi, P., Penn, G., Wintner, S., eds.: FG-MOL 2005: Proceedings of the 10th conference on Formal Grammar and the 9th Meeting on Mathematics of Language, Edinburgh, Scotland (2005).
· Harkema, H.: A characterization of Minimalist languages. // De Groote, P., Morrill, G., Retoré, C., eds.: LACL ’01: Proceedings of the 4th International Conference on Logical Aspects of Computational Linguistics. Volume 2099 of Lecture Notes In Computer Science., London, UK, Springer-Verlag (2001).193–211
· Michaelis, J.: Transforming linear context-free rewriting systems into Minimalist Grammars. // De Groote, P., Morrill, G., Retoré, C., eds.: LACL ’01: Proceedings of the 4th International Conference on Logical Aspects of Computational Linguistics. Volume 2099 of Lecture Notes In Computer Science., London, UK, Springer-Verlag (200–244.
· Michaelis, J.: An additional observation on strict derivational Minimalism.// Jäger, G., Monachesi, P., Penn, G., Wintner, S., eds.: FG-MOL 2005: Proceedings of the 10th conference on Formal Grammar and the 9th Meeting on Mathematics of Language, Edinburgh, Scotland (2005).
· Michaelis, J.: Derivational Minimalism is mildly context-sensitive. //LACL ’98: Selected papers from the Third International Conference, on Logical Aspects of Computational Linguistics. Volume 2014 of Lecture Notes in Computer Science., London, UK, Springer-Verlag (20–198.
· Nivre J. Inductive Dependency Parsing. Series “Text, Speech and Language Technology”, vol. 34. Springer Verlag, 2006.
· Nivre, J. (2008) Algorithms for Deterministic Incremental Dependency Parsing. Computational Linguistics 34(4), 513-553.
· Nivre, J. (2010) Dependency Parsing. Language and Linguistics Compass 4(3), 138-152.
· Pettersson, N., Löwe, W. and Nivre, J. (2010) Evaluation of Accuracy in Design Pattern Occurrence Detection. IEEE Transactions on Software Engineering 36(4), 575-590.
Примерный перечень вопросов к итоговому контролю
1. Предмет математической лингвистики. Отношение математической лингвистики к лингвистике и математике.
2. Понятие алгоритма и вычислительной системы. Алгоритмически заданные языки.
3. Понятия формального языка и формальной грамматики.
4. Понятия базового и вспомогательного словаря в формальных языках.
5. Классы формальных языков: неукорачивающие грамматики и грамматики непосредственных составляющих.
6. Контекстно-свободные грамматики и контекстно-зависимые грамматики. КС-правила и КЗ-правила.
7. Понятие проективности. Проективные и непроективные высказывания.
8. Понятия графа и синтаксического дерева. Дерево зависимостей и дерево составляющих как два эквивалентные способа представления синтаксической структуры.
9. Мягко-контекстно зависимые грамматики.
10. Минималистские грамматики Н. Хомского и Н. Стейблера.
11. Понятие лингвистического процессора. Уровни представления языка в лингвистическом процессоре.
12. Модель «Смысл –Текст» как теория лингвистического процессора.
13. Понятие машинного (автоматического) перевода.
14. Общая характеристики лингвистических процессоров класса «Этап».
15. Поверхностно-синтаксические отношения (ПСО) и разметка связей в тексте.
16. Понятия сегментации текста, парсера и парсинга.
17. Основные модели морфологического и синтаксического парсинга.
18. Грамматически-ориентированные и текстуально-ориентированные модели парсинга.
19. Понятия оперативной памяти и глубины памяти.
20. Понятие ветвления и гипотеза Ингве. Левое и правое ветвление.
21. Понятия базы данных и банка данных.
22. Понятие семантической сети и его применение в компьютерной лингвистике.
23. Информационно-поисковые системы и языки запросов.
24. Гипотеза языковой относительности Сэпира-Уорфа.
25. Понятие языковой онтологии. Онтологии высшего и среднего уровня.
26. Общая характеристика систем WordNet и SUMO.
27. Понятие информационно-поискового тезауруса. Структура статьи информационно-поискового тезауруса.
28. Компьютерные технологии анализа речи и их применение.
29. Компьютерные технологии синтеза речи.
30. Клонирование сегментов и суперсегментных единиц.
31. Понятие многофакторного вероятностного процесса. Моделирование многофакторных процессов в компьютерных технологиях.
32. Диалоговые системы с виртуальными участниками (роботами).
33. Мультимодальные системы в компьютерных технологиях.
34. Понятия корпуса текста и корпусной лингвистики.
35. Варьирование языка с точки зрения корпусной лингвистики.
36. Панхронические тенденции развития языки и их статистическая оценка.
37. Морфологическая и синтаксическая дезамбигуация в корпусе текста.
38. Понятия леммы и аннотации. Принятые системы тэггинга в аннотированных корпусах текстов.
39. Национальный корпус русского языка. Его состав, структура и возможности навигации.
40. Многоязычные корпуса текстов и их особенности.


