АКАДЕМИЯ НАУК РЕСПУБЛИКИ ТАТАРСТАН

Институт ПРИКЛАДНой СЕМИОТИКи

СОГЛАСОВАНО

академик-секретарь отделения

АН РТ, академик АН РТ

_____________

“____” ________________2015 г.

УТВЕРЖДАЮ

главный ученый секретарь АН РТ,

член-корреспондент АН РТ

_______________

“____” _______________2015 г.

план

НАУЧНОЙ ДЕЯТЕЛЬНОСТИ

Института ПРИКЛАДНой СЕМИОТИКи

нА 2015 год

Директор института

Казань-2015


Содержание

Введение

1.Научно-исследовательская работа*

2. Научно-организационная работа

2.1.Организация научной деятельности

2.2 Международные и межрегиональные научные связи

3. Работа по обеспечению кадрами

3.1 Подготовка кадров

3.2. Повышение квалификации кадров

4. Пропаганда научных достижений

5. Публикации

6. Материально-техническое обеспечение

7. Социальная защита

8. Приложения

Введение

Научная деятельность Института прикладной семиотики АН РТ в 2015 году будет осуществляться в соответствие с Положением института. Основными целями научной деятельности института являются проведение фундаментальных, поисковых и прикладных исследований в области семиотического моделирования, компьютерной и когнитивной лингвистики, образовательных технологий, исследование интеллектуального потенциала личности и организации.

Основная тематика научных исследований института в 2015 году сформирована в рамках основного научного направления «Когнитивные исследования и семиотическое моделирование в гуманитарной сфере» и связана с исследованиями в следующих областях:

НЕ нашли? Не то? Что вы ищете?

·  семиотическое моделирование в гуманитарной сфере и образовании;

·  когнитивное моделирование в лингвистике;

·  социально-когнитивные исследования интеллектуального потенциала организации, личности и общества.

В рамках направления фундаментальных исследований «Когнитивные исследования и семиотическое моделирование в гуманитарной сфере» (научный руководитель - ) определены следующие фундаментальные задачи:

1.  Семиотические модели представления знаний.

2.  Формальные модели и методы обработки текстов.

3.  Когнитивные аспекты речевых технологий.

4.  Социально-когнитивные исследования интеллектуального потенциала организации, личности и общества.

2. Научно-исследовательская работа

1.  Тема «Семиотические модели представления знаний»

Тема 2015 года «Разработка лексикализованных ситуационно-реляционных моделей на основе глагольной семантики для тюркских языков».

Научный руководитель: , зав. отделом, к. т.н. Соисполнители: , к. ф.н., ,

Вид научных исследований: фундаментальные, прикладные.

Год начала и окончания работы над темой: 2011-2020

Документы, на основании которых проводится НИР: план научной деятельности ИПС на 2015 г.

Источник финансирования НИР: бюджет АН РТ

Оргформа проведения НИР: штатный состав научных работников.

Научная проблема

Одной из важных проблем языкознания, связанных со значением и отражением мира в языковых единицах, является осмыслении роли глагола как способа концептуализации и категоризации фрагментов процессуально-событийного мира. Семантика глагола не только номинативна, но и реляционна, что требует оптимальной интеграции разных исследовательских приемов при описании глагольной семантики с учетом как сигнификативных, так и синтагматических компонентов значения. Предполагается описание логических отношений между предикатом и его потенциальными актантами для глаголов разных семантических классов; поиск оптимального способа связывания описаний сигнификативных значений глаголов разных классов и их валентностных свойств; разработка и заполнение баз данных глагольной лексики для различных лингвистических приложений.

Для тюркских языков сохраняется актуальной задача систематизации лингвистических моделей представления значения лексем и единиц более высокого уровня (предложений и словосочетаний), выделение множества семантических универсалий для категоризации семантических значений лингвистических объектов на основе общих принципов разрабатываемого направления системно-функционального анализа семантики. Исследования по разработке подхода к моделированию семантики на основе аппарата объектно-предикативных схем развиваются в институте с 2011 года.

Целью исследований 2015 года являются:

1.  Семантические исследования лексико-семантических групп глаголов татарского языка (1500 лексем) для построения моделей ситуаций на основе аппарата объектно-предикатных схем, а также структурно-функциональных моделей морфем в тюркских языках. Реализация моделей морфем в виде баз данных и разработка специализированного программного инструментария для построения и применения модели морфем.

Задачи исследования:

1.  Семантическая классификация татарских глаголов, выделение глаголов различных семантических групп, корректировка состава ранее выделенных лексико-семантических групп (ЛСГ) глаголов;

2.  Анализ синтаксической валентности глаголов различных ЛСГ, выделение компонентов значения глаголов, релевантных для семантической и синтаксической организации словосочетания и предложения; анализ диатезы и актантной деривации для глаголов различных ЛСГ.

3.  Разработка структурно-функциональной модели тюркской морфемы, как лингвистической базы данных для лингвопроцессоров.

4. Разработка баз данных моделей и программного инструментария для их заполнения и использования.

Ожидаемые научные результаты

- Структурированная модель лексико-семантических групп глаголов татарского языка;

- Лингвистическая база данных татарских глаголов (1500 лексем);

- Лингвистическая база данных тюркских морфем.

Ожидаемая научная продукция

Статьи в рецензируемых журналах – 4.

Статьи в материалах конференций – 4.

Ожидаемая практическая значимость результатов

Базовый состав лингвистических ресурсов для семантического аннотирования татарских и тюркских текстов используется в широком спектре прикладных задач компьютерной лингвистики, в частности, при анализе текстов, в задачах машинного перевода и др.

2. Тема «Формальные модели и методы обработки текстов»

Научный руководитель: , зам. дир. к. т.н.

Подтема 1 «Формальные модели разрешения многозначности в текстах»

Соисполнители: , ,

Подтема 2 «Формальные модели и методы разработки лексикографических систем»

Соисполнители: ,

Вид научных исследований: фундаментальные, прикладные

Год начала и окончания работы над темой: 2012-2020

Документы, на основании которых проводится НИР: план научной деятельности ИПС на 2015 г.

Источник финансирования НИР: бюджет АН РТ

Оргформа проведения НИР: штатный состав научных работников

Научная проблема

Центральной проблемой интеллектуального анализа текстов является проблема разрешения многозначности. Многозначность слова традиционно в лингвистике рассматривается в различных аспектах. Полисемия (лексическая многозначность) связывается с различными семантическими значениями слова. Омонимия (лексико-грамматическая или функциональная многозначность) проявляется на уровне грамматической формы слова (т. е. различные слова имеют тождественную форму). Морфологическая омонимия рассматривается на уровне словоформ в одной парадигме слова. Структурная (синтаксическая) многозначность появляется на уровне синтаксических связей словосочетаний. Морфемный уровень текста связан с многозначностью морфем в составе слова. Словообразовательная омонимия рассматривает различные семантические значения морфем в составе слова (приставки, корни, суффиксы, окончания).

К настоящему времени сформирована основная парадигма методов снятия многозначности, которая включает методы, основанные на правилах; методы машинного обучения, использующие вероятностные модели; гибридные методы. Исследования многозначности для тюркских языков (и особенно для татарского) проводятся фрагментарно и весьма актуальными являются построение формальных моделей и методов разрешения многозначности для татарского и русского языков.

В 2015 году исследования по теме будут связаны с дальнейшей разработкой формальных моделей разрешения грамматической многозначности морфем и омонимов, а также прикладных программных продуктов для разрешения многозначности в текстах.

Будут продолжены работы по созданию программного инструментария для исследования, автоматического разрешения грамматической омонимии в татарском языке, в том числе:

1)  Доработка, расширение функциональных возможностей программного модуля для создания, редактирования, тестирования базы контекстных правил (количество правил должно быть достаточным для снятия не менее 85% морфологической многозначности),

2)  Доработка программного модуля автоматического разрешения грамматической омонимии на основе базы контекстных правил (не менее 80% снятой морфологической многозначности)

3)  Исследование грамматической омонимии с использованием гибридных методов, совмещая метод контекстного анализа и вероятностные модели с целью повышения процента разрешения многозначности до 95%.

4)  Статистическое исследование татарского корпуса. Построение жанровой классификации текстов корпуса на основе методов машинного обучения.

Другое направление исследований касается разработки формальных моделей и методов проектирования лексикографических систем. Планируется заполнение и тестирование грамматических компонент русско-татарской лексикографической базы данных, а также заполнение семантических компонент лексикографической базы данных.

В качестве основных методов разрешения неоднозначностей планируется использовать методы, основанные на правилах, а также статистические методы, использующие частотные характеристики употребления лексических единиц.

Планируется исследовать контекстные ограничения в различных типах омоформ, разработать правила разрешения многозначности на основе обнаруженных контекстных ограничений для татарского и русского языков.

Ожидаемые научные результаты

- Классификация типов грамматической омонимии и контекстных правил разрешения грамматической омонимии для 60 типов в татарском языке.

- Позиционная модель грамматической аннотации русской компоненты русско-татарской лексикографической базы данных.

- Методы разрешения грамматической омонимии для татарского языка на основе контекстных правил.

Ожидаемая научная продукция

1.  Экспериментальная версия русско-татарской лексикографической базы данных объемом 40000 параллельных пар лексем с грамматическими аннотациями (программный продукт на электронном носителе).

2.  Статьи в рецензируемых журналах – 3.

3.  Статьи в материалах конференций - 4.

4.  Свидетельство регистрации экспериментальной версии русско-татарской лексикографической базы данных – 1.

Ожидаемая практическая значимость результатов

Экспериментальная русско-татарская лексикографическая база данных представляет практическую ценность в компьютерных приложениях, и как самостоятельный лингвистический ресурс с развитыми моделями описания лексики.

Тема 3. Когнитивные аспекты речевых технологий

Тема 2015 года «Разработка моделей аннотаций текстовых и речевых данных на татарском языке для систем автоматического анализа речи».

Научный руководитель: , д. т.н.

Соисполнитель: , н. с.

Вид научных исследований: фундаментальные, прикладные

Год начала и окончания работы над темой. 2014-2018.

Документы, на основании которых проводится НИР: план научной деятельности ИПС на 2015 г.

Источник финансирования НИР: бюджет АН РТ

Оргформа проведения НИР: штатный состав научных работников.

Наиболее перспективными подходами в области автоматического распознавания и синтеза речи являются подходы, базирующиеся на построении моделей различных уровней: акустического, морфологического, синтаксического. Данные модели строятся на основе аннотированных баз данных текстовой и речевой информации. Используемая система разметки таких баз данных определяет характер и объём информации, который может быть в дальнейшем использован при построении автоматизированных систем анализа речи.

Таким образом, задача создания набора тегов и правил их расстановки является ключевой на этапе создания корпусов данных, и во многом определяет качество работы систем распознавания и синтеза речи. Для татарского языка на этапе в настоящее время создаются большие текстовые и речевые базы данных, и задача их аннотирования является крайне актуальной.

Общая характеристика (цели, задачи, предмет исследования, методы работы)

Целью данного исследования является создание систем разметки текстовых и речевых баз данных для систем автоматического анализа речи. Для достижения поставленной цели предлагается решить следующие задачи:

1.  Выявление характеристик (параметров аннотирования) в речевом корпусе для системы распознавания татарской речи.

2.  Выявление характеристик (параметров аннотирования) в текстовом корпусе для улучшения качества работы синтезатора татарской речи.

3.  Определение структуры систем разметки текстового и речевого корпусов.

4.  Создание систем разметки: определение набора тегов и правил их расстановки.

5.  Оценка влияния системы аннотирования речевого корпуса на качество работы параметрического синтезатора татарской речи.

Предмет исследования: аннотирование текстовой и речевой информации на татарском языке для систем автоматического анализа речи.

Ожидаемые научные результаты

Модели аннотирования текстовой и речевой информации на татарском языке для систем автоматического анализа речи.

Аннотированный татарский речевой корпус.

Ожидаемая научная продукция (доклады, статьи, разделы монографии, отчеты НИР, разработка методологии, методики и т. д.)

По результатам исследований предполагается подготовить 2 статьи, а также получить свидетельство регистрации на аннотированный татарский речевой корпус.

Тема 4. Социально-когнитивные исследования интеллектуального потенциала личности и организаций

Тема на 2015 год: Социально-когнитивная методика оценки интеллектуального потенциала и его составляющих – образовательного, инновационного, духовно-деятельностного и культурного компонентов (практическая реализация).

Научный руководитель: , в. н.с., к. х.н.

Соисполнитель: , н. с.

Задачи: Продолжение работы над рукописью монографии, подготовка к изданию и публикация монографии, подготовка практических рекомендаций по системе оценки интеллектуального потенциала и его составляющих для различных структур на региональном уровне.

Тема 2: Изучение научного наследия (на основе архивных материалов) ученых – академиков и . Подготовка электронного архива научных трудов и документов из личной коллекции ученых.

Соисполнитель:

Задачи: 1) Разработка контента и программная реализация Виртуального музея-библиотеки академика (продолжение) – раздел ВМБ «периодические издания», «Махмутовские чтения» и Форум.

2) Подготовка к изданию и публикация монографии «Мир ислама» (совместно с Институтом востоковедения и международных отношений КФУ).

3) Создание музейной комнаты с постоянно действующей экспозицией на базе Института востоковедения и международных отношений КФУ.

4) Подготовка к изданию книги воспоминаний (совместно с Институтом энциклопедии АН РТ).

5) Разработка контента и программная реализация Виртуального музея-библиотеки академика – первичная подготовка электронных архивных фото-, видеоматериалов (совместно с , , сотрудниками библиотеки АН РТ)

Вид научных исследований: фундаментальные, прикладные

Документы, на основании которых проводится НИР: план научной деятельности ИПС на 2015 г.

Источник финансирования НИР: бюджет АН РТ

Орг. форма проведения НИР: штатный состав научных работников.

Научная проблема

Долгосрочная цель – содействие повышению интеллектуального потенциала региона путем организации системных исследований по оценке, измерению и прогнозу развития интеллектуального потенциала на различных уровнях.

Цель исследования 2015 года – повышение эффективности оценки ИП и его составляющих путем внедрения результатов теоретических и экспериментальных исследований и методик в практику в виде монографии и практических рекомендаций для организаций различного типа.

Ожидаемые научные результаты

- Обобщение многолетних теоретических и экспериментальных исследований феноменов одаренности, мышления и социально-когнитивных параметров интеллектуального потенциала общества, организации и личности в виде монографии.

- Сравнительный анализ и систематизация методик оценки интеллектуального потенциала на различных уровнях и разработка практических рекомендаций по оценке ИП с позиций оценки когнитивной и личностной составляющей ИП для молодежных сообществ и организаций различного типа.

Ожидаемая научная продукция

- Практические рекомендации (в виде рукописи) по оценке ИП с позиций когнитивной и личностной составляющей ИП для молодежных сообществ и организаций различного типа.

- Монография по результатам теоретического и экспериментального исследования феноменов одаренности, мышления и оценки интеллектуального потенциала на различных уровнях (15п. л.)

- Научные статьи в журналы – 2, тезисы международной научной конференции – 1, российской конференции – 1, региональной конференции – 1.

Ожидаемая практическая значимость результатов

Внедрение результатов теоретических и экспериментальных исследований по оценке одаренности, мышления и интеллектуального потенциала на различных уровнях. Прогнозирование уровня развития ИП в формальных и неформальных сообществах и организациях.

Ожидаемая общественная значимость НИР

Издание монографии и подготовка практических рекомендаций на основе обобщения результатов многолетних исследований будут способствовать распространению знаний о теоретически обоснованных и экспериментально проверенных методах и методиках выявления, активизации и развития уровня одаренности и интеллектуального потенциала, в первую очередь, молодежи в Республике Татарстан и любом другом регионе РФ. Результаты представляются особенно важными в периоды модернизации и развития различных общественных сфер (экономическая, политическая, социальная, культурная, образовательная и др.) государства.

В 2015 г. сотрудники института будут участвовать в выполнение ряда проектов, поддержанных фондами РФФИ и РГНФ:

1.  Грант РФФИ «Разработка математических моделей и методов визуализации корпусных данных», рук.

2.  Грант РФФИ «Разработка комплексных моделей данных на основе ситуационного анализа текстов в задачах многоязычного поиска», рук.

3.  Грант РФФИ мол. «Разработка структурно-концептуальной модели цветообозначений в тюркских языках для лексикографической базы данных», рук.

4.  Грант РГНФ «Создание электронного ресурса по этнолингвистическим (диалектно-фольклорным) материалам татарского языка», рук.

5.  Грант РГНФ «Моделирование лексико-семантической системы татарских глаголов в технологии Wordnet», рук.

3. Научно-организационная работа

3.1. Организация научной деятельности

В 2015 году научно-организационная деятельность института будет осуществляться в формах, предусмотренных Положением института, а именно в подразделениях института - отделах «Интеллектуальные информационные системы» (нач. отдела к. т.н. ) и отдел «Когнитивные исследования» (нач. отдела к. ф.-м. н. ).

Исследования по тематике грантов будут выполняться на организационной основе временных трудовых коллективов.

Для организации и управления процессом научной деятельности в институте планируется проводить следующие мероприятия:

- регулярные заседания Ученого Совета института;

- научные и научно-методические семинары института (ежемесячно);

- научные семинары отделов (2 раза в месяц);

- научные семинары по тематике грантов.

Для организации и координации междисциплинарных исследований планируется работа городского семинара по прикладной семиотике (отв. , ученый секретарь института, в. н.с., к. филос. н.). Тематика городского семинара связана с фундаментальными и прикладными исследованиями в области семиотического и когнитивного моделирования.

В 2015 г. институт планирует выступить в качестве организатора ряда крупных международных научных мероприятий:

1.  Круглый стол «Современные лингвистические технологии» (совместно с фирмой ABBYY), 27 января 2015.

2.  Секция «Интеллект. Язык. Компьютер» в рамках итоговой конференции КФУ, 28 января 2015 г.

3.  Научно-практический семинар «Новые программные продукты: 1. Татарская локализация компьютерных систем и технологий 2. Татарский национальный корпус», 26 февраля 2015 г.

4.  Юбилейный научный семинар «Инфокоммуникационные системы и технологии в гуманитарной сфере», 26-27 марта 2015 г.

5.  II международный семинар (вебинар) по унификации грамматической аннотации корпусов тюркских языков Uniturk, 14 мая 2015 г.

6.  Международная конференция по компьютерной обработке тюркских языков Turklang -2015, 24-26 сентября 2015 г.

В 2015 г. институт планирует выступить в качестве соорганизатора ряда крупных международных научных конференций:

- Международная научно-техническая конференция «Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS-2015)» (19-21 февраля 2015 г., Минск).

В 2015 г сотрудники института планирует выступить в качестве докладчиков в работе ряда крупных международных научных конференций:

- Международная научно-техническая конференция «Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS-2015), 19-21 февраля 2015 г., Минск.

- 7th International Conference on Corpus Linguistic, 5-7 мая, Вальядолид, Испания;

- 17th International Conference on Speech and Computer SPECOM 2015 , 20-24 сентября 2015 г., Афины, Греция;

- Международная научная конференция «Корпусная лингвистика 2015», 22-26 июня 2015 г.

- Международная конференция по компьютерной лингвистике «Диалог – 2015» , июнь 2015 г., Московская область.

- VI Международная научно-практическая конференция “Сохранение и развитие родных языков в условиях многонационального государства: проблемы и перспективы” (Казань, октябрь 2015 г.) и др.

3.2.  Международные и межрегиональные научные связи

Институт планирует в 2015 году проведение ряда мероприятий, направленных на развитие научных связей института с Академиями наук, крупными научными центрами и университетами в форме подачи совместных заявок на гранты, организации совместных научных семинаров.

Планируется подготовка совместных заявок в научные фонды (РФФИ, РГНФ) с научными группами из ведущих научных центров и университетов России (Чувашский ГУ, МГУ, ИРЯ РАН и др.).

Участие сотрудников института с докладами на международных конференциях:

·  международная конференция Open Semantic Technologies for Intelligent Systems – OSTIS-2015 (Беларусь, Минск, февраль 2015);

·  V международная конференция по корпусной лингвистике, март, 2015, Испания.

4.Работа по обеспечению кадрами

4.1. Повышение квалификации кадров

В целях улучшения качественного состава научных кадров в 2014 году планируется работа по повышению квалификации научных сотрудников:

- представление докторской диссертации

4.2. Подготовка кадров

Институт имеет четыре базовые кафедры в КФУ (кафедра теоретической кибернетики, кафедра информационных систем, кафедра математической лингвистики и информационных систем в филологии, кафедра технологии программирования). В рамках учебных планов сотрудники института планируют чтение различных учебных курсов, руководство курсовыми и дипломными проектами по тематике института.

5.  Пропаганда научных достижений

Институт прикладной семиотики осуществляет научное руководство деятельностью Государственного учреждения Молодежный центр и ТРМОФ «Сэлэт». Институт курирует ряд направлений деятельности: «Сэлэт - Тел» - лингвистическое направление; «Сэлэт - Раушан» - интеллектуальное направление; «Сэлэт-Санак» - школа информационных технологий; «Сэлэт - Шэхес» - школа конкурентноспособной личности и др. Сотрудники института ведут постоянную научно-учебную деятельность в рамках Республиканской очно-заочной школы «Фәнсар – интеллектуальное созвездие», которая включает образовательные программы дополнительного общего образования для одаренных детей РТ.

Институт планирует в 2015 организацию и проведение ряда мероприятий совместно с Татарстанским Республиканским молодежным фондом «Сэлэт», ориентированных на активное привлечения молодёжи к научным исследованиям:

- молодежный семинар «Бухараевские чтения. Искусственный интеллект: теория и практика» (совместно с ТРМОФ «Сэлэт»), 31 июля 2015.

- международный молодежный образовательный форум «Сэлэт» (совместно с ТРМОФ «Сэлэт», Министерством по делам молодежи и спорту РТ, Министерством образования и науки РТ), 9-16 июля 2015.

- чтение лекций по различным курсам;

- организация олимпиад для школьников РТ;

- организация и проведение профильных смен в летних лагерях;

- организация и проведение конкурсов, семинаров, летних школ для одаренных детей и молодежи.

Планируется пропаганда научных достижений и мероприятий Института через СМИ, а также проведение тематических презентаций с демонстраций программной продукции Института.

6.  Публикации

В 2015 году планируются следующие основные публикации научных сотрудников по бюджетной тематике:

·  Подготовка и издание коллективной монографии «Когнитивно-семиотические аспекты моделирования в гуманитарной сфере».

·  Издание монографии по теоретическому и экспериментальному исследованию феномена одаренности и оценки интеллектуального потенциала личности и молодежных сообществ (авторы , ).

·  Подготовка рукописи книги воспоминаний (совместно с Институтом энциклопедии АН РТ).

·  Подготовка научных статей для публикации в рецензируемых журналах – 9;

·  Подготовка научных статей для публикации в материалах международных конференций – 13.

·  Планируется подать 2 заявки на регистрацию новых разработанных программных продуктов.

7.  Материально-техническое обеспечение

В 2015 году планируется осуществить ряд мероприятий по плану развития материально-технической базы института, который планируется обеспечить за счет отчислений с поддержанных научными фондами грантовских проектов.

8.  Социальная защита

Оплата труда сотрудников института производится по установленным разрядам, с учетом занимаемой должности, ученой степени и ученого звания. Дополнительными источниками увеличения заработной платы сотрудников являются научные исследования, проводимые по грантовским проектам.

В 2015 году институт планирует осуществлять эффективную научно-техническую политику коммерциализации разработанных программных продуктов и информационных ресурсов.