АКАДЕМИЯ НАУК РЕСПУБЛИКИ ТАТАРСТАН Институт ПРИКЛАДНой СЕМИОТИКи | |
СОГЛАСОВАНОакадемик-секретарь отделения АН РТ, академик АН РТ _____________ “____” ________________2015 г. | УТВЕРЖДАЮглавный ученый секретарь АН РТ, член-корреспондент АН РТ _______________ “____” _______________2015 г. |
планНАУЧНОЙ ДЕЯТЕЛЬНОСТИ Института ПРИКЛАДНой СЕМИОТИКи нА 2015 годДиректор института | |
Казань-2015 |
Содержание
Введение
1.Научно-исследовательская работа*
2. Научно-организационная работа
2.1.Организация научной деятельности
2.2 Международные и межрегиональные научные связи
3. Работа по обеспечению кадрами
3.1 Подготовка кадров
3.2. Повышение квалификации кадров
4. Пропаганда научных достижений
5. Публикации
6. Материально-техническое обеспечение
7. Социальная защита
8. Приложения
Введение
Научная деятельность Института прикладной семиотики АН РТ в 2015 году будет осуществляться в соответствие с Положением института. Основными целями научной деятельности института являются проведение фундаментальных, поисковых и прикладных исследований в области семиотического моделирования, компьютерной и когнитивной лингвистики, образовательных технологий, исследование интеллектуального потенциала личности и организации.
Основная тематика научных исследований института в 2015 году сформирована в рамках основного научного направления «Когнитивные исследования и семиотическое моделирование в гуманитарной сфере» и связана с исследованиями в следующих областях:
· семиотическое моделирование в гуманитарной сфере и образовании;
· когнитивное моделирование в лингвистике;
· социально-когнитивные исследования интеллектуального потенциала организации, личности и общества.
В рамках направления фундаментальных исследований «Когнитивные исследования и семиотическое моделирование в гуманитарной сфере» (научный руководитель - ) определены следующие фундаментальные задачи:
1. Семиотические модели представления знаний.
2. Формальные модели и методы обработки текстов.
3. Когнитивные аспекты речевых технологий.
4. Социально-когнитивные исследования интеллектуального потенциала организации, личности и общества.
2. Научно-исследовательская работа
1. Тема «Семиотические модели представления знаний»
Тема 2015 года «Разработка лексикализованных ситуационно-реляционных моделей на основе глагольной семантики для тюркских языков».
Научный руководитель: , зав. отделом, к. т.н. Соисполнители: , к. ф.н., ,
Вид научных исследований: фундаментальные, прикладные.
Год начала и окончания работы над темой: 2011-2020
Документы, на основании которых проводится НИР: план научной деятельности ИПС на 2015 г.
Источник финансирования НИР: бюджет АН РТ
Оргформа проведения НИР: штатный состав научных работников.
Научная проблема
Одной из важных проблем языкознания, связанных со значением и отражением мира в языковых единицах, является осмыслении роли глагола как способа концептуализации и категоризации фрагментов процессуально-событийного мира. Семантика глагола не только номинативна, но и реляционна, что требует оптимальной интеграции разных исследовательских приемов при описании глагольной семантики с учетом как сигнификативных, так и синтагматических компонентов значения. Предполагается описание логических отношений между предикатом и его потенциальными актантами для глаголов разных семантических классов; поиск оптимального способа связывания описаний сигнификативных значений глаголов разных классов и их валентностных свойств; разработка и заполнение баз данных глагольной лексики для различных лингвистических приложений.
Для тюркских языков сохраняется актуальной задача систематизации лингвистических моделей представления значения лексем и единиц более высокого уровня (предложений и словосочетаний), выделение множества семантических универсалий для категоризации семантических значений лингвистических объектов на основе общих принципов разрабатываемого направления системно-функционального анализа семантики. Исследования по разработке подхода к моделированию семантики на основе аппарата объектно-предикативных схем развиваются в институте с 2011 года.
Целью исследований 2015 года являются:
1. Семантические исследования лексико-семантических групп глаголов татарского языка (1500 лексем) для построения моделей ситуаций на основе аппарата объектно-предикатных схем, а также структурно-функциональных моделей морфем в тюркских языках. Реализация моделей морфем в виде баз данных и разработка специализированного программного инструментария для построения и применения модели морфем.
Задачи исследования:
1. Семантическая классификация татарских глаголов, выделение глаголов различных семантических групп, корректировка состава ранее выделенных лексико-семантических групп (ЛСГ) глаголов;
2. Анализ синтаксической валентности глаголов различных ЛСГ, выделение компонентов значения глаголов, релевантных для семантической и синтаксической организации словосочетания и предложения; анализ диатезы и актантной деривации для глаголов различных ЛСГ.
3. Разработка структурно-функциональной модели тюркской морфемы, как лингвистической базы данных для лингвопроцессоров.
4. Разработка баз данных моделей и программного инструментария для их заполнения и использования.
Ожидаемые научные результаты
- Структурированная модель лексико-семантических групп глаголов татарского языка;
- Лингвистическая база данных татарских глаголов (1500 лексем);
- Лингвистическая база данных тюркских морфем.
Ожидаемая научная продукция
Статьи в рецензируемых журналах – 4.
Статьи в материалах конференций – 4.
Ожидаемая практическая значимость результатов
Базовый состав лингвистических ресурсов для семантического аннотирования татарских и тюркских текстов используется в широком спектре прикладных задач компьютерной лингвистики, в частности, при анализе текстов, в задачах машинного перевода и др.
2. Тема «Формальные модели и методы обработки текстов»
Научный руководитель: , зам. дир. к. т.н.
Подтема 1 «Формальные модели разрешения многозначности в текстах»
Соисполнители: , ,
Подтема 2 «Формальные модели и методы разработки лексикографических систем»
Соисполнители: ,
Вид научных исследований: фундаментальные, прикладные
Год начала и окончания работы над темой: 2012-2020
Документы, на основании которых проводится НИР: план научной деятельности ИПС на 2015 г.
Источник финансирования НИР: бюджет АН РТ
Оргформа проведения НИР: штатный состав научных работников
Научная проблема
Центральной проблемой интеллектуального анализа текстов является проблема разрешения многозначности. Многозначность слова традиционно в лингвистике рассматривается в различных аспектах. Полисемия (лексическая многозначность) связывается с различными семантическими значениями слова. Омонимия (лексико-грамматическая или функциональная многозначность) проявляется на уровне грамматической формы слова (т. е. различные слова имеют тождественную форму). Морфологическая омонимия рассматривается на уровне словоформ в одной парадигме слова. Структурная (синтаксическая) многозначность появляется на уровне синтаксических связей словосочетаний. Морфемный уровень текста связан с многозначностью морфем в составе слова. Словообразовательная омонимия рассматривает различные семантические значения морфем в составе слова (приставки, корни, суффиксы, окончания).
К настоящему времени сформирована основная парадигма методов снятия многозначности, которая включает методы, основанные на правилах; методы машинного обучения, использующие вероятностные модели; гибридные методы. Исследования многозначности для тюркских языков (и особенно для татарского) проводятся фрагментарно и весьма актуальными являются построение формальных моделей и методов разрешения многозначности для татарского и русского языков.
В 2015 году исследования по теме будут связаны с дальнейшей разработкой формальных моделей разрешения грамматической многозначности морфем и омонимов, а также прикладных программных продуктов для разрешения многозначности в текстах.
Будут продолжены работы по созданию программного инструментария для исследования, автоматического разрешения грамматической омонимии в татарском языке, в том числе:
1) Доработка, расширение функциональных возможностей программного модуля для создания, редактирования, тестирования базы контекстных правил (количество правил должно быть достаточным для снятия не менее 85% морфологической многозначности),
2) Доработка программного модуля автоматического разрешения грамматической омонимии на основе базы контекстных правил (не менее 80% снятой морфологической многозначности)
3) Исследование грамматической омонимии с использованием гибридных методов, совмещая метод контекстного анализа и вероятностные модели с целью повышения процента разрешения многозначности до 95%.
4) Статистическое исследование татарского корпуса. Построение жанровой классификации текстов корпуса на основе методов машинного обучения.
Другое направление исследований касается разработки формальных моделей и методов проектирования лексикографических систем. Планируется заполнение и тестирование грамматических компонент русско-татарской лексикографической базы данных, а также заполнение семантических компонент лексикографической базы данных.
В качестве основных методов разрешения неоднозначностей планируется использовать методы, основанные на правилах, а также статистические методы, использующие частотные характеристики употребления лексических единиц.
Планируется исследовать контекстные ограничения в различных типах омоформ, разработать правила разрешения многозначности на основе обнаруженных контекстных ограничений для татарского и русского языков.
Ожидаемые научные результаты
- Классификация типов грамматической омонимии и контекстных правил разрешения грамматической омонимии для 60 типов в татарском языке.
- Позиционная модель грамматической аннотации русской компоненты русско-татарской лексикографической базы данных.
- Методы разрешения грамматической омонимии для татарского языка на основе контекстных правил.
Ожидаемая научная продукция
1. Экспериментальная версия русско-татарской лексикографической базы данных объемом 40000 параллельных пар лексем с грамматическими аннотациями (программный продукт на электронном носителе).
2. Статьи в рецензируемых журналах – 3.
3. Статьи в материалах конференций - 4.
4. Свидетельство регистрации экспериментальной версии русско-татарской лексикографической базы данных – 1.
Ожидаемая практическая значимость результатов
Экспериментальная русско-татарская лексикографическая база данных представляет практическую ценность в компьютерных приложениях, и как самостоятельный лингвистический ресурс с развитыми моделями описания лексики.
Тема 3. Когнитивные аспекты речевых технологий
Тема 2015 года «Разработка моделей аннотаций текстовых и речевых данных на татарском языке для систем автоматического анализа речи».
Научный руководитель: , д. т.н.
Соисполнитель: , н. с.
Вид научных исследований: фундаментальные, прикладные
Год начала и окончания работы над темой. 2014-2018.
Документы, на основании которых проводится НИР: план научной деятельности ИПС на 2015 г.
Источник финансирования НИР: бюджет АН РТ
Оргформа проведения НИР: штатный состав научных работников.
Наиболее перспективными подходами в области автоматического распознавания и синтеза речи являются подходы, базирующиеся на построении моделей различных уровней: акустического, морфологического, синтаксического. Данные модели строятся на основе аннотированных баз данных текстовой и речевой информации. Используемая система разметки таких баз данных определяет характер и объём информации, который может быть в дальнейшем использован при построении автоматизированных систем анализа речи.
Таким образом, задача создания набора тегов и правил их расстановки является ключевой на этапе создания корпусов данных, и во многом определяет качество работы систем распознавания и синтеза речи. Для татарского языка на этапе в настоящее время создаются большие текстовые и речевые базы данных, и задача их аннотирования является крайне актуальной.
Общая характеристика (цели, задачи, предмет исследования, методы работы)
Целью данного исследования является создание систем разметки текстовых и речевых баз данных для систем автоматического анализа речи. Для достижения поставленной цели предлагается решить следующие задачи:
1. Выявление характеристик (параметров аннотирования) в речевом корпусе для системы распознавания татарской речи.
2. Выявление характеристик (параметров аннотирования) в текстовом корпусе для улучшения качества работы синтезатора татарской речи.
3. Определение структуры систем разметки текстового и речевого корпусов.
4. Создание систем разметки: определение набора тегов и правил их расстановки.
5. Оценка влияния системы аннотирования речевого корпуса на качество работы параметрического синтезатора татарской речи.
Предмет исследования: аннотирование текстовой и речевой информации на татарском языке для систем автоматического анализа речи.
Ожидаемые научные результаты
Модели аннотирования текстовой и речевой информации на татарском языке для систем автоматического анализа речи.
Аннотированный татарский речевой корпус.
Ожидаемая научная продукция (доклады, статьи, разделы монографии, отчеты НИР, разработка методологии, методики и т. д.)
По результатам исследований предполагается подготовить 2 статьи, а также получить свидетельство регистрации на аннотированный татарский речевой корпус.
Тема 4. Социально-когнитивные исследования интеллектуального потенциала личности и организаций
Тема на 2015 год: Социально-когнитивная методика оценки интеллектуального потенциала и его составляющих – образовательного, инновационного, духовно-деятельностного и культурного компонентов (практическая реализация).
Научный руководитель: , в. н.с., к. х.н.
Соисполнитель: , н. с.
Задачи: Продолжение работы над рукописью монографии, подготовка к изданию и публикация монографии, подготовка практических рекомендаций по системе оценки интеллектуального потенциала и его составляющих для различных структур на региональном уровне.
Тема 2: Изучение научного наследия (на основе архивных материалов) ученых – академиков и . Подготовка электронного архива научных трудов и документов из личной коллекции ученых.
Соисполнитель:
Задачи: 1) Разработка контента и программная реализация Виртуального музея-библиотеки академика (продолжение) – раздел ВМБ «периодические издания», «Махмутовские чтения» и Форум.
2) Подготовка к изданию и публикация монографии «Мир ислама» (совместно с Институтом востоковедения и международных отношений КФУ).
3) Создание музейной комнаты с постоянно действующей экспозицией на базе Института востоковедения и международных отношений КФУ.
4) Подготовка к изданию книги воспоминаний (совместно с Институтом энциклопедии АН РТ).
5) Разработка контента и программная реализация Виртуального музея-библиотеки академика – первичная подготовка электронных архивных фото-, видеоматериалов (совместно с , , сотрудниками библиотеки АН РТ)
Вид научных исследований: фундаментальные, прикладные
Документы, на основании которых проводится НИР: план научной деятельности ИПС на 2015 г.
Источник финансирования НИР: бюджет АН РТ
Орг. форма проведения НИР: штатный состав научных работников.
Научная проблема
Долгосрочная цель – содействие повышению интеллектуального потенциала региона путем организации системных исследований по оценке, измерению и прогнозу развития интеллектуального потенциала на различных уровнях.
Цель исследования 2015 года – повышение эффективности оценки ИП и его составляющих путем внедрения результатов теоретических и экспериментальных исследований и методик в практику в виде монографии и практических рекомендаций для организаций различного типа.
Ожидаемые научные результаты
- Обобщение многолетних теоретических и экспериментальных исследований феноменов одаренности, мышления и социально-когнитивных параметров интеллектуального потенциала общества, организации и личности в виде монографии.
- Сравнительный анализ и систематизация методик оценки интеллектуального потенциала на различных уровнях и разработка практических рекомендаций по оценке ИП с позиций оценки когнитивной и личностной составляющей ИП для молодежных сообществ и организаций различного типа.
Ожидаемая научная продукция
- Практические рекомендации (в виде рукописи) по оценке ИП с позиций когнитивной и личностной составляющей ИП для молодежных сообществ и организаций различного типа.
- Монография по результатам теоретического и экспериментального исследования феноменов одаренности, мышления и оценки интеллектуального потенциала на различных уровнях (15п. л.)
- Научные статьи в журналы – 2, тезисы международной научной конференции – 1, российской конференции – 1, региональной конференции – 1.
Ожидаемая практическая значимость результатов
Внедрение результатов теоретических и экспериментальных исследований по оценке одаренности, мышления и интеллектуального потенциала на различных уровнях. Прогнозирование уровня развития ИП в формальных и неформальных сообществах и организациях.
Ожидаемая общественная значимость НИР
Издание монографии и подготовка практических рекомендаций на основе обобщения результатов многолетних исследований будут способствовать распространению знаний о теоретически обоснованных и экспериментально проверенных методах и методиках выявления, активизации и развития уровня одаренности и интеллектуального потенциала, в первую очередь, молодежи в Республике Татарстан и любом другом регионе РФ. Результаты представляются особенно важными в периоды модернизации и развития различных общественных сфер (экономическая, политическая, социальная, культурная, образовательная и др.) государства.
В 2015 г. сотрудники института будут участвовать в выполнение ряда проектов, поддержанных фондами РФФИ и РГНФ:
1. Грант РФФИ «Разработка математических моделей и методов визуализации корпусных данных», рук.
2. Грант РФФИ «Разработка комплексных моделей данных на основе ситуационного анализа текстов в задачах многоязычного поиска», рук.
3. Грант РФФИ мол. «Разработка структурно-концептуальной модели цветообозначений в тюркских языках для лексикографической базы данных», рук.
4. Грант РГНФ «Создание электронного ресурса по этнолингвистическим (диалектно-фольклорным) материалам татарского языка», рук.
5. Грант РГНФ «Моделирование лексико-семантической системы татарских глаголов в технологии Wordnet», рук.
3. Научно-организационная работа
3.1. Организация научной деятельности
В 2015 году научно-организационная деятельность института будет осуществляться в формах, предусмотренных Положением института, а именно в подразделениях института - отделах «Интеллектуальные информационные системы» (нач. отдела к. т.н. ) и отдел «Когнитивные исследования» (нач. отдела к. ф.-м. н. ).
Исследования по тематике грантов будут выполняться на организационной основе временных трудовых коллективов.
Для организации и управления процессом научной деятельности в институте планируется проводить следующие мероприятия:
- регулярные заседания Ученого Совета института;
- научные и научно-методические семинары института (ежемесячно);
- научные семинары отделов (2 раза в месяц);
- научные семинары по тематике грантов.
Для организации и координации междисциплинарных исследований планируется работа городского семинара по прикладной семиотике (отв. , ученый секретарь института, в. н.с., к. филос. н.). Тематика городского семинара связана с фундаментальными и прикладными исследованиями в области семиотического и когнитивного моделирования.
В 2015 г. институт планирует выступить в качестве организатора ряда крупных международных научных мероприятий:
1. Круглый стол «Современные лингвистические технологии» (совместно с фирмой ABBYY), 27 января 2015.
2. Секция «Интеллект. Язык. Компьютер» в рамках итоговой конференции КФУ, 28 января 2015 г.
3. Научно-практический семинар «Новые программные продукты: 1. Татарская локализация компьютерных систем и технологий 2. Татарский национальный корпус», 26 февраля 2015 г.
4. Юбилейный научный семинар «Инфокоммуникационные системы и технологии в гуманитарной сфере», 26-27 марта 2015 г.
5. II международный семинар (вебинар) по унификации грамматической аннотации корпусов тюркских языков Uniturk, 14 мая 2015 г.
6. Международная конференция по компьютерной обработке тюркских языков Turklang -2015, 24-26 сентября 2015 г.
В 2015 г. институт планирует выступить в качестве соорганизатора ряда крупных международных научных конференций:
- Международная научно-техническая конференция «Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS-2015)» (19-21 февраля 2015 г., Минск).
В 2015 г сотрудники института планирует выступить в качестве докладчиков в работе ряда крупных международных научных конференций:
- Международная научно-техническая конференция «Открытые семантические технологии проектирования интеллектуальных систем = Open Semantic Technologies for Intelligent Systems (OSTIS-2015), 19-21 февраля 2015 г., Минск.
- 7th International Conference on Corpus Linguistic, 5-7 мая, Вальядолид, Испания;
- 17th International Conference on Speech and Computer SPECOM 2015 , 20-24 сентября 2015 г., Афины, Греция;
- Международная научная конференция «Корпусная лингвистика 2015», 22-26 июня 2015 г.
- Международная конференция по компьютерной лингвистике «Диалог – 2015» , июнь 2015 г., Московская область.
- VI Международная научно-практическая конференция “Сохранение и развитие родных языков в условиях многонационального государства: проблемы и перспективы” (Казань, октябрь 2015 г.) и др.
3.2. Международные и межрегиональные научные связи
Институт планирует в 2015 году проведение ряда мероприятий, направленных на развитие научных связей института с Академиями наук, крупными научными центрами и университетами в форме подачи совместных заявок на гранты, организации совместных научных семинаров.
Планируется подготовка совместных заявок в научные фонды (РФФИ, РГНФ) с научными группами из ведущих научных центров и университетов России (Чувашский ГУ, МГУ, ИРЯ РАН и др.).
Участие сотрудников института с докладами на международных конференциях:
· международная конференция Open Semantic Technologies for Intelligent Systems – OSTIS-2015 (Беларусь, Минск, февраль 2015);
· V международная конференция по корпусной лингвистике, март, 2015, Испания.
4.Работа по обеспечению кадрами
4.1. Повышение квалификации кадров
В целях улучшения качественного состава научных кадров в 2014 году планируется работа по повышению квалификации научных сотрудников:
- представление докторской диссертации
4.2. Подготовка кадров
Институт имеет четыре базовые кафедры в КФУ (кафедра теоретической кибернетики, кафедра информационных систем, кафедра математической лингвистики и информационных систем в филологии, кафедра технологии программирования). В рамках учебных планов сотрудники института планируют чтение различных учебных курсов, руководство курсовыми и дипломными проектами по тематике института.
5. Пропаганда научных достижений
Институт прикладной семиотики осуществляет научное руководство деятельностью Государственного учреждения Молодежный центр и ТРМОФ «Сэлэт». Институт курирует ряд направлений деятельности: «Сэлэт - Тел» - лингвистическое направление; «Сэлэт - Раушан» - интеллектуальное направление; «Сэлэт-Санак» - школа информационных технологий; «Сэлэт - Шэхес» - школа конкурентноспособной личности и др. Сотрудники института ведут постоянную научно-учебную деятельность в рамках Республиканской очно-заочной школы «Фәнсар – интеллектуальное созвездие», которая включает образовательные программы дополнительного общего образования для одаренных детей РТ.
Институт планирует в 2015 организацию и проведение ряда мероприятий совместно с Татарстанским Республиканским молодежным фондом «Сэлэт», ориентированных на активное привлечения молодёжи к научным исследованиям:
- молодежный семинар «Бухараевские чтения. Искусственный интеллект: теория и практика» (совместно с ТРМОФ «Сэлэт»), 31 июля 2015.
- международный молодежный образовательный форум «Сэлэт» (совместно с ТРМОФ «Сэлэт», Министерством по делам молодежи и спорту РТ, Министерством образования и науки РТ), 9-16 июля 2015.
- чтение лекций по различным курсам;
- организация олимпиад для школьников РТ;
- организация и проведение профильных смен в летних лагерях;
- организация и проведение конкурсов, семинаров, летних школ для одаренных детей и молодежи.
Планируется пропаганда научных достижений и мероприятий Института через СМИ, а также проведение тематических презентаций с демонстраций программной продукции Института.
6. Публикации
В 2015 году планируются следующие основные публикации научных сотрудников по бюджетной тематике:
· Подготовка и издание коллективной монографии «Когнитивно-семиотические аспекты моделирования в гуманитарной сфере».
· Издание монографии по теоретическому и экспериментальному исследованию феномена одаренности и оценки интеллектуального потенциала личности и молодежных сообществ (авторы , ).
· Подготовка рукописи книги воспоминаний (совместно с Институтом энциклопедии АН РТ).
· Подготовка научных статей для публикации в рецензируемых журналах – 9;
· Подготовка научных статей для публикации в материалах международных конференций – 13.
· Планируется подать 2 заявки на регистрацию новых разработанных программных продуктов.
7. Материально-техническое обеспечение
В 2015 году планируется осуществить ряд мероприятий по плану развития материально-технической базы института, который планируется обеспечить за счет отчислений с поддержанных научными фондами грантовских проектов.
8. Социальная защита
Оплата труда сотрудников института производится по установленным разрядам, с учетом занимаемой должности, ученой степени и ученого звания. Дополнительными источниками увеличения заработной платы сотрудников являются научные исследования, проводимые по грантовским проектам.
В 2015 году институт планирует осуществлять эффективную научно-техническую политику коммерциализации разработанных программных продуктов и информационных ресурсов.


