П. В. БОЧКАРЁВ
Научный руководитель – ГУСЕВА А. И., д. т.н., профессор
Национальный исследовательский ядерный университет «МИФИ»
РАЗРАБОТКА ГРАФОВОЙ БАЗЫ ДАННЫХ ДЛЯ АНАЛИЗА ДЕЯТЕЛЬНОСТИ НАУЧНЫХ ОРГАНИЗАЦИЙ,
НАПРАВЛЕНИЙ И ШКОЛ
В настоящее время существует уже большое количество различных научных и социальных сетей для ученых, содержащие данные, с помощью которых можно получить информацию о научной деятельности. Для анализа, хранения и обработки большого количества таких неструктурированных данных решены средствами NoSQL. Работа выполнена при поддержке гранта РФФИ №15-07-08742
Для анализа деятельности научных организаций необходимо провести анализ учёных и их научных результатов. Научный результат может иметь разный тип (например, статья, монография, патент, диссертация и т. д.), содержать различные ключевые слова, относиться к конкретному УДК, иметь номера ISDN, ISBN, быть опубликованным на некоторую дату, в конкретном журнале (журнал, номер, издание). Кроме этого, научный результат имеет такие характеристики, как название, аннотацию и ссылку.
Основные характеристики людей это - возраст (дату рождения), полученное образование, степень и звание (если имеется). Также сюда можно отнести аффиляцию с организацией (название) и её местоположение (страна + город). Люди взаимодействует с научным результатом или его свойствами, совершая различные действия.
Так же, необходимо учитывать само научное направление и её фазу.
Исходя из этого, можно выделить сущности (вершины) Люди, Научный результат, Действия, Организации и Научное направление, которые связаны между собой, образуют полносвязный граф.
Такой полносвязный граф лучше всего представлять в виде семантической сети.
Преимущества семантических сетей:
1. обеспечивается возможность сцепления различных фрагментов сети;
2. возможные отношения между понятиями и событиями образуют достаточно небольшое и хорошо формализованное множество;
3. можно выделить из полной сети, представляющей все знания, некоторый участок семантической сети, который необходим в конкретном запросе.
Данная модель (Рис.1) была реализована с помощью графовых баз данных, такой как Neo4j.

Рисунок 1. Графовая база данных
Список литературы
1. Roussopoulos N. D. A semantic network model of data bases. — TR No 104, Department of Computer Science, University of Toronto, 1976.
2. Quillian, M. R. (1968). Semantic memory. Semantic information processing, 227—270.
3. Википедия. Свободная энциклопедия [Электронный ресурс] Семантическая сеть. Режим доступа: https://ru. wikipedia. org/wiki
4. Helpiks. org [Электронный ресурс] Модель семантических сетей. Режим доступа: http://helpiks. org/2-99885.html


