Е. И. ЯКОВЕНКО

Научный руководитель – Н. В. МАКСИМОВ, д. т.н., профессор

Национальный исследовательский ядерный университет «МИФИ»

ИССЛЕДОВАНИЕ ФРАКТАЛЬНЫХ СВОЙСТВ ТЕКСТА

Построена и проверена гипотеза о фрактальности свойств текста. Для проверки гипотезы был проведён морфологический анализ словосочетаний документальных баз данных. На основе этого анализа была получена статистика конструкций словосочетаний, а также было подсчитано количественное значение признаков, возникающих у объекта при добавлении нового слова к уже готовой конструкции. Выведены формулы для нахождения размерности текста.

Фрактальность языка предполагает в нем наличие самоподобия и рекурсии [1]. В связи с этим была построена и экспериментально проверена гипотеза о фрактальной структуре текста.

Экспериментальная проверка заключалась в следующем:

1)  был проведён морфологический анализ словосочетаний;

2) были изучены конструкции словосочетаний и принцип их построения;

3) были посчитаны количественные значения возникающих признаков объекта в зависимости от части речи добавленного слова, а также выведены математические формулы для нахождения размерностей словосочетаний.

Рассматриваются словосочетания, построенные на связи главного/зависимого слова со словами, являющимися следующими 5 частями речи: качественное прилагательное, относительное прилагательное, притяжательное прилагательное, причастие и существительное. Главное слово в словосочетании  всегда существительное. На начальном уровне словосочетание состоит из двух слов, причём зависимые слова-все 5 рассматриваемых частей речи. Количество признаков объекта (N) , возникающих на каждом уровне словосочетаний (значение уровней словосочетаний соответствует количеству зависимых слов) находится в следующем интервале: 0≤ N ≤3.

НЕ нашли? Не то? Что вы ищете?

На втором уровне словосочетаний все слова, выраженные 5 рассматриваемыми частями речи, кроме существительного, конкретизируют образ объекта, то есть новое добавленное слово сочетается с предыдущим, а не самим объектом, выраженным именем существительным. На следующих уровнях не все ново-добавленные слова сочетаются с предыдущими и конкретизируют образ объекта - количество признаков в некоторых случаях N=0.

Так как не всегда при добавлении части речи появляются новые признаки всего объекта в целом, то были выведены 2формулы для нахождения размерности текста на каждом уровне. За основу данных формул взята формула связи размерности с мерой и длиной (её частный случай – фрактальная размерность Минковского) – M = LD, где M – мера,
L –размер, D – размерность.

1), где N - количество словосочетаний, в которых при добавлении новых частей речи появляются признаки у всего объекта (образа) в целом; -дробная размерность таких словосочетаний.

0≤ N ≤3

2) ,где M – количество словосочетаний, в которых при добавлении новых частей речи (т. е. при расширении словосочетания) не появляются признаки у всего объекта в целом, признаки появляются только у отдельного объекта; -дробная размерность таких словосочетаний. Так как в работе рассматривается добавление 5частей речи, то =1/5.

M=5-N, следовательно, 2≤M≤5.

Итоговое значение размерности - среднее значение всех фрактальных размерностей, т. е.  D= .

На основе проделанного исследования можно сделать вывод о том, что гипотеза о фрактальной структуре текста верна, и применение математической формулы для нахождения фрактальной размерности применима к размерности текста естественного языка.

Список литературы


, Фрактальность в русском языке. // url: htpp://www. tipl-vrn. ru›…vrn…publication/fractality…russian…