Е. И. ЯКОВЕНКО
Научный руководитель – Н. В. МАКСИМОВ, д. т.н., профессор
Национальный исследовательский ядерный университет «МИФИ»
ИССЛЕДОВАНИЕ ФРАКТАЛЬНЫХ СВОЙСТВ ТЕКСТА
Построена и проверена гипотеза о фрактальности свойств текста. Для проверки гипотезы был проведён морфологический анализ словосочетаний документальных баз данных. На основе этого анализа была получена статистика конструкций словосочетаний, а также было подсчитано количественное значение признаков, возникающих у объекта при добавлении нового слова к уже готовой конструкции. Выведены формулы для нахождения размерности текста.
Фрактальность языка предполагает в нем наличие самоподобия и рекурсии [1]. В связи с этим была построена и экспериментально проверена гипотеза о фрактальной структуре текста.
Экспериментальная проверка заключалась в следующем:
1) был проведён морфологический анализ словосочетаний;
2) были изучены конструкции словосочетаний и принцип их построения;
3) были посчитаны количественные значения возникающих признаков объекта в зависимости от части речи добавленного слова, а также выведены математические формулы для нахождения размерностей словосочетаний.
Рассматриваются словосочетания, построенные на связи главного/зависимого слова со словами, являющимися следующими 5 частями речи: качественное прилагательное, относительное прилагательное, притяжательное прилагательное, причастие и существительное. Главное слово в словосочетании всегда существительное. На начальном уровне словосочетание состоит из двух слов, причём зависимые слова-все 5 рассматриваемых частей речи. Количество признаков объекта (N) , возникающих на каждом уровне словосочетаний (значение уровней словосочетаний соответствует количеству зависимых слов) находится в следующем интервале: 0≤ N ≤3.
На втором уровне словосочетаний все слова, выраженные 5 рассматриваемыми частями речи, кроме существительного, конкретизируют образ объекта, то есть новое добавленное слово сочетается с предыдущим, а не самим объектом, выраженным именем существительным. На следующих уровнях не все ново-добавленные слова сочетаются с предыдущими и конкретизируют образ объекта - количество признаков в некоторых случаях N=0.
Так как не всегда при добавлении части речи появляются новые признаки всего объекта в целом, то были выведены 2формулы для нахождения размерности текста на каждом уровне. За основу данных формул взята формула связи размерности с мерой и длиной (её частный случай – фрактальная размерность Минковского) – M = LD, где M – мера,
L –размер, D – размерность.
1)![]()
, где N - количество словосочетаний, в которых при добавлении новых частей речи появляются признаки у всего объекта (образа) в целом; ![]()
-дробная размерность таких словосочетаний.
0≤ N ≤3
2) ![]()
,где M – количество словосочетаний, в которых при добавлении новых частей речи (т. е. при расширении словосочетания) не появляются признаки у всего объекта в целом, признаки появляются только у отдельного объекта; ![]()
-дробная размерность таких словосочетаний. Так как в работе рассматривается добавление 5частей речи, то ![]()
=1/5.
M=5-N, следовательно, 2≤M≤5.
Итоговое значение размерности - среднее значение всех фрактальных размерностей, т. е. D= ![]()
.
На основе проделанного исследования можно сделать вывод о том, что гипотеза о фрактальной структуре текста верна, и применение математической формулы для нахождения фрактальной размерности применима к размерности текста естественного языка.
Список литературы
, Фрактальность в русском языке. // url: htpp://www. tipl-vrn. ru›…vrn…publication/fractality…russian…


