Партнерка на США и Канаду по недвижимости, выплаты в крипто

  • 30% recurring commission
  • Выплаты в USDT
  • Вывод каждую неделю
  • Комиссия до 5 лет за каждого referral

В. Д. СОЛОВЬЕВ, Р. Ф. ФАСХУТДИНОВ

Казанский государственный университет

ВЫБОР МЕТРИКИ ДЛЯ ФИЛОГЕНЕТИЧЕСКИХ АЛГОРИТМОВ*

Рассматриваются различные метрики, используемые в филогенетических алгоритмов для классификации языков на материале базу данных “Языки мира”.

В работе [1] описана типологическая база данных “Языки мира” и первые результаты исследований на ее основе с применением различных математических методов для установления родства языков. В настоящей работе речь идет о новом для лингвистики классе методов – филогенетических алгоритмах, заимствованных из эволюционной биологии [2].

В силу большой сложности эволюции языков, непосредственное применение филогенетических алгоритмов не дало хороших результатов. В результате исследования сместились к разработке модифицированных алгоритмов и метрик, которые они используют. В [3] показано, что использование λ-метрики позволяет улучшить результаты.

Нами предложена новая метрика (s-метрика), выравнивающая плотность классифицируемых объектов в n-мерном пространстве признаков. Для проверки степени ее адекватности рассматриваемой задаче проведены тестовые эксперименты. Для этого выбрано 42 языка, представляющие все основные семьи языков из базы данных “Языки мира”, и к ним применены два наиболее популярных филогенетических алгоритма: UPGMA и NJ [2]. Для сравнения использовались различные метрики: Хемминга, λ-метрика, s-метрика и комбинация двух последних. Полученных генетические деревья сопоставлялись со стандартной классификацией языков, принятой в лингвистике, с помощью, как экспертных оценок, так и формальными методами – подсчитывалось расстояние Робинсона-Фоулдса между деревьями. Лучший результат дала s-метрика.

Список литературы

1.  Data Mining на материале базы данных “Языки мира” // Научная сессия МИФИ-2007. Сборник трудов, т.3. М.: МИФИ, 2007. С. 110-111.

2.  Semple C., Steel M. Phylogenetics. New York: Oxford University Press, 2003.

3.  Соловьев и методы лингвистической филогенетики // Труды конф. “Знания. Онтологии. Теории”. Новосибирск: ИМ СО РАН, 2007. С. 229-235.

* Работа выполнена при финансовой поддержке РФФИ, грант № а