С. Д. КУЛИК, К. И. ТКАЧЕНКО, И. А. ЛУКЬЯНОВ
Национальный исследовательский ядерный университет «МИФИ»
АВТОМАТИЧЕСКАЯ ГЕНЕРАЦИЯ И РАНЖИРОВАНИЕ
ГИПОТЕЗ В ЗАДАЧЕ ИЗВЛЕЧЕНИЯ ИНФОРМАЦИИ
ИЗ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ
Предложен метод автоматической генерации гипотез для процесса извлечения информации из текстов на естественном языке. Предложен метод ранжирования наборов гипотез. Порождение гипотез строится на результатах морфологического анализа предложений на естественном языке. Оценка ранга гипотезы основана на вероятности существования конкретной гипотезы и вероятностях возникновения аналогичных гипотез. Так же учитывается статистическая информация об употреблении слов, образующих сущности и отношения. Приведены формулы, описывающие предложенные методы. Приведены данные, полученные средствами программного обеспечения, реализующего предложенные методы.


