Сравнительная славянская фразеология (корпусное исследование)

Санкт-Петербургский государственный университет

Санкт-Петербург

В статье рассматриваются устойчивые сочетания разного типа и показываются способы их количественной оценки. Изучение сочетаемости слов является одной из главных задач лингвистики. Синтагматические отношения связывают языковые единицы, находящиеся в линейном контакте друг с другом. Их комбинаторная способность является проявлением целого ряда лингвистических законов или закономерностей. Явное отражение это явление нашло в выделении устойчивых сочетаний, которые являются главным объектом фразеологии, и в создании словарей устойчивых словосочетаний. Статья посвящена изучению устойчивых идиоматических сочетаний различного типа в русском, чешском и словацком языках. Корпусная лингвистика понимает устойчивые сочетания как статистически предопределенные единства. Этот подход – основа различных автоматических способов извлечения идиоматических и других устойчивых словосочетания из текста. Описаны эксперименты, в ходе которых на материале корпусов русского, чешского и словацкого языка и инструментов корпусной лингвистики, таких как Sketch Engine и NoSketch Engine, было показано, как с помощью корпусных методов можно расширить состав словарных статей в фразеологических и толковых словарях и как можно количественно оценить употребительность и устойчивость словосочетаний.