Ольга Ляшевская, Егор Кашкин. "Расстояния" между семантическими ролями и их семантические карты.
Если представить себе, что в языке L1 граммема X выражается как "a1", а граммема Y - как "b1", и что в языке L2 граммема X выражается как "a2", а граммема Y -- тоже как "а2", то в типологической перспективе расстояние между граммемами X и Y можно посчитать как расстояние между векторами вида (а1, а2, b3, c4, c5, d6...) и (b1, a2, a3, c4, f5, d6...), в которых перечисляются способы выражения X и Y в упорядоченном списке языков. Иными словами, чем чаще по данным языков граммемы выражаются единообразно (ср. a2=a2, c4=c4, d6=d6), тем ближе расстояние между граммемами. Абсолютно так же можно посчитать расстояние между лексемами и другими языковыми единицами, в частности, между семантическими ролями.
В докладе будет представлен метод многомерного шкалирования и визуализации выражения семантических ролей в виде семантических карт, разработанный в Hartmann et al. 2014 на данных типологической базы моделей управления ValPal. Во второй части мы представим развитие этого метода применительно к данным о семантических ролях для русского языка, а также обсудим, почему может быть опасно делать далеко идущие выводы на "игрушечных", упрощенных выборках.


