Установление состава лексем
К выявлению состава единиц лексикона ведёт лексемный анализ. Этот термин введён здесь по аналогии с термином морфемный анализ, чтобы показать значительное сходство процедур в исследовательской работе с морфемами и словами как основными единицами морфологического уровня языка и вместе с тем обратить внимание на имеющиеся различия, связанные с тем, что слово одновременно принадлежит и морфологическому, и номинативному (лексическому) компонентам языковой системы.
Основные цели лексемного анализа заключаются, во-первых, в установлении границ между словом и морфемой, между словом и словосочетанием, линейных границ между словами (проблема отдельности слова), и, во-вторых, в установлении границ между словом и его вариантами (проблема тождества слова).
Процедура анализа включает в себя три этапа.
· сегментация высказывания на отрезки (лексы), которые соотносимы со словами (лексемами) как абстрактными, инвариантными единицами языковой системы, являясь их актуальными представителями (экземплярами) в высказывании;
· установление лексемного статуса выделенных лексов, т. е. определение того, какую лексему каждый данный леке репрезентирует, относятся ли два сравниваемых лекса к одной
лексеме (как её аллолексы) или являются реализациями двух разных лексем;
· инвентаризация лексем.
Трудности лексемного анализа обусловливаются тем, что слово (лексема) является одновременно и лексической, и грамматической единицей, в соответствии с чем в лексиконе языка оно может быть охарактеризовано как класс носителей лексических значений (семантем), или как класс (в другой терминологии) лек-сико-семантических вариантов слов, а в морфологической системе как класс грамматических видоизменений слова (словоформ).
При линейной репрезентации высказывание может выступать как последовательность слов вообще (лексем), как последовательность ЛСВ (слов-концептем), как последовательность словоформ. В силу этого речевой представитель слова оказывается соотнесён со словом-лексемой, с одним из лексико-семантичес-ких вариантов (носителем определённой семантемы), с одним из морфологических формообразующих вариантов (словоформой как носителем грамматического значения).
Отдельность слова в речи / тексте (слово в синтагматическом аспекте). Установить однозначно линейные границы слова (вернее, лекса как его речевой реализации) чрезвычайно трудно. Эти границы задаются системой соответствующего языка и определяются далеко неодинаково при использовании разных критериев.
Критериями делимитации (разграничения) слов могут быть:
Графический (орфографический) признак:
В этом случае говорится о графическом слове. Предполагается, что данное слово на письме отграничивается от предшествующего и последующего слов пробелами, но не содержит пробела внутри себя. Возражения: 1) Не все языки имеют письменность. 2) В ряде систем графики (например, в китайской) пробелы между иероглифами или группами иероглифов не используются. 3) Орфография во многих языках очень непоследовательна; ср., например, раздельное написание целостных слов: в открытую, во избежание.
Фонетические признаки:
В этом случае говорится о фонетическом (или фонологическом) слове. Его границы и границы графического слова могут не совпадать. Ниже характеризуются лишь некоторые из фонетических признаков.
- Наличие гортанной смычки в начале слов. Признак не абсолютен. Так, нем. слово может иметь гортанную смычку в начале (das 'Eis 'лёд'), но тот же признак может сигнализировать границу между префиксом и корнем (ver'eisen 'оледенеть').
Наличие одной акцентной вершины в слове. Возражения: 1) В слове может быть более одного ударения: трин'aдцатиэт'ажный. 2) Слово может быть неударным и примыкать в качестве проклитики к последующему или в качестве энклитики к предыдущему слову, входя в структуру так называемого акцентного слова: на_ст'ол, н'а_пол, ст'ал_бы. 3) Язык может не принадлежать к числу акцентных, как, например, французский. Здесь одно синтагматическое (и фразовое) ударение может объединить в единое акцентное целое большую группу слов: Je_ne_le_lui_ai_jamais_dit 'Я этого ему никогда не говорил'. Собственно говоря, в языках со свободным и подвижным словесным ударением количество акцентных вершин может свидетельствовать лишь о числе слов (практически знаменательных), но не о начальных или конечных их границах, и только в языках с неподвижным начальным или конечным ударением могут быть определены соответствующие границы слов.
- Наличие в слове гармонии гласных (например, в финно-угорских или тюркских языках). Но в венгерском языке гармония гласных не охватывает составляющих сложных слов: Buda-pest.
И к тому же явление гармонии гласных не сигнализирует межсловных границ.
Морфологический признак:
Цельнооформленность слова (наличие единого показателя грамматической формы). На основе этого признака иван-чай признаётся одним словом (ср. иван-чая), а диван-кровать придётся рассматривать как сочетание двух слов (ср. дивана-кровати). Во фр. показатель мн. ч. может появиться и внутри: bonhomme 'добряк' — мн. ч. bonshommes, что противоречит ощущению целостности данного слова. Англ. Silver spoons 'серебрянные ложки' имеет единый показатель мн. ч., но вряд ли это образование можно признать единым словом. Межсловные границы этим признаком не сигнализируются.
Синтаксические признаки:
- Способность слова (в отличие от морфемы) самостоятельно вступать в синтаксические связи; ср. англ. Stone wall 'каменная стена' — stone-of-Carrara-wall 'стена из каррарского камня'; button shoes 'туфли с пуговицами' — red-button shoes 'туфли с красными пуговицами'.
- Способность выступать в качестве минимума предложения. Возражение: служебные слова в этом случае оказываются исключёнными из корпуса слов.
- Способность выступать в роли члена предложения. Возражение: из числа слов опять-таки исключаются служебные.
Возможность вставить слово между двумя словами (и вытекающая отсюда непроницаемость слова, невозможность вставить внутрь него другое слово): На лекцию пришли все. — На эту лекцию пришли все. Контрпримеры: В португ. между основой глагола и окончанием буд. времени может быть вставлено личное местоимение (dar-ei 'дать — 1 л. ед. ч. буд. времени' — dar-vos-ei '(я) вам дам'. В нем. языке так называемая отделяемая приставка наречного происхождения (собственно говоря, наречный компонент сложного глагола) не только может отрываться от глагольного компонента, но и допускает вставление слова или словосочетания между обоими компонентами: aufstehen 'вставать' — ich stehe auf 'я встаю' — ich stehe um sech Urs auf 'я встаю в шесть часов'. Такой глагол ведёт себя то как цельнооформленное сложное слово, то как сочетание двух слов, часто обладающее свойствами фразеологизма. Ср., далее, рус. никем — ни с кем. Можно здесь видеть чередование слов синтагматических и парадигматических. Так, stehe auf представляет собой два синтагматических слова, auf stehen — одно синтагматическое слово, парадигматически же (т. е. в системе языка) мы имеем дело с одним словом. Таким же образом могут трактоваться так называемые аналитические формы слов (англ, am writing 'пишу', нем. Wird kommen 'придёт', фр. Ai dit 'сказал') и так называемые аналитические слова (англ. Pride oneself 'гордиться', нем. Sich erholen 'отдыхать', фр. s’enfuir 'убегать'): парадигматически каждая из этих единиц представляет собой целостное слово, синтагматически же каждая представлена двумя или более словами.
Признак непроницаемости слова, таким образом, не позволяет однозначно установить ни линейные словесные границы, ни количество выделенных слов. И контрпримеры из многих языков поневоле побуждают к допущению даже такой "еретической" мысли, что слова всё-таки членимы, что они обладают свойством "разрывности".
— Позиционный признак: переместимость слов внутри предложения: Профессор читает лекцию. — Профессор лекцию читает. — Читает профессор лекцию. — Читает лекцию профессор. - Лекцию профессор читает. — Лекцию читает профессор. Возражение: Перемещаются при перестановках собственно не всякие слова как таковые, а слова как носители синтаксических функций членов предложения (синтаксемы), т. е. знаменательные слова в сочетании со служебными. Ср. (здесь звёздочка * обозначает не-грамматичность соответствующей конструкции): На лекцию пришли все. — * На пришли лекцию все. — * На все пришли лекцию... (служебные слова "не обладают правом" на свободное перемещение). Правда, линейные границы во многих случаях благодаря этому признаку определяются однозначно.
Семантический признак:
Идиоматичность слова, что можно понимать трояко: 1) Идиоэтничность данного слова, принадлежность его именно данному языку и невозможность его точного, адекватного перевода на другие языки. 2) Немотивированность данного слова, невозможность установить его этимологическое значение. 3) Наличие целостного, "идиоматического" значения у слова, несводимость этого значения к сумме значений элементов, составляющих слово. Возражение по последнему пункту: Русское слово почтамт условно членимо, ибо его компонент -амт невоспроизводим в составе других сложных слов. В целом дефектная членимость присуща достаточно ограниченному множеству слов. К тому же большинство слов допускают морфемную (и, следовательно, линейную семантическую) декомпозицию.
Итак, ни один из рассмотренных здесь критериев сегментации речи на лексемные сегменты (лексы) не обладает достаточной диагностирующей силой, не оказывается абсолютным. Из них относительно большей надёжностью в установлении границ между словами в речи обладает признак позиционной подвижности. Остальные же признаки скорее могут служить приблизительному определению того, сколько слов содержится в анализируемом речевом отрезке.
|
Из за большого объема этот материал размещен на нескольких страницах:
1 2 3 4 5 |


