Form-frequency correspondence in adjectives: A cross-linguistic corpus approach [Корреляция между формой и частотностью прилагательных: кросс-лингвистический корпусный анализ]
Несмотря на то, что статус прилагательного обсуждается в литературе уже достаточно давно (см., например, [Chomsky 1970; Dixon 1982]), для исследователей эта область до сих пор остается проблемной. Прилагательные характеризуются значительной типологической вариативностью с точки зрения синтаксиса. Если в одних языках они обнаруживают преимущественно именные свойства, то в других они скорее ведут себя, как глаголы [Wetzer 1992, 1996]. Так, в языках первого типа прилагательные, выступающие в качестве предикатов, требуют глагола-связки, в то время как в языках второго типа они выступают в этой позиции без какого-либо дополнительного маркирования. Аналогичным образом прилагательные, выступающие в качестве определений, ведут себя в разных языках по-разному.
В настоящем исследовании решаются две задачи. Первая из них заключается в том, чтобы объяснить формальные свойства прилагательных в разных языках с опорой на гипотезу о наличии корреляции между формой и частотностью [Zipf 1935; Haspelmath 2008; Haspelmath et al. 2014; Haspelmath 2021]. Вторая задача заключается в том, чтобы протестировать эту гипотезу на материале различных языков, используя данные корпусов Universal Dependencies Corpora [Nivre et al. 2017], а также BCC Mandarin Corpus [Xun et al. 2016].
Согласно гипотезе о наличии корреляции между формой и частотностью, более частотные формы с меньшей вероятностью присоединяют дополнительные показатели. В области прилагательных эта гипотеза может быть сформулирована следующим образом. Во-первых, предполагается, что относительная частотность атрибутивного употребления прилагательного находится в отрицательной корреляции с вероятностью маркирования этого прилагательного при помощи релятивизатора; во-вторых, предполагается, что относительная частотность предикативного употребления прилагательного находится в отрицательной корреляции с вероятностью употребления этого прилагательного с глаголом-связкой. Выдвинутые предположения проверяются методом логистической регрессии на материале выборки из 84 языков, входящих в корпуса Universal Dependencies Corpora: эта база данных представляется подходящей для целей настоящего исследования, поскольку она содержит типологически последовательную аннотацию частеречной принадлежности единиц, а также синтактических контекстов, в которых они употребляются. Кроме того, я протестировала рассматриваемую гипотезу на материале корпуса BCC Mandarin Chinese Corpus, опираясь на частотность прилагательных. Результаты исследования подтверждают гипотезу о наличии корреляции между формой и частотностью.