ОБЪЕДИНЕННОЕ ГУМАНИТАРНОЕ ИЗДАТЕЛЬСТВОКАФЕДРА РУССКОЙ ЛИТЕРАТУРЫ ТАРТУСКОГО УНИВЕРСИТЕТА
о проекте | анонсы | хроника | архив | публикации | антология пушкинистики | lotmaniania tartuensia | з. г. минц
ruthenia – 10 | personalia | сетевые ресурсы | дискуссии | независимые проекты на "рутении" | добрые люди

Статьи на случай: сборник к 50-летию Р.Г. Лейбова

 

НЕКОТОРЫЕ ПРИМЕНЕНИЯ КОРПУСНЫХ МЕТОДОВ К НАИВНОЙ ПОЭЗИИ

А. БОНЧ-ОСМОЛОВСКАЯ, Б. ОРЕХОВ

Но список бед и радостей конечен
и к повторенью всё имеет склонность.
Коль случай был статистикой замечен,
он обретает предопределённость.

(Автор с ником 23370900 на сервере stihi.ru)

Наивная поэзия (в отношении этого типа литературы термин стал более-менее общепринятым благодаря С. Ю. Неклюдову) сравнительно недавно оказалась в круге исследовательских тем. Границы явления и критерии отбора текстов в наивные дискуссионны (см. Неклюдов (ред.) 2001; Минаева, Жигарина (ред.) 2009). Бесспорно пока немногое: речь идет о творческой продукции непрофессиональных литераторов, создающих свои произведения с оглядкой на высокие образцы, но неспособных сочинить что-то равновеликое им по качеству.

Из-за своей принципиальной необозримости, которая напоминает открытость корпуса фольклорных текстов любой живой традиции, до сих пор к наивной литературе не применялись количественные методики. Наивная литература создается непрерывно и впечатляющими темпами, по своему объему она далеко обогнала литературу профессиональную, все то, что было создано за три века существования русской «высокой» поэзии. Однако наличие в интернете такого ресурса, как stihi.ru, на котором интересующий нас тип текстов представлен особенно широко, делает обращение к подсчетам не только возможным, но даже необходимым.

На июнь 2013 года на сайте stihi.ru зарегистрировано 507192 автора, которыми опубликовано 21457078 произведений. Эти цифры говорят прежде всего о том, что весь объем сосредоточенных на этом ресурсе текстов невозможно обработать вручную, а значит, просто необходимо искать пути для компьютерного анализа этого материала. Кроме того, мы вправе рассчитывать если не на полноту, то на репрезентативность представленной текстовой продукции.

Наша общая задача состояла в оценке различий в лексике наивной и высокой поэзии с помощью корпусных методов. Мы анализируем частотные списки, составленные на двух текстовых коллекциях: на собранном нами на сайте stihi.ru корпусе наивной лирики и на поэтическом подкорпусе Национального корпуса русского языка (НКРЯ). В роли контрольного материала выступил частотный словарь О. Н. Ляшевской и С. А. Шарова (Ляшевская, Шаров 2009).

Для работы мы в автоматическом режиме отобрали с сайта тексты объемом в 50 млн. словоупотреблений, принадлежащие 54428 авторам. Жанрово и тематически эти произведения слишком разнородны (а разнородность эту трудно описать из-за неразработанности самой жанровой классификации наивной литературы), чтобы любые подсчеты отразили хоть какую-то их специфику. Поэтому требовалось дополнительное ограничение материала.

Дальнейшее формирование выборки было осуществлено нами по методике, предложенной Р. Г. Лейбовым на докладе в Центре типологии и семиотики фольклора РГГУ 1.4.2013. Ее суть в следующем. На основе текстов поэтического подкорпуса НКРЯ нами составлен «эталонный» список биграммов; отобранные с сайта stihi.ru тексты также разложены на биграммы, которые сопоставлены с «эталонным» перечнем таким образом, чтобы для каждого наивного автора подсчитывался процент совпадений. В выборку попадали только те авторы, процент совпадений в текстах которых превышал 50 %, а из произведенного ими текста можно было получить не менее 20 биграммов. То есть в сфере нашего внимания оказывались только самые типические тексты, в которых установка на воспроизводство традиционных поэтических форм особенно сильна. В результате получилась выборка в 8359499 словоупотреблений, составленная из текстов 17375 авторов. При этом поэтический подкорпус НКРЯ на данный момент насчитывает 7933249 словоупотреблений.

Тексты были лемматизированы, то есть каждое слово приведено к своей словарной форме. Таким образом, в выборку наивного корпуса попала 88441 лемма. Частотный список этой выборки приведен в Приложении 1.

Ниже мы представим три разнородных исследовательских сюжета, которые стали для нас точками входа в тему количественного анализа наивной поэзии. Во-первых, мы рассмотрим верхнюю часть частотных списков лексики, во-вторых, прокомментируем некоторые случаи слов, демонстрирующих наибольшую разницу в позициях в этих в списках, в-третьих, дадим анализ распределения ста наиболее частотных существительных в трех частотных списках по семантическим доменам.

Сразу оговорим, что, что нашим основным инструментом является не абсолютная частотность, а ранг леммы в списке, упорядоченном по частотности в убывающем порядке: наиболее частотная лемма имеет ранг 1, следующая за ней 2 и т. д.

 

1. Верхняя часть частотного списка

Обычно верхняя часть списка самых частотных слов занята служебными частями речи: союзами, частицами, предлогами, а также вспомогательными глаголами и артиклями (конечно, если такие классы слов вообще имеются в языке). Первое значимое слово в таком перечне — это местоимение; для русского языка — местоимение «я».

В Приложении 2 приведены результаты сравнения частотных списков. В таблице 1 приводятся первые 20 позиций для перечня наиболее частотных слов наивной поэзии. В колонке с заголовком «∆» приведены данные о том, выше () или ниже () позиция (ранг) данного слова в частотном списке наивной поэзии по сравнению с частотником поэтического корпуса (∆1) и словарем Ляшевской—Шарова (∆2).

Таблица 1.

леммапозиция в списке
наивной поэзии
  ∆1  позиция в списке
поэтического корпуса
  ∆2  позиция в словаре
Ляшевской—Шарова
и1  =  1  =  1
я2    3    5
не3    4  =  3
в4    2    2
ты5    7    33
то6    5    23
что7    11    9
быть8    10    6
на9    6    4
как10    9    19
с11    8    8
мы12    13    18
а13    17    10
мой14    15    60
но15    14    16
так16    27    30
твой17    23    266
за18    22    24
любовь19    52    307
любить20    66    181
жизнь21    45    66

Если первую позицию во всех перечнях ожидаемо занимает союз «и», то уже со второго места начинаются различия. В наивной поэзии значимость местоимения «я» вырастает, оно обходит и высокочастотный предлог «в», и частицу «не», составляющие вместе с «и» первую тройку самых используемых русских слов. Особая роль «я» в поэзии, для которой характерно предельно личностное высказывание, была очевидна давно. Любопытно, что в наивной поэзии эта особенность проявляет себя даже сильнее, чем в поэзии высокой. Та же тенденция к росту видна и в употреблении местоимения «ты» — стандартного адресата лирического высказывания. Незначительно растет и множественный субъект «мы», в то время как «он», «она» и «они» падают. Притом «они» — довольно существенно, более чем на 20 позиций. Особое место занимают слова «любовь» и «любить». Их высокие позиции, по всей видимости, отражают массовые представления о том, что поэтическая речь par excellence тематически ориентирована прежде всего на любовные переживания. И хотя в нашей выборке встречаются и иные топики, любовная тема, безусловно, доминирует.

Если не считать глаголов «быть» и «становиться», входящих на правах связок в состав сказуемых, то ряд наиболее частотных предикатов в наивном частотнике выглядит так: любить, знать, мочь, хотеть, жить, сказать, забывать, понимать, давать, уходить. Почти все они (кроме «сказать» и «давать») демонстрируют тенденцию к росту в наивной поэзии по сравнению с обоими контрольными списками. Только глагол «сказать», активно участвующий в оформлении диалогов в художественной прозе, значительно выше в списке Ляшевской—Шарова, а «давать» незначительно (всего на две позиции) выше в частотном словаре высокой поэзии.

Самые частотные у наивных авторов существительные: любовь, жизнь, душа, сердце, день, глаз, мир, друг, ночь, свет. Почти все они (единственное исключение: день) тоже растут, демонстрируя более высокие позиции в частотнике наивной поэзии. По всей видимости, это должно сигнализировать о сужении лексического репертуара типической наивной поэзии и перераспределении функциональной нагрузки с менее частотных слов на уже имеющиеся характерные лексемы-поэтизмы. Иными словами, наивный автор идет не интенсивным, а экстенсивным путем: не стремится найти нетривиальное воплощение для своего творческого задания, а пользуется готовыми паттернами, усиливая их количественное присутствие в тексте.

 

2. Ранжирование по разнице в позициях и слова-маркеры

Выше мы говорили только о том, есть ли разница в позициях того или иного слова в частотнике наивной поэзии с одной стороны и частотниках высокой поэзии и Ляшевской—Шарова с другой. Однако гораздо более ценна информация о том, насколько велика эта разница и какие слова демонстрируют особенно существенные «выбросы» в ту или другую сторону. Если какое-то слово занимает позицию наверху одного списка и проседает в другом, это должно говорить о системном характере его употребления в текстах корпуса.

Мы ранжировали леммы по разнице в позициях в частотнике наивной поэзии и поэтического корпуса (см. Приложение 3 и Приложение 4). Выяснилось, что такие слова, которые находятся существенно выше в «высоком» списке, чем в списке наивных поэтов, интуитивно ощущаются как поэтизмы: око, взор, меж, уста, единый, мгла, дух, бездна. И напротив, слова, которые демонстрируют наибольший рост в списке наивных поэтов по сравнению со списком поэтического корпуса, это характерные «прозаизмы» из сферы вещного мира (фото, сигарета) и быта (проблема).

Первый факт нуждается в отдельном осмыслении. Несмотря на ожидаемое восприятие наивными поэтами традиционно-поэтического инструментария лексики, его часть оказывается, по-видимому, совершенно невостребованной. Притом, что наивные авторы явно ориентируются на классические образцы, наиболее архаичные особенности этих образцов отсеиваются и в конструируемый концепт поэтического не включаются. Механизм такого отбора чрезвычайно любопытен и должен быть исследован специально.

Довольно кучно в этом списке расположены и слова, связанные в поэтическом контексте с гражданским пафосом: труд, слава, единый, великий, народ. Патетика подобного рода интенсивнее участвует в текстах поэтов-классиков, нежели у наивных авторов. Ниже мы еще вернемся к «социальной лексике» в наивной литературе.

Внимательный взгляд также обнаруживает, что в верхней части второго списка (в котором перечислены слова, позиции которых в наивной поэзии существенно выше, чем в поэзии высокой, Приложение 4) находятся любопытные слова-маркеры, явно отличающие наивную поэзию от классической. Среди них, к примеру, лексема «мама» , которая действительно нехарактерна для традиционной поэтической речи. Так, по данным корпуса, русская поэзия избегает слова «мама» на протяжении всей первой половины XIX века. Непрофессиональные авторы напротив, используют эту лексему без ограничений, видя в ней знак традиционных семейных ценностей, однозначно признанных частью сферы поэтического. Аналогичная ситуация наблюдается в отношении анатомических слов «вена» и «нерв». Последнее употреблялось вплоть до начала XIX в. в значении близком к современному значению слова 'жилы':

Иссякают нужны соки,
Коими их полны нервы.
[Н. Е. Струйский. Стихи на себя (1790)]
Хлад по нервам разливается
[Г. П. Каменев. Граф Глейхен (1802)]

Затем с начала XIX века слово практически исчезает из поэтического лексикона, чтобы почти через три десятилетия вернуться уже в современном значении:

Сильнее тысячи громов
Он раздражительные нервы
Потряс невольно у стрелков.
[А. И. Полежаев. Царь охоты / «Куда ж, скажите мне, мятежною ватагой...» (1837)]

Такая сложная семантическая история ограничила потенциал слова «нерв» в эпоху «золотого века» русской поэзии, но в современной поэтической речи оно благодаря экспрессивной окраске и участию во фразеологических сочетаниях стало весьма востребованным.

Высокий ранг имеет и еще недавно воспринимавшееся как грубое слово «девчонка», уже ставшее вполне нейтральным для наивных авторов.

Обращает на себя внимание и настойчивость появления наверху ранжированного списка и лексики времени (момент, секунда). Это подводит нас к необходимости более подробного рассмотрения семантической составляющей частотной лексики: только так мы сможем понять, случайно попадание лексики времени в одну зону списка или за этим стоят какие-то системные соображения.

 

3. Семантические домены

Анализ значимой частотной лексики дает возможность строить гипотезы о наиболее характерных тематических паттернах, свойственных наивной поэзии, а также сравнивать их с семантическими коррелятами в частотниках высокой поэзии и общей лексики. Опираясь на список частотных существительных, мы можем реконструировать наиболее значимые темы наивной поэзии, оценить их лексическое разнообразие и соотнести полученные данные с лексическими рядами частотного списка высокой поэзии и частотного списка существительных современного русского языка.

Наш подход строится на классификации ста самых частотных существительных трех списков по условным семантическим категориям, далее мы называем их семантическими доменами. Некоторые существительные могут относиться сразу к нескольким доменам — это рабочее решение было принято для многозначных слов, которые, по нашим интуитивным оценкам, встречаются достаточно часто в нескольких значениях.

Было выделено двенадцать семантических доменов для ста частотных существительных наивной поэзии, еще один домен (социум) не встречается в списке наивной поэзии, но выделяется в списке частотных существительных поэтического корпуса и частотном списке русского языка. При разметке ста существительных общей лексики было выделено еще два домена, которым не нашлось соответствия среди ста наиболее частотных существительных поэтических корпусов: предметы (машина, книга, стол) и абстрактная лексика (вид, система, отношение, качество и пр.). Эти домены не будут рассматриваться в нашей статье.

Ниже представлены семантические ряды частотных лексем для каждого списка.

Человек (объединяет в себе лексику, использующуюся для характеристики человека — его качеств, внутренней жизни и анатомии)

Наивная поэзия: душа, красота, кровь, память, сердце, сила
Высокая поэзия: имя, дух, душа, красота, кровь, сердце, сила, ум
Частотный словарь русского языка: имя, душа, сила

Тело (части тела и жесты)

Наивная поэзия: взгляд, глаз, голова, голос, грудь, губа, крыло, лицо, нога, плечо, рука, тело, тень, улыбка
Высокая поэзия: глаз, голова, голос, грудь, крыло, лицо, нога, рука, тело, тень, улыбка
Частотный словарь русского языка взгляд, глаз, голова, голос, лицо, нога, рука

Эмоция (лексика, описывающая чувства)

Наивная поэзия: беда, боль, желание, кровь, любовь, мечта, надежда, радость, сердце, слеза, страсть, улыбка, чувство, чудо
Высокая поэзия: кровь, любовь, мечта, надежда, радость, сердце, слеза, страсть, страх, чувство
Частотный словарь русского языка: любовь, проблема

Сознание (лексика, характеризующая сознание человека в целом и его интеллектуальные действия)

Наивная поэзия: вера, мысль, память
Высокая поэзия: дума, мысль
Частотный словарь русского языка: мысль, решение

Экзистенция (лексика, определяющая существование человека и окружающего мира)

Наивная поэзия: бог, вера, время, дорога, жизнь, конец, край, красота, мир, память, покой, правда, путь, сила, смерть, смысл, судьба
Высокая поэзия: бог, время, жизнь, имя, конец, край, красота, мир, покой, правда, природа, путь, сила, смерть, судьба
Частотный словарь русского языка: бог, возможность, время, жизнь, имя, конец, мир, начало, порядок, процесс, путь, развитие, результат, сила, случай, условие, цель

Речь (лексемы, содержащие в себе указание на совершенное высказывание или его отсутствие)

Наивная поэзия: вопрос, голос, ответ, песня, сказка, слово, тишина
Высокая поэзия: голос, песня, речь, слово, тишина
Частотный словарь русского языка: взгляд, вопрос, голос, история, слово, статья, язык

Персонаж (обозначения людей)

Наивная поэзия: друг, женщина, мама, ребенок, человек
Высокая поэзия: брат, враг, друг, жена, мать, отец, поэт, ребенок, сын, царь, человек
Частотный словарь русского языка: друг, жена, женщина, мама, мать, отец, ребенок, человек

Событие (существительные, обозначающие конкретные и общие события в жизни человека)

Наивная поэзия: беда, встреча, любовь, прошлое, смерть, сон, шаг
Высокая поэзия: любовь, смерть, сон
Частотный словарь русского языка: любовь

Время (лексемы, означающие временной период)

Наивная поэзия: век, вечер, время, год, день, мгновение, миг, ночь, пора, прошлое, раз, утро, час
Высокая поэзия: век, вечер, время, год, день, миг, ночь, пора, раз, утро, час
Частотный словарь русского языка: век, вечер, время, год, день, месяц, минута, момент, ночь, пора, раз, час

Природа (лексика, использующаяся для описания явлений природы)

Наивная поэзия: весна, ветер, вода, волна, гора, дождь, звезда, земля, крыло, лист, море, небо, огонь, осень, птица, река, свет, снег, солнце, тень, тишина
Высокая поэзия: берег, весна, ветер, вода, воздух, волна, гора, звезда, звук, земля, камень, крыло, лес, море, небо, огонь, поле, природа, река, сад, свет, снег, солнце, тень, тишина
Частотный словарь русского языка: вода, земля, свет

География (лексика, служащая для локализации действия)

Наивная поэзия: город, дорога, земля, край
Высокая поэзия: город, дорога, земля, край, место, страна
Частотный словарь русского языка: город, дорога, земля, место, область, страна, улица

Дом (атрибуты домашнего пространства)

Наивная поэзия: дверь, дом, окно, стена
Высокая поэзия: дверь, дом, окно, стена
Частотный словарь русского языка: дверь, дом, комната

Социум (понятия, связанные с существованием человека в обществе)

Высокая поэзия: дело, народ, слава, труд
Частотный словарь русского языка: власть, война, государство, дело, деньги, деятельность, закон, история, компания, народ, общество, организация, право, президент, работа, суд, театр, школа, язык

Выделенные семантические домены неоднородны по своему составу. Некоторые из них оказываются весьма лексически богатыми, некоторые, напротив, представлены весьма скудно. Более того, несмотря на очевидные пересечения, только домен дом, включающий, впрочем, всего три слова, характеризуется полным пересечением лексических рядов из списков наивной и высокой поэзии. Наиболее интересными для исследования корпуса наивной поэзии являются семантические домены, которые по своему составу существенно отличаются от соответствующих им групп лексем, полученных из частотного списка высокой поэзии. Контрольный список из частотного словаря Ляшевской—Шарова помогает нам выявить области поэтического смещения в частотной лексике. Например, самая существенная по объему группа лексем из поэтических корпусов, связанная с описанием природы, оказывается практически непредставленной в списке ста наиболее частотных существительных русского языка. Кроме того, сравнение поэтических списков лексем с частотным словарем русского языка дает возможность выявить группы лексем, характеризующихся высокой частотностью в русском языке в целом. Иначе говоря, мы можем делать предположения о «поэтической разработанности» семантического домена в высоком и наивном поэтических корпусах. Так, например, весьма значимая группа существительных, определяющих временные периоды (13 лексем в списке наивной поэзии, 11 в списке высокой поэзии и 12 лексем в частотном списке русского языка), на самом деле в очень большой степени состоит из высокочастотной лексики: 9 существительных этого домена совпадают во всех трех списках.

Обобщенные сведения об общем и специфическом в семантических доменах каждого списка представлены в таблице 2.

Таблица 2.

  человек тело эмоция экзистенция сознание речь событие природа время география дом персонаж социум
общая лексика трех списков 2 6 1 7 1 2 1 3 9 3 2 3 0
общая лексика наивного и поэтического списка 3 5 8 6 1 2 2 14 2 1 2 0 0
общая лексика наивного списка и частотного списка русского языка 0 1 0 0 0 1 0 0 0 0 0 2 0
лексемы только из наивного списка 1 2 5 4 2 2 4 4 2 0 0 0 0
лексемы только из поэтического списка 2 0 1 1 1 1 0 8 0 0 0 5 2
всего в наивном списке 6 14 14 16 4 7 7 21 13 4 4 5 0
всего в поэтическом списке 8 11 10 15 2 5 3 25 11 6 4 11 4
всего в частотном списке русского языка 3 7 2 17 2 7 1 3 12 7 3 8 19

Как уже было сказано выше, нас интересуют домены, в которых в наибольшей степени проявляются собственные лексические тенденции наивной поэзии. На графике 1 демонстрируются области поэтического сдвига для высокой и наивной поэзии: кривая «общая лексика трех списков» показывает количество лексем домена, которые обнаруживаются как в поэтических списках, так и в списке высокочастотных существительных русского языка. Показатели кривых «лексика наивной поэзии» и «лексика высокой поэзии» отражают сумму количества общих для двух поэтических списков лексем, количество лексем, встречающихся в одном из поэтических списков и в списке словаря Ляшевской—Шарова, и количество лексем, свойственных только одному из поэтических списков.

График 1.

Таким образом, наиболее поэтически значимыми оказываются домены, в которых значения «поэтических кривых» оказываются выше показателей количества общих для трех списка лексем. Это эмоция и природа для двух поэтических списков, экзистенция, тело, речь и событие для наивной поэзии, персонаж и социум для высокой поэзии.

Безусловно, данные, свидетельствующие о поэтическом внимании к эмоциональной сфере человека и к природным явлениям, являются ожидаемыми, именно эта лексика служит для выражения лирического начала в поэзии. Совпадение частотных существительных, описывающих природу, в двух списках чрезвычайно высоко (14 лексем). Очевидно, в описаниях природы наивная поэзия в наибольшей степени ориентирована на повторение лексических паттернов высокой поэзии. Каноническая поэзия в сознании наивного читателя преимущественно посвящена явлениям природы и смене времен года. Отметим, в связи с этим частотность слова осень, характерную для наивной поэзии, но не свойственную более лексически богатому природному домену высокого поэтического корпуса, и отсылающего к программе по литературе младших классов школы. Занимательным, однако, является большее разнообразие частотной лексики, используемой для описания эмоций, в наивном корпусе. Пять существительных, отнесенных нами к рассматриваемому семантическому домену, являются высокочастотными только в стихах наивных поэтов — это боль, беда, желание, улыбка, чудо. Заметим, что беда, улыбка и чудо обозначают события в большей степени, чем эмоциональное состояние или же его некий метафорический атрибут (ср. совпадающие в двух поэтических списках лексем кровь, сердце, слеза). Тенденция замены именами глаголов в наивной поэзии становится еще более очевидна при рассмотрении лексического состава доменов речь и событие. Два существительных, отнесенных нами к семантическому домену речи, характеризуют жанр высказывания : песня — общее частотное слово двух поэтических корпусов, сказка — слово, частотное только в корпусе наивной поэзии. Возможно, впрочем, частотность сказки объясняется его широким использованием в метафорическом значении как синонима существительного чудо, расширяющим, таким образом, семантическую группу эмоций. Ср., например:

Вся моя жизнь была мечтой о сказке
И я не буду чувства углублять
Быть может, я теперь уже не буду
От одиночества бездонного страдать
[Т. Кваскова. И я попробую свою удачу]

Два существительных являются высокочастотной лексикой в целом, как можно увидеть из сравнения со списком частотного словаря, — это голос и слово. Существительное тишина часто встречается в обоих поэтических корпусах, и можно предположить, что в основном оно используется не для выражения отказа от высказывания, а как часть описания окружающей среды. Наконец, еще два слова, частотных только в корпусе наивной поэзии, — это вопрос и ответ. Если вопрос является высокочастотным словом в целом (но, заметим, не является таковым в поэтическом списке), то частое употребление лексемы ответ — свойство только наивной поэзии. Можно предположить, что в значимости этих двух лексем для наивной поэзии проявляется общая модель понимания авторами сути акта поэтической коммуникации: лирический герой наивного стихотворения задает миру свой вопрос и находит или не находит на него ответ. Возможно, этим объясняется и широкое использование существительных с предикативным значением: в фокусе вопроса оказывается эмоциональная оценка события, а не его протекание во времени. Эта гипотеза подтверждается лексической группой семантического домена события, демонстрирующего существенные различия поэтических списков. Кроме высокочастотного для русского языка существительного любовь, а также общих для поэтических корпусов существительных смерть и сон, в событийном наивном ряду присутствуют лексемы встреча, прошлое и шаг. Эти три существительных формируют своего рода видовую парадигму наивной поэзии — от наиболее обобщенного и недифференцируемого понимания событийного ряда (прошлое) до фазового компонента длящейся ситуации (встреча) и точечного завершенного действия (шаг):

Бегут секунды, минуты, года,
Событий сменяется череда,
И жизнь вся шагами измерена.
Шаг- это течение времени.
[Н. Солохина. Шаги]

Безусловно важным для понимания природы наивной поэзии являются области в ней более лексически скудные, чем в высокой поэзии. Таким является семантический домен, условно названный нами «персонаж», объединяющий в себе названия людей по их социальным ролям и семейным отношениям. В список наивной поэзии входят, кроме общеупотребительных лексем человек, друг и ребенок, уже отмеченное выше существительное мама, а также существительное женщина, которое так же, как и мама, встречается в общем частотном списке русского языка, но не попадает в сто самых частотных существительных поэтического корпуса. В то же время лексический ряд этого домена в высокой поэзии оказывается чрезвычайно разнообразным и включает в себя группу существительных, обозначающих родственные связи (брат, отец, мать, сын), социальные отношения ( враг и царь), а также существительное поэт. Это существительное занимает 61-ю позиция в списке ста самых частотных существительных поэтического корпуса и только 106-ю позицию по частотности употребления в корпусе наивной поэзии.

Низкая частотность социальных (в том числе и семейных) номинаций хорошо согласуется с полным отсутствием в списке наивной поэзии семантической группы существительных, обозначающих те или иные социальные явления. Заметим, что этот ряд и в высокой поэзии представлен слабо. Существенным является и то, что в нем не обнаружилось ни одного совпадения с множеством существительных этой семантики из частотного списка существительных русского языка. Очевидно, что жанр социальной лирики представлен в корпусе наивной поэзии весьма широко, однако соответствующие тематические паттерны не заимствуются. Возможно, это следствие того, что классическая «школьная» поэзия на социальные темы датируется XIX веком и не может оставить в памяти авторов наивной поэзии подходящих для сегодняшнего дня образцов.

В последнем исследовании, представляемом в настоящей статье, мы ставили своей целью оценить, насколько в среднем количественные показатели семантических рядов ста наиболее частотных существительных наивной поэзии соотносятся с частотностью этих же групп лексем в списке высокой поэзии и в словаре Ляшевской—Шарова. Мы упорядочили все существительные по рангам убывания частотности; далее для каждого семантического домена мы брали медиану (серединное число из числового ряда рангов) и сравнивали его с медианой рангов тех же самых существительных в полном частотнике высокой поэзии и в частотном словаре. Медиана дает возможность не учитывать выбросы — крайние точки в числовом ряду. Таким образом, мы определяли, имеется ли общий сдвиг частотности лексики домена в наивной поэзии по сравнению с той же самой лексикой высокой поэзии, и как этот сдвиг соотносится с частотностью существительных в русском языке в целом. Результаты нашего анализа представлены на графике 2. Чем больше длина столбца, тем в целом реже встречается лексика домена.

График 2.

Расхождения наивного корпуса с корпусом высокой поэзии прослеживаются в нескольких доменах. Существенно более частотной является лексика, отнесенная к высказываниям (домен речи), лексика домашнего пространства, бытийная и метафизическая лексика (экзистенция) и существительные, определяющие эмоциональную сферу. Напротив, существительные, относящиеся в списке наивной поэзии к домену сознания, встречаются в корпусе высокой поэзии гораздо чаще. Также чуть чаще встречаются и существительные, обозначающие явления природы и события. Эти три домена, как мы видели выше, совпадают не полностью. Иными словами, более высокая медиана употреблений лексем этих доменов в поэтическом корпусе достигается только благодаря вкладу общих существительных двух списков — множества лексем, обозначающих природу, и лексем смерть и сон, которые, видимо, являются очень важным источником воспроизведения высоких поэтических образов в наивной поэзии (ср. поэтическую концептуализацию этой пары в стихотворении Ф. И. Тютчева «Близнецы»).

 

Выводы

Наивная поэзия, даже такая типическая, какую мы отобрали с помощью биграммов, оказалась не простой функцией от высокой поэзии, вошедшей в Поэтический корпус. Наивные авторы не слепо транслируют усвоенные из классической традиции модели, а производят нелинейный отбор лексических средств, осложненный современным речевым узусом, проводящим активную экспансию в область поэтического.

Результаты наших подсчетов публикуются в приложении к этой работе в открытом доступе как приглашение к широкому обсуждению поднятой здесь проблемы.

В заключение отметим, что нами был представлен только ряд предварительных подходов к проблеме, развить которые мы надеемся совместно с юбиляром.

 

Литература

1. Неклюдов (ред.) 2001 — «Наивная литература»: исследования и тексты / Сост. С. Ю. Неклюдов. М., 2001. [URL: http://www.ruthenia.ru/folklore/luriem43.pdf]

2. Минаева, Жигарина (ред.) 2009 — До и после литературы: тексты наивной словесности. Сост. А.П. Минаева. Отв. ред. Е. Е. Жигарина. М., 2009.

 

Источники

1. Ляшевская, Шаров 2009 — Ляшевская О. Н., Шаров С. А. Частотный словарь современного русского языка (на материале Национального корпуса русского языка). М., 2009 [URL: http://dict.ruslang.ru/freq.php].

2. Поэтический корпус — Поэтический подкорпус в Национальном корпусе русского языка [URL: http://ruscorpora.ru/search-poetic.html].

3. Стихи.ру — Стихи.ру — национальный сервер современной поэзии [URL: http://stihi.ru/].

 

Приложения

Приложение 1. Частотный список лемм выборки наивной поэзии с указанием позиции и частоты .txt.

Приложение 2. Частотный список лемм наивной поэзии в сравнении с частотным списком лемм поэтического подкорпуса НКРЯ и словарем Ляшевской—Шарова (первая 1000 позиций) .xls, .csv.

Приложение 3. Разница в позициях в наивной поэзии и поэтическом корпусе по возрастанию .xls, .csv.

Приложение 4. Разница в позициях в наивной поэзии по убыванию .xls, .csv.

ruthenia – 10 | personalia | сетевые ресурсы | дискуссии | независимые проекты на "рутении" | добрые люди
о проекте | анонсы | хроника | архив | публикации | антология пушкинистики | lotmaniania tartuensia | з. г. минц

© 1999-2013 RUTHENIA

- Designed by -
Web-Мастерская – студия веб-дизайна