Совместно с издательством Corpus мы публикуем эссе из сборника «О чем речь» кандидата филологических наук Ирины Левонтиной, посвященного жизни и трансформации русского языка в наши дни.

Вот уже более десяти лет существует Национальный корпус русского языка. НКРЯ — «это информационно-справочная система, основанная на собрании русских текстов в электронной форме». Сейчас общий объем Корпуса — более 500 млн слов. Делает его блестящая команда лингвистов — специалистов по так называемой корпусной лингвистике, при участии разных организаций, прежде всего Яндекса и Института русского языка им. В. В. Виноградова РАН. Отметим, что в мире корпусная лингвистика вообще сейчас бурно развивается, ср., например, один из образцовых корпусов — Британский национальный корпус (BNC).

Корпус — не просто большое собрание текстов. Это собрание сбалансированное (тексты разного типа отобраны в определенной пропорции). К тому же для конкретной задачи можно выбрать тексты того или иного жанра, времени и т. п. Например, можно задать такой подкорпус: поэтические тексты с автором-женщиной до 1950 года рождения. Искать по массиву текстов можно определенную словоформу или сочетание слов, а также два или более слов, находящихся в тексте на указанном расстоянии друг от друга, а также можно задать не слово, а грамматическую форму (допустим, чтобы изучить модель управления глагола). И много еще чего можно делать. И разумеется, со всяческой статистикой.

Например, когда я пыталась выяснить, как за последние сто лет изменилось произношение слова артель (о нем есть рассказ в этой книжке), я воспользовалась, в частности, МУРКО — мультимедийным корпусом, входящим в НКРЯ. Как же было здорово, нажав кнопку, моментально получить одиннадцать отрывочков из фильмов, где это слово произносят! Замечательно, что Корпус все растет и растет, а его поисковые инструменты всё изощряются и изощряются. Собственно, это можно посмотреть на сайте НКРЯ — http://www.ruscorpora.ru.

С появлением НКРЯ жизнь лингвистов-русистов очень украсилась. То, на что у нас раньше уходили годы (выискивание примеров по текстам, сортировка пыльных карточек с выписанными контекстами), теперь достигается за несколько секунд и в гораздо большем объеме. А для лексикографов настала просто райская жизнь! Правда, замечу, что это привело и к появлению большого количества лингвистических работ, выполненных по принципу «наливай и пей»: прогоняешь какое-нибудь слово через Корпус — и готово дело. А там есть еще такая чудная кнопочка — «Показать распределение по годам». Нажимаешь — и выскакивает красивый график. И пожалуйста — научная статья: вот, мол, такое-то слово, в такие-то годы столько-то, вот столько-то процентов во множественном числе, а в таком-то жанре столько-то. Хочется спросить: «И?» В молодом поколении лингвистов многие убеждены, что именно так выглядит настоящая наука, а, скажем, проводимый вручную тонкий семантический анализ — так, пережитки прошлого. Ну да ничего, будем надеяться, что это детская болезнь и она пройдет.

Помимо собственно научной работы, Корпус еще изумителен тем, что теперь можно получать какие-то предварительные ответы на возникающие в ходе жизни лингвистические вопросы. Дело в том, что наш индивидуальный языковой опыт очень ограничен и обычно слабо отрефлектирован. И Корпус позволяет нам выйти за его пределы. Приведу несколько примеров из последнего времени.

Подруга-редактор спросила меня, насколько вообще допустимо тавтологическое сочетание «денежные купюры». Это очень легкий вопрос для Корпуса (денежный + купюра на расстоянии 1 — то есть рядом). Оказывается, такое встречается нечасто (48 вхождений при том, что само слово купюра зафиксировано 1430 раз), но, в частности, и у хороших авторов: С. Довлатова, И. Грековой, В. Дудинцева, А. Азольского, Д. Рубиной и др. Ну, а дальше — дальше каждый сам решает, достаточные ли это для него авторитеты.

Рекомендуем по этой теме:
6804
Главы | Больше, чем слово

Или вот в последнее время многие заметили, что помимо нормативного варианта в Донбассе и из Донбасса в литературной речи начал распространяться вариант на Донбассе и с Донбасса (понятное дело, региональное влияние). Тут надо заметить, что как раз в данном случае провести серьезное социолингвистическое исследование с привязкой к территориям НКРЯ (пока) возможности не дает. В рассказе про поребрик (он тоже есть в этой книжке) я упоминала некоторые другие инструменты, которые можно тут использовать. Но Корпус позволяет быстро прикинуть, действительно ли раньше в литературной речи такого не встречалось. Как выражался В. С. Черномырдин, «Сроду такого не было, и вот опять то же самое».

Вообще-то этот вариант и раньше встречался — и у приличных авторов:

Мои родители, которые всю жизнь зачем-то колесили по всем доступным им пространствам, привезли меня из Таджикистана в город Первомайск на Донбассе (В. Войнович. Замысел, 1999). Бабка моя даже завидовала, что сестра успела походить в мехах и бриллиантах, пока она с мужем работала то в Карелии, то на Донбассе

(В. Курбатов. Дорога в объезд, 1999).

Так на Донбассе и остался на эту зиму: что-то там с железными дорогами

(И. Ратушинская. Одесситы, 1998).

Но, конечно, довольно редко, в Донбассе — во много раз чаще.

Интересно, что аналогичное с Донбасса попадается почаще, причем есть и довольно старые примеры:

Я вот мастер коксовых печей, с Донбасса, а приехал сюда — печей-то еще не построили, послали меня на работу в профорганизацию

(А. Г. Малышкин. Люди из захолустья, 1938).

Я еще мог бы понять, если наша армия послана для демонстрации, чтобы любой ценой оттянуть силы белых с Донбасса

(А. Н. Толстой. Хмурое утро, 1941).

Но у Лимонова, например, более стандартно:

Маленький гениальный еврей, недоучившийся в Горном институте, бежал в Харьков из Донбасса, где он вот уже несколько лет работал мастером на шахте

(Молодой негодяй, 1985).

Я очень люблю пользоваться поэтическим корпусом НКРЯ для уточнения вопросов, связанных с ударением (слава русской силлабо-тонике!). Недавно по понятному поводу (как раз соткался из злобы, невежества и серой паутины термин национал-предатели) в сети обсуждали стихотворение Демьяна Бедного 1923 года «Социал-траурным предателям»:

В бессильном трауре немецкая столица,

Повсюду траурные лица.

Что ни процессия, то — вот она, гляди! —

Колонна социал-прохвостов впереди,

Предатели! Трусы! Забейте ватой уши

И трауром густым закройте зеркала:

Вы обнажили догола

Свой развращенный ум и слякотные души!

Многие обратили внимание на странное ударение трусы вместо трусы. Народ очень веселился, шутил, что, мол, с бельем все очень логично выходит — трусы обнажили догола свой развращенный ум. В общем, поэта каждый может обидеть, но Корпус говорит нам, что такой вариант ударения у этого слова был:

Фелицы слава, слава Бога,

Рекомендуем по этой теме:
16316
FAQ: Язык в интернете
Который брани усмирил,

………………….

Который оком лучезарным

Шутам, трусáм, неблагодарным

И праведным свой свет дарит.

(Г. Р. Державин. Фелица, 1782)

Что забывших про долг и про честь

Беглецов и предателей много

У несчастной их родины есть;

Что трусóв малодушных не счесть;

Но что больше всего равнодушных,

Беззаботно насилью послушных

(М. О. Цетлин (Амари). Аист, 1906)

Разумеется, это не ответ на вопрос, почему у Демьяна Бедного такое ударение: тут надо было бы подробнее смотреть диалекты, исследовать его язык, надо изучить историю этого слова. Но мы можем сразу сказать, что не то чтобы тут поэт переставил ударение, чтобы слово влезло в стих, не станем дразнить его, как у Горького Настя Барона: «Не было этого! Ничего не было!» Я ужасно не люблю, когда в сети такие Насти авторитетно заявляют: так, мол, никогда не говорили, такого не бывает, да еще и объясняют почему. У меня всегда в таких случаях рука сама так и тянется к закладке «НКРЯ». Хорошо, что она есть.