Как изменилась роль традиционного словаря? Какие задачи ставятся перед активным словарем? Каковы преимущества и недостатки интернета как источника данных о значениях слов? Об этом рассказывает кандидат филологических наук Борис Иомдин.

Словарь — это один из наиболее осязаемых и наиболее известных продуктов деятельности лингвиста. Многие люди слабо себе представляют, чем занимаются лингвисты. Есть анекдот о том, что лингвист — это, наверное, человек, который идет домой и думает: «Вот вернусь на работу и еще десять глаголов проспрягаю, а кому это нужно?!» Но словарь в своей жизни держал в руках и, видимо, даже использовал практически каждый человек, хотя бы если он учился в школе.

Сейчас в современном обществе можно выделить две полярные точки зрения на словарь. Одна, условно консервативная, состоит в том, что словарь — это почти священная книга, это документ, в котором содержится единственно верная норма для значения каждого слова, это то, где не может быть ошибок и каких-то плохих, неправильных, нехороших, ненужных слов. Если какое-то слово в словаре отсутствует, значит, оно неверное, а если присутствует, то оно ровно так должно выглядеть, а если какие-то ошибки в словаре и есть, то это, скорее всего, словари каких-то последних лет, современные, когда язык испортился, профессионалов уже не осталось, и лучше ими не пользоваться, а взять словари хорошие, желательно старые, проверенные временем. Идеально здесь служит словарь Даля, таким универсальным мерилом идеального словаря.

Другая, полярная точка зрения, условно революционная, состоит в том, что словари устарели, пользоваться ими бессмысленно, потому что составляют их какие-то замшелые профессора, оторвавшиеся от жизни, современного языка они не знают, за современными реалиями не следят, слов в словаре должно быть чем больше, тем лучше, а вообще говоря, словари не нужны, потому что есть интернет, в котором очень быстро находится все, что нужно.

Как всегда бывает, истина где-то посередине. С одной стороны, действительно, словарь — это очень почтенный и уважаемый предмет, который существует практически со времен появления письменности. Восходит он к глоссам — пометкам на полях древних документов, где уточнялись значения непонятных слов. Глоссы были уже у древних шумеров, а в Древнем Китае уже возникли полноценные, достаточно большие, объемные словари.

С тех пор словари создаются практически для любого языка, у которого есть установленная письменность. В послевоенное время XX века наблюдался лексикографический бум, о котором пишет Юрий Дереникович Апресян. Он приводит такие данные, что в конце 80-х годов в Британии 90% семей имели хотя бы один толковый словарь, и это больше, чем любая другая книга, больше, чем кулинарные книги и даже чем Библия, — настолько это популярный объект.

Стали появляться целые семейства словарей. Семейства, издаваемые одним издательством, делаемые одним коллективом авторов, в которые входит большой толковый словарь, малый толковый словарь, учебный словарь, разные специальные словари, орфографический, орфоэпический, фразеологический, диалектный словарь, глагольное управление и еще десятки — может быть, и больше — разных типов словарей.

Важное различие, которое сейчас стали описывать, — это словарь пассивный и активный. Пассивный словарь содержит большое количество слов, желательно включить туда все или почти все слова данного языка, которые так или иначе знакомы хотя бы каким-то носителям, но кратко указать, каковы их значения.

Задача активного словаря — описать достаточно небольшую часть лексики, которая активно используется всеми носителями данного языка, и подробно описать все типы употребления, описать читаемость слов, управление, фразеологизмы, хорошо разделить слова на значения.

Таких настоящих активных словарей для русского языка пока не существует.

В 2014 году выходит первый том активного словаря русского языка под редакцией академика Апресяна — это первая попытка создания такого словаря для русского языка. Что касается методов составления словарей, то по большому счету их два. Во-первых, это метод опроса информантов, носителей языка. В первую очередь это касается составления словарей «в поле», когда язык составителю словаря мало знаком или не знаком вовсе, а текстов на этом языке нет или почти нет. Во-вторых, это, в случае существования литературы на данном языке, изучение текстов и нахождение примеров, по анализу которых можно описать слова.

История лексикографии — это история больших картотек. Почти любой классический словарь имеет на заднем плане огромные шкафы с карточками, на которых записаны примеры употребления слов. Но с распространением компьютеров, в электронную эпоху произошла революция, появились корпусы текстов, изучая которые, мы неизмеримо больше можем узнать о словах, и, конечно, современный словарь должен составляться на основе корпуса.

Одновременно с огромным преимуществом, которое дает возможность изучать корпусы, появляется большая сложность: размывается граница между нормой и ненормативностью. Появляется большое количество примеров, которые довольно плавно располагаются на этой шкале. Есть большая серая зона, и теперь лексикографу гораздо труднее определить, какое употребление нормативное, какое — нет и где на этой шкале находится та точка, в которой ошибка превращается в инновацию, в свершившееся изменение языка, которое следует признать нормой.

, однако эксперимент показывает, что таких в мире половина.

Практически все школьники начинают использовать вместо союза «что» новый союз «то, что»: «Я знаю то, что ты сегодня придешь». Это «то, что» представителям старшего поколения кажется очень странным, и им очень трудно понять, зачем так говорить, а школьники не замечают того, что это ненормативное употребление.

И таких различий очень много. Для того чтобы их адекватно описать, необходима очень большая экспериментальная работа. Здесь недостаточно работать с корпусом, потому что корпус не показывает отношения к тексту, он фиксирует то, что есть, а словарь, если это нормативный словарь, должен показывать отношение образованной части общества ко всем словам, ко всем их значениям и ко всем тонкостям их употребления. А для этого каждую такую вещь нужно протестировать на большом количестве людей и определить отношение к ней говорящих, потому что люди очень чувствительны к нарушению нормы, той, которая им представляется правильной.

Помимо этого, история многих слов очень причудлива. Значение одних слов уходит, других приходит. Бывает, что слово уходит и возвращается вновь. Словари должны чутко реагировать на такие явления и их фиксировать. Некоторое время назад выдавалось слово «наладонник». Так назывался небольшой электронный предмет с большим количеством функций, чем у смартфона, но с меньшим, чем у компьютера или планшета. Сейчас такое слово уже используется меньше, потому что и сам предмет менее популярен. В новые словари оно попасть почти еще не успело, зато обнаруживается в самых старых словарях. Например, слово «наладонник», как ни странно, есть в словаре Даля, и там оно определяется как наперсток у парусников. Это определение тоже не сразу понимаемое. По-видимому, это такой большой наперсток, который надевается на всю ладонь парусниками, то есть людьми, которые шьют паруса.

Значения всех этих слов поменялись, и хороший словарь должен аккуратно фиксировать старые значения, новые значения, считать это омонимами или не считать, так чтобы мы, читая или воспринимая тексты разных лет, понимали, что тогда имелось в виду. По-прежнему, кажется, очень актуальное в интернете слово «банить», которое означает способ запретить человеку что-то писать, скажем, на форуме. Это тоже слово новое, понятно происхождение — от английского слова ban («запрет»). В словарях его еще нет, а в старых словарях есть другое слово, которое выглядит так же.

В словаре Даля приводится пример «банить белье», скажем, «бабы банят» — что это значит? Значит, стирают. Это совсем другое слово, другого происхождения, однокоренное со словом «баня».

Таких примеров можно найти очень много. Надо ли включать в словарь все эти слова? Здесь сталкиваются противоречия старого и нового подходов к словарям. При традиционном подходе бумажные словари — это предметы, которые должны быть подъемными в прямом смысле, это должна быть книга, которой удобно пользоваться. Поэтому лексикографы очень ревностно относились к тому, включать или не включать слово в словарь. Ничего лишнего там не должно было быть — надо экономить место.

Но в случае электронного словаря экономить место не нужно. Мы никогда не займем столько места, что у нас не хватит носителей информации, у нас сейчас совсем другие объемы. Поэтому вроде бы этого делать не нужно, но бытовало представление о лексикографе как о таком авторитетном «страже у ворот», который не пускает в словарь, не пускает в язык какие-то плохие, ненужные и неправильные слова. Поэтому в словаре оказывается меньше слов, чем хочется увидеть.

Чего еще опасается лексикограф? Дело в том, что издательский цикл довольно большой. Пока словарь будет подготовлен, пока он будет подготовлен к печати, пока он будет издан — проходит обычно несколько лет. За это время скоротечное слово может уже и уйти, и бывают такие ситуации, когда слово, новое, было гордо включено в словарь, а к тому моменту, когда словарь вышел в печать, слово уже опять не было употребительным. Так лучше и не включать.

Но в электронных словарях этой проблемы нет, и у пользователей меняется подход: если раньше пользователю казалось, что если слова в словаре нет, значит, это неправильное слово, то теперь кажется, что если слова в словаре нет, значит, это неправильный словарь. Лучше взять другой словарь, а еще лучше вообще не брать никакого словаря, а просто посмотреть в интернете. Потому что в интернете появляется все самое новое, там есть очень много информации, и там легко узнать, что значит то или иное слово.

В современной лексикографии происходит наконец смычка лексикографии и семантики, поскольку достижения современной науки о смыслах раньше мало использовались в толковых словарях.

Идея о том, что язык должен быть описан системно, идея интегрального описания языка, принадлежащая Апресяну и Московской семантической школе, только начинает использоваться в словарях. Но есть ли будущее у бумажных словарей или их заменит интернет? Британский лексикограф Майкл Ранделл приводит комментарий к своей статье одной девушки в интернете, которая говорит о том, что есть три предмета, которых у нынешних молодых людей нет, и часто они даже не подозревают, что эти предметы существуют: это будильник, записная книжка и словарь. Все эти предметы заменяет мобильный телефон.

Рекомендуем по этой теме:
20378
Корпусная лингвистика

Верно ли это? Действительно, у интернета как источника данных о значениях слов есть несколько преимуществ. Во-первых, огромный охват. Он на много порядков больше, чем любой возможный словарь. Во-вторых, очень легкая доступность и бесплатность — мы просто открываем интернет в любом месте и на любом устройстве и сразу видим то, что нам нужно. И это возможность разных новых типов поиска. Скажем, поиск по картинке, чего в словаре быть не может. Если мы хотим узнать, как выглядит тот или иной предмет, мы ищем соответствующую картинку. И наоборот: мы вводим картинку, и появляется ответ, что это такое. Это невозможно себе представить в бумажном словаре.

Но есть у интернета как замены бумажным словарям, конечно, и минусы. Прежде всего, интернет не анализирует и не перерабатывает информацию, он просто передает то, что есть. Лексикограф, прежде чем составить словарь, перерабатывает огромное количество информации, отделяет случайное от системного, отделяет старое от нового, отделяет важное от неважного, выделяет существенное. Проделывается большая работа, в результате чего у нас появляется адекватное описание слов. Кроме того, интернет не дает представления о норме, он фиксирует то, что есть, и прежде всего фиксирует самое частотное: чем чаще что-то встречается, тем легче его обнаружить в интернете.

Словарь же должен фиксировать норму, то есть отношение к словам и к их значению, к их употреблению образованной частью общества. Для этого должны проводиться соответствующие исследования, в интернете этого не увидишь.

Часто пользователи интернета ограничиваются теми цифрами встречаемости того или иного слова, того или иного написания, которое дает поисковая система. Эти цифры не отражают реального положения вещей и во многом дезориентируют, поскольку здесь нет никакого анализа. Поисковая система не ставит перед собой такой задачи.

Таким образом, действительно, истина где-то посередине, и бумажные словари уже не так удобны, не дают тех возможных многообразных поисковых возможностей, которые есть у электронных словарей. Но и лексикограф — человек, без которого не обойтись, потому что он умеет проанализировать, описать информацию и установить норму. Таким образом, будущее за словарями, которые создают лексикографы, но которые существуют в современном электронном виде с богатыми возможностями поиска. И будем надеяться, что такие словари будут создаваться и будут описывать язык как систему.