Материал подготовлен на основе радиопередачи «ПостНаука» на радио «Говорит Москва». Ведущий — редактор проекта «ПостНаука» Анна Козыревская, гость эфира — Борис Иомдин, кандидат филологических наук, заведующий сектором теоретической семантики Института русского языка им. Виноградова РАН, доцент факультета филологии НИУ ВШЭ, преподаватель Школы анализа данных Яндекса.

— Давайте обсудим тему бытового языка, бытовой лексики. Мы все знаем о существовании литературной нормы, но используем живой разговорный язык, который часто очень сильно отличается от той нормы, к которой мы привыкли в книгах, на уроках русского языка. Вы составляете словарь бытовой лексики. Как вообще можно составить словарь чего-то настолько живого и быстроизменяющегося?

— Это очень сложное дело. Сейчас все-таки это легче делать, чем раньше, потому что появляются новые технологии. Мы можем очень быстро выявлять новые слова и значения, потому что есть интернет и большие корпусы текстов в электронной форме. С другой стороны, трудно опереться на опыт предшественников, потому что этим мало кто занимался раньше. Бытовые слова почему-то редко привлекали внимание лингвистов. Казалось, что это какая-то такая шелуха, а надо говорить о высоком.

— Что такое бытовой язык? Действительно ли он достоин выделения в какой-то отдельный объект исследования?

— На него так мало обращается внимания, что из-за этого возникают разного рода сложности. Сейчас очень популярны в интернете разные тесты на определение словарного запаса. Сколько слов ты знаешь, насколько ты умен и начитан. Тебе дают 10, 20, 30 сложных слов, ты их как-то отмечаешь. Тебе говорится: «Ты молодец, ты знаешь сто тысяч слов». И, конечно, там будут какие-нибудь очень хитрые слова. Например, «обечайка», или «манишка», или «халдей», или какие-нибудь еще довольно редкие слова. И уж, конечно, там не будет слов типа «стол», «стул», «ложка», «вилка». Ну кто же их не знает? Действительно, мы вроде бы на родном языке все такие слова знаем, как нам кажется. Правда, если вы какой-нибудь иностранный язык берете, тут-то мы обнаруживаем пробел. Есть очень короткий тест на знание английского языка. Занимает он тридцать секунд, при этом абсолютно универсальный. Но, правда, я еще не встречал ни одного человека, который бы его прошел, включая моих коллег-лингвистов, людей, которые занимаются именно английским языком, переводчиков. Тест такой: как будет по-английски «веник» и «совок»? И никто не знает. Это не случайность. Нас этому не учат. Нас учат каким-то словам высоким, возвышенным и описывающим абстрактные понятия, а вот такие простые предметные вещи — о них часто забывают.

Вообще говоря, этим заниматься невероятно интересно оказалось. И в каком-то смысле это важно и для истории, для сохранения информации о том, в какие периоды какие слова что значили. Возьмем одежду. Например, «фуфайка» — это такое слово удивительное, которое все понимают по-разному. Или «платье»: сейчас мы скорее скажем, что платье может быть только женское, но ведь когда-то так называли любую одежду. Ну, положим, это было давно. Но и в современных текстах много такого, что изменяется, причем на наших глазах. Если посмотреть в словаре на какие-то совсем простые слова, например «трусы», это обнаруживается. Словарь Ушакова определяет не «трусы», а только «трусики» — «короткие штаны для купанья или для спортивных состязаний». А в Малом академическом словаре русского языка, более новом, трусы — «спортивные короткие штаны (обычно из сатина), а также принадлежность мужского и женского летнего белья». У нас возникает сразу много вопросов. Почему только летнего? Часто ли из сатина? И дальше пример: «Мимо лимузина шла колонна физкультурниц в голубых майках и трусах». Какая-то картина возникает не очень для нас современная.

— То есть иностранец не получает никакого шанса узнать, как на самом деле используется слово «трусы» в русском языке?

— Конечно, узнать можно, но из словарей это довольно трудно. А если смотреть старые тексты, то там вообще для нас что-то непонятное: «Вместо того чтобы надеть трико и колет, она нарядилась в кофточку и трусы». Или про мужчин: «Ну уж и выбрал костюм! Вообразите: черные сапоги с желтыми отворотами, красное трико, лиловые трусы, розовый камзол». Мы представляем себе какую-то не ту картинку явно, как это выглядело тогда. Это из старых текстов, из словаря галлицизмов. Но и в новых словарях, вышедших в 2009–2010 годах, скажем, нет даже упоминания «мобильного телефона». Хотя это сейчас, по нашим экспериментам, самый популярный предмет. Вот у человека с собой всегда есть телефон. Но нигде не написано, как его надо называть. Просто «телефон», «мобильный телефон» или «сотовый телефон»? Как чаще? В Питере, например, про него часто говорят «трубка», в Москве — реже. А еще были когда-то «сотик» и «сотка», которые сейчас уходят. Ничего про это нет вообще в новом большом иллюстрированном англо-русском словаре. Про те же трусы есть немного, но их очень трудно там найти: они есть в рубрике «одежда хоккеистов и тяжелоатлетов», а в других местах нет. Может, конечно, как-то стеснялись о них написать, но, в общем, и трусы — тоже важная вещь, надо понимать, как они называются.

— Но что же получается, что исследователи не уделяют должного внимания фактически самой основной части языка, который живет в данный момент?

— Может быть, она и не самая основная, но существенная, потому что это тот язык и те предметы, с которыми мы каждый день имеем дело. Другой вопрос, что нам не всегда приходится как-то их специально называть. Мы часто просто надели предмет одежды и идем или взяли в руки ручку и пишем. Но если мне хочется, скажем, кого-то попросить захватить из дома мне мою кофту, то тут могут возникнуть споры: а что ты этим называешь. Принесут тебе не то. Бывают такие предметы, которые вообще довольно сложно назвать. Сейчас их чем дальше, тем больше. Очень сложно осознать, что у разных людей разные мнения и разные слова. И мы друг друга поэтому плохо понимаем. Скажем, в чем разница между жакетом и пиджаком, между футболкой, фуфайкой и лонгсливом? Это очень трудно определить так, чтобы все согласились. Мы проводим специальные эксперименты, чтобы найти хотя бы какие-то общие точки. Ведь иногда эти различия действительно важны. Вот самая простая ситуация: мы приходим куда-нибудь в театр и там написано: «Сумки сдавать в гардероб». Что они называют «сумками»? Если у меня маленькая театральная дамская сумочка, ее надо сдавать в гардероб? А если у меня пластиковый пакет из магазина, надо? А если у меня чемодан? Интуитивно кажется, что театральную сумочку не надо, а чемодан, видимо, надо. Чемодан — это сумка или нет?

— Если мы перейдем именно к изучению бытовой лексики. Есть ли какие-то особые методы, по которым вы работаете с таким живым языком?

— Да, конечно. Моя основная специальность как раз лексикография, составление словарей. И когда мы начали заниматься бытовой лексикой, то стали смотреть словари разного рода, признанные академические словари. Конечно, всем известный словарь Ожегова, словарь Шведовой в последних изданиях, Малый академический словарь русского языка, Большой академический словарь и многие другие словари. И в области бытовых предметов, оказывается, все по-разному и многое непонятно. Тот же самый «свитер» в Малом академическом словаре толкуется как «теплая вязаная фуфайка без застежек с высоким воротником». Дальше мы пытаемся понять, а что такое фуфайка?

— И смотрим слово «фуфайка»?

— Да, а там написано: «фуфайка — это теплая вязаная рубашка или безрукавка». Если мы попытаемся это представить, получится какая-то ерунда: свитер — это «теплая вязаная теплая вязаная рубашка без застежек с

высоким воротником». Это не очень сходится. Еще у нас была попытка проверить, что говорят специалисты, потому что если мы описываем, скажем, какие-нибудь физические, биологические, медицинские термины, то обращаемся к физикам, к биологам, к врачам. Потому что они знают точно, что как называется, а мы можем путать. А к кому обратиться в области фуфаек?..

Есть товароведы, скажем. Но они апеллируют к нормативным документам, которые мы тоже стали изучать. Вот этим лингвисты меньше занимались, по крайней мере, в последнее время. А эти нормативные документы живут своей жизнью, они существуют. Существуют ГОСТы на такие предметы. Если их открыть, там написаны немножко забавные вещи. Слово «кофточка», скажем, — «одежда, покрывающая туловище частично или полностью для новорожденных, детей ясельных или дошкольных групп».

— Да, при этом мы используем слово «кофточка» для обозначения некой трикотажной одежды у женщин.

— Именно! Может быть, ГОСТ считает, что для детей «кофточка», а для взрослых «кофта»? Нет, про «кофту» специально написано, что это недопустимый термин. Так вообще нельзя говорить по ГОСТу.

— Получается, что у нас слово «кофта» не существует!

— Да, не существует многих слов: «кофта», «кепка», «лифчик», «передник», «пояс», «рубашка», те же «трусики». Это по ГОСТу все недопустимые термины: надо говорить не «кепка», а «кепи», не «рубашка», а «верхняя сорочка»… Может быть, ГОСТ не покушается на то, чтобы нам запретить произносить их вовсе, но на ценниках мы их не увидим, а это нам неудобно. Эти специальные документы очень интересны, мы их изучаем, собираем и тоже включаем в словарь. Также мы проводим эксперименты — опрашиваем людей. Эксперименты можно проводить по-разному, можно просто подойти к человеку и спросить: «Что это на мне надето?» или «Что на тебе надето?» Но это, во-первых, долго, потому что много людей надо опросить, чтобы это был какой-то статистически значимый результат. Во-вторых, человек, когда его так прямо спрашиваешь, пугается.

— Он пытается выдать «правильный» ответ?

— Из-за того, что перед ними лингвист, они хотят сказать какое-нибудь более «умное» слово, например не «кофта», а «кардиган». Но нам-то интересно, как люди реально говорят. Мы, скажем, иногда вешаем картинки где-нибудь в специальных сервисах для опросов, в частности в социальных сетях, которые очень удобны тем, что там много людей, которые с удовольствием в этих опросах участвуют. Вот предмет на картинке. «Что это изображено?» И смотрим. Там участвуют тысячи людей. Конечно, это зависит от того, в какой социальной сети, кто повесил, потому что там очень разные социальные срезы. По крайней мере, какую-то социальную группу мы можем таким образом изучить и получить очень интересный результат. Мы иногда задаем такие немного хитрые вопросы, которые вроде бы не вполне относятся к теме, чтобы человека запутать. Вот такой у нас был опрос: «В чем вы варите яйца?» Вроде бы какое отношение это имеет к русскому языку?

— Да. В кастрюле?

— В кастрюле, конечно. На первом месте «кастрюля», а дальше?

— В ковшике.

— Совершенно верно. Вы идете ровно по нашему списку. Пятьдесят, кажется, процентов — «в кастрюле», а тридцать с чем-то — «в ковшике». Теперь откроем словарь: нигде не написано, что ковшиками сейчас стали называть в том числе такие маленькие кастрюльки, в которых удобно, например, варить яйца, а везде говорится, что они для зачерпывания и питья. Может, это, с точки зрения кастрюлепроизводителей, плохо, неправильно, но, с точки зрения носителей языка, мы так говорим. Значит, это надо зафиксировать. Вот такой опрос дал возможность это сделать. Бывают ситуации, когда слова имеют очень близкие значения и их очень трудно различить. Например, «джемпер» и «пуловер». Я проводил огромное исследование, и невозможно определить общую картину, чем они различаются. Потому что у каждого человека есть свое мнение. В том числе и у разных словарей разные мнения, у разных специалистов разные мнения. Такова реальность. Есть два слова, но определить разницу между их значениями четко, чтобы это всех устроило, невозможно. Таких слов, близких по значению, мы набираем довольно большое количество. Банкнота — купюра, колье — ожерелье, кепка — бейсболка, варежки — рукавицы, кувшин — графин, шпилька — невидимка, кошелек — бумажник — портмоне, портфель — рюкзак, дипломат — кейс… Иногда согласие есть, но, правда, мнение носителей часто отличается от того, что принято считать, скажем, в словарях, потому что выросло новое поколение. Такие вещи мы изучаем с помощью разного рода экспериментов. Самое интересное, когда эксперименты можно провести скрытые. То есть когда человек вообще не знает, что он участвует в эксперименте. И нам кажется, что это наиболее хороший случай, потому что человек попадает в естественную ситуацию, он не знает, что кто-то за ним следит, записывает, интересуется. Он просто говорит.

— С какими еще текстами, кроме ГОСТов, вы работаете?

— Мы работаем с юридическими текстами, с описаниями протоколов. Есть огромная база данных «Консультант +». В ней есть и законы, и описания каких-то судебных заседаний, протоколы. Можно проследить, какие слова там используются чаще, какие реже, это очень интересно.

— Как же работают с этой бытовой лексикой люди, которые занимаются оптимизацией запросов в интернете в поисковых системах?

— Я преподаю в Школе анализа данных Яндекса, где учат анализировать много данных. А интернет предоставляет нам невероятное количество данных с невероятной скоростью. В Яндексе есть доступ к базе запросов — то, что называется «логи» запросов пользователей. Это совершенно бесценный материал, потому что их миллионы. Причем люди говорят не с человеком, а с машиной. Они что-то набивают в поиск и не рассчитывают на то, что кто-то их слушает, они рассчитывают на то, что машина их должна понять. Этот язык очень интересным образом видоизменяется. Мы, конечно, смотрим на эти данные, например, по частотности: какое слово используется чаще в запросах, какое реже. Для поисковых систем это очень важно, потому что существенная часть заработка — это реклама. Потом мы можем мониторить появление новых слов и даже новых моделей. Одна из моделей, которые мы описывали, — это сокращенные слова, вроде «мот». Было слово «мот» — «транжира», теперь есть слово «мот» — «мотоцикл». Такого рода сокращений раньше было гораздо меньше. Были уменьшительные и неуменьшительные слова, и они сейчас интересным образом начинают различаться по значению: говорят «ремень для брюк», но «ремешок для часов»; «шнуры для техники», но «шнурки для ботинок»; «зимняя шапка», но «шапочка для душа». Те же трусики, кофточки, сумочки — они скорее женские, чем мужские. Это очень хорошо видно, если запустить в Яндексе поиск по картинкам. А словари и ГОСТы, как мы уже говорили, этого не отражают.

Рекомендуем по этой теме:
12032
ScienceHub #06: Компьютерная лингвистика

— Давайте поговорим о заимствованиях в русском языке. Ведь в бытовой лексике это происходит наиболее быстро.

— Да, конечно. Мы в словаре специально отводим раздел такой теме, как история слов. Не только непосредственно про происхождение слова, но и про то, как его значение видоизменялось на протяжении его жизни. Действительно, в области культурной лексики, слов, которые называют артефактами, предметов, сделанных человеком, заимствований страшное количество. Я часто студентам даю задание: найдите среди современных названий предметов одежды слова, заимствованные из разных языков, и слова исконно русские. И очень трудно иногда понять, что слова, которые нам очень привычны, на самом деле когда-то были заимствованы. Например, из области «свитера» все слова заимствованы: свитер, кофта, пуловер, джемпер, кардиган, лонгслив… Что ни возьми, это все заимствованные слова, просто заимствованные в разное время. Даже такие слова, как те же самые «трусы», «майка», «брюки».

— Это все заимствованные слова?

— Да. Просто многие из них заимствовались давно, когда сами предметы появились. Это же касается и названий фруктов, овощей, но мы очень быстро об этом забываем.

— Получается, что бытовой язык фактически невозможно изменить, он сам выбирает, какие слова останутся, какие нет, просто люди коллективным разумом решают, что это слово подходит, и оно навсегда остается в языке. Мы не можем это контролировать.

— Безусловно. Вообще повлиять на язык и изменить его невозможно. Язык — это уникальный объект, который развивается сам. И поэтому изучать и описывать его невероятно интересно.