Зачем изучать частоты значений слов? По какому принципу устроены частотные словари русского языка? И как определить значения слов? Об этом рассказывает кандидат филологических наук Анастасия Лопухина.

Существует эксперимент — «Случай с Оливером». Суть его сводится к следующему. В эксперименте испытуемым предлагается прочитать газетный текст. В этом тексте оставлены без изменения те слова, которые входят в 2,5 тысячи самых частых слов русского языка. А все остальные слова заменены квазисловами, но с сохранением грамматической формы, то есть той формы, которая была у них в тексте. Дальше испытуемые прочитывали этот текст, и им задавался вопрос о его содержании. И оказывалось, что, понимая грамматику и 70% слов, люди могли рассказать, о чем текст.

Рекомендуем по этой теме:
Частотный словарь современного русского языка содержит информацию о частотах слов. Но при этом, если у слова несколько значений, сказать, какое значение используется чаще, а какое реже, мы не сможем. Например, если мы захотим узнать, какое значение слова «кран» используется чаще остальных — кран водопроводный или кран подъемный, нам взять эту информацию неоткуда. И иностранец, который начал изучать русский язык, будет вынужден выучить сразу оба значения слова «кран», вместо того чтобы начинать с самого частотного.

Один из способов подсчета частоты значений слов — автоматический. Суть автоматического метода в том, чтобы научить компьютер определять значение слова по контексту, то есть по тем словам, которые находятся вокруг нужного нам. Тогда компьютер может обработать любое количество контекстов, и даже все контексты из корпуса любого объема. Это было бы хорошо, однако на данный момент такая задача не имеет решения. Те решения, которые предлагаются, либо не завершены, либо содержат много ошибок.