Какие факторы влияют на носителя языка при определении значения слов? Как решают проблему многозначности слов системы обработки текста? От чего зависит то, какое значение слова мы выберем? Об этом рассказывает кандидат филологических наук Борис Иомдин.

Большинство слов имеют много значений. Если для носителей языка это не так часто составляет проблему, то для компьютерной лингвистики и обработки текстов это проблема колоссальная. Каждый раз система должна определить, какое именно значение имеется в виду в данный момент. Главная опора для данной задачи — контекст. Обычно мы говорим не одиночными словами, а предложениями и текстом в целом, а в тексте определить значение слова гораздо проще. Например, многозначное слово «пост». Само по себе оно может иметь много значений, и в контексте они становятся понятны: держать пост; написать пост; стоять на посту; получить пост. Хотя не любой контекст позволяет различить значение («мой пост»).

Рекомендуем по этой теме:
18982
Корпусная лингвистика
Когда мы вводим запрос в поисковую систему, мы часто вводим одно слово, понимая, что мы хотим. Но у поисковой системы нет возможности догадаться. Если я ввожу запрос «банки», то либо я человек, который хочет поменять деньги, и мне нужно понять, какие банковские организации находятся неподалеку, либо я человек, который решил варить варенье, и мне нужны двухлитровые банки. Контекст в данном случае может возникнуть, только если знать, кто я. Знание о том, кем является человек, произносящий то или иное слово, во многом определяет то, в каком значении он это слово, вероятно, употребит. Актуальны различного рода психолингвистические эксперименты, которые показывают, как расположены в голове у человека значения многозначных слов, с какой вероятностью то или иное значение он выберет первым, что имеет в виду человек, когда произносит многозначное слово.

Анализ корпусных контекстов позволяет выделять много новых значений, актуальных для какой-то части носителей языка. Значения слов у разных носителей языка, принадлежащих к разным социальным и возрастным группам, довольно существенно различаются. Иногда наши эксперименты показывают, что это касается даже самых простых слов. Какие значения приходят в голову человеку, который слышит слово «автомат»? Значение «телефон-автомат» ни один современный школьник не приводит, зато значение «зачет-автомат», которое приходит в голову почти любому студенту, не очевидно другим людям.