Как известно, основная задача сравнительно-исторического языкознания — классификация языков мира и реконструкция тех праязыков, к которым эти языки восходят. При этом важнейший методологический вопрос — это то, на каких основаниях, собственно говоря, языки классифицируются. Ситуация здесь отчасти аналогична тому, что происходит в биологии — необходимо выделять формальные признаки, по которым можно было бы расклассифицировать живые организмы на виды, роды и тому подобное, и построить таким образом общее генеалогическое древо для органического мира.

1

Параллельно лингвистов занимает еще и такой, напрямую связанный с первым вопрос. Известно, что язык все время изменяется. Соответственно, как для любого исторического процесса, так и для процесса эволюции языка можно предположить наличие какой-то среднестатистической скорости, которую можно было бы попытаться замерить и на этом основании построить своеобразные «глотто-часы» — так, как это уже сделано в некоторых естественных науках (радиоуглеродный анализ, дендрохронология, молекулярные часы). Вопрос о скорости языковых изменений занимал лингвистов очень давно, но впервые за его решение по-настоящему взялся только в 1950-е гг. выдающийся американский лингвист Моррис Сводеш (Morris Swadesh). Поскольку его основным объектом изучения были бесписьменные языки американских индейцев, для него этот вопрос был особенно важным — чтобы оценить, например, скорость изменения современных языков Европы, нужно лишь сравнить их с древними письменными источниками (например, французский с латынью, немецкий с древними германскими языками), а для языков, историю которых можно только реконструировать, нужно разрабатывать отдельную методологию.

Моррис Сводеш. Лексикостатистическое датирование доисторических этнических контактов. — В кн.: Новое в лингвистике, в. 1. М., 1960, стр. 23-52.

2

Исходный метод Сводеша сводится к следующему. Язык — сложная система, состоящая из многих уровней (фонетика, грамматика, лексика и так далее). Согласно Сводешу, наиболее «устойчивым» к историческим изменениям из всех этих уровней оказывается лексический. Однако устойчива к изменениям не любая, а только так называемая «базисная» лексика — набор таких слов, которые обнаруживаются почти во всех языках мира, т. е. определяют универсальные концепты и в целом не сильно зависят от социального, культурного или технологического уровня развития языковых носителей.

Для того чтобы придать этой гипотезе практическое наполнение, Сводеш составил на основании собственного опыта изучения разных языковых семей экспериментальный список, в который включил 200 слов (впоследствии оказалось, что для конкретных исследований удобнее пользоваться сокращенным вариантом из сотни слов). Нетрудно догадаться, что туда, например, входят такие слова, как части тела (ʽголоваʼ, ʽглазʼ, ʽухоʼ, ʽносʼ, ʽротʼ, ʽрукаʼ, ʽногаʼ и т. д.); разные природные явления, более или менее единые по всему миру (ʽсолнцеʼ, ʽлунаʼ, ʽветерʼ, ʽводаʼ, ʽогоньʼ, ʽземляʼ и т. д.); самые общие, конкретные и естественные признаки и процессы (ʽбольшойʼ, ʽмаленькийʼ, ʽдлинныйʼ, ʽкороткийʼ, ʽестьʼ, ʽпитьʼ, ʽспатьʼ, ʽсидетьʼ, ʽстоятьʼ и т. д.); числительные ʽодинʼ и ʽдваʼ (ʽтриʼ в стословный вариант уже не входит, потому что в мире есть немало языков, у носителей которых счет не развит дальше чем один-два-много); личные и вопросительные местоимения (ʽяʼ, ʽтыʼ, ʽктоʼ, ʽчтоʼ) и некоторые другие слова.

С. А. Бурлак, С. А. Старостин. Лингвистическое время: глоттохронология, лексикостатистика. — В кн.: С. А. Бурлак, С. А. Старостин. Сравнительно-историческое языкознание. М., 2005, стр. 129-152.

3

«Базисной» лексике в парадигме Сводеша противопоставлена «культурная» лексика, которая в количественном отношении в разы превышает базисную, но не составляет лексического ядра языка. Разного рода абстрактные понятия (ʽлюбовьʼ, ʽнадеждаʼ, ʽстрахʼ), разного рода узкоспециализированные названия растений и животных, характерных лишь для некоторых ареалов, названия артефактов и различных сложных объектов — все это относится к неустойчивой части лексического фонда, которая изменяется гораздо быстрее, чем базисная. Таким образом, для изучения исторического родства языков базисная лексика ценнее, чем культурная.

Не все лингвисты принимают жесткое разделение лексики на «базисную» и «культурную», некоторые отказываются принимать фундаментальность этого противопоставления, справедливо указывая на то, что многие «базисные» слова в конкретных языках нагружаются индивидуальными культурными коннотациями (например, «базисное» слово ʽсолнцеʼ для кого-то — просто небесное тело, излучающее тепло и свет, а для кого-то — одушевленное божество). Тем не менее сам факт того, что одни слова в среднестатистическом плане неизменно оказываются «устойчивее» других к процессу лексического замещения, неоспорим, а стоит ли привязывать его к идее «базисности» и «культурности» — это уже дело десятое.

Dyen, Isidore. Linguistic Subgrouping and Lexicostatistics. The Hague, Mouton, 1975.

4

Метод определения относительной близости родственных языков друг к другу называется лексикостатистикой. С «лексикой» все понятно, а статистический аспект здесь такой: если взять какую-нибудь маленькую группу языков, например, уровня славянской, и проанализировать, как устроен стословный список в славянских языках, то окажется, что примерно 80-85% слов из этого списка между любыми двумя славянскими языками будут всегда совпадать («совпадать» не в том смысле, что будут абсолютно одинаковы по форме, а в том смысле, что восходят к общему предку — например, русское птица и польское ptak «совпадают», поскольку оба восходят к праславянскому *pъta). Если взять языки из двух разных подгрупп индоевропейской семьи, то в них будет уже гораздо меньше совпадений — обычно порядка 30-35% совпадений в стословном списке. Например, русское ʽдеревоʼ и английское ʽtreeʼ — это лексикостатистические совпадения, они оба отражают праиндоевропейский корень *derw-; а вот русское слово ʽглазʼ и английское слово ʽeyeʼ не восходят к общему предку — в русском языке английскому слову ʽeyeʼ родственно слово око, которое для нас является литературным архаизмом и давно перестало быть «базисным» эквивалентом значения ʽглазʼ.

Рекомендуем по этой теме:

Таким образом, общее правило формулируется очень просто: чем выше процент совпадений между базисной лексикой сравниваемых языков, тем «ближе» они друг к другу, т. е. тем ближе к нашему времени распался на части их общий предок.

Embleton, Sheila. Statistics in Historical Linguistics. Bochum, Studienverlag Dr. N. Brockmeyer, 1986.

5

Вторая наиболее смелая и спорная, но вместе с тем и наиболее перспективная в плане дальнейших исследований идея Сводеша заключалась в том, что базисная лексика в языках изменяется не просто медленно, но еще и с относительно постоянной скоростью. Этот вывод Сводеш сделал, сопоставив данные по тем языкам, историю которых мы можем фактически проследить на расстоянии в несколько тысяч лет (например, от латыни к романским языкам, от древнегреческого к современному, от санскрита к современным индоарийским и тому подобное; впоследствии к этим данным добавились аналогичные «замеры» по истории китайского, японского, древнеегипетского языков). По его наблюдениям получалось, что из 100-словного списка за 1 тысячу лет в среднем «выбывает», то есть замещается другими словами, около 14 слов.

Таким образом, у лексики оказывается свой собственный «период полураспада», и, значит, скорость изменения лексики можно измерять той же формулой, которая применяется в процедуре радиоуглеродного анализа, а из этого следует, что в нашем распоряжении оказался чудесный инструмент, с помощью которого можно не только определять степень близости языков относительно друг друга, но даже прикинуть примерную абсолютную дату распада их общего предка. Например, если между русским и английским 34% общей лексики в 100-словном списке, это означает, что их общий предок (какой-то из древних диалектов праиндоевропейского) распался на славянскую и германскую ветви примерно четыре тысячи лет тому назад. Такая разновидность применения лексикостатистического метода называется глоттохронологией.

Lees, Robert. The basis of glottochronology. Language29 (2), pp. 113–127, 1953.

6

Первоначальный энтузиазм вокруг глоттохронологии (в начале 1950-х гг.) довольно быстро развеялся, когда оказалось, что «правило Сводеша» работает далеко не на всем объеме доступного языкового материала, да и вообще с чисто теоретических позиций очень трудно поверить в то, что в языке есть что-то вроде «глотто-часов» (во всяком случае, лингвистам; биологи, в частности, к этой идее относятся гораздо спокойнее). Вышло несколько «разгромных» публикаций, и на какое-то время глоттохронология оказалась похоронена.

Новый всплеск интереса к этой методике в западной академической среде начался относительно недавно — на волне общего увлечения применения статистических и вероятностных методов, разработанных в рамках естественных наук, к гуманитарным областям. Сегодня западные ученые используют в своих исследованиях гораздо более сложные модели, чем простая формула Сводеша, но общие принципы (идея устойчивости базисной лексики, представление об измеряемости скорости распада списка и тому подобное) остаются теми же самыми. Впрочем, исторические лингвисты, так сказать, «традиционной» закалки, как правило, все равно с довольно большим трудом преодолевают скептическое отношение к лексикостатистическому анализу.

Renfrew, Colin; McMahon, April; Trask, Larry (eds.). Time Depth in Historical Linguistics. Cambridge: McDonald Institute for Archaeological Research, 2000.

7

У нас в стране наиболее значительный вклад в развитие лексикостатистики и глоттохронологии внес Сергей Анатольевич Старостин (1953-2005). Он, во-первых, внес в формулу Сводеша несколько важных поправок, которые позволили получать более точные и достоверные результаты, во-вторых, сумел разрешить одну из самых сложных проблем метода, предложив разграничивать между «внутренними» лексическими заменами (когда базисное слово заменяется на другое, уже существовавшее в языке, но имевшее другое значение — например, русское брюхо вытесняется животом, т. е. ʽжизньюʼ) и «внешними», то есть заимствованиями из другого языка. Оказывается, что постоянная скорость изменений характерна в первую очередь для внутренних замен, а не внешних, что естественно, поскольку объем заимствований очень зависит от конкретных непредсказуемых исторических и географических условий, а вот для того, чтобы непрерывной, но медленной струйкой текли «внутренние» замены, никаких контактов с другими языками не требуется. (В связи с этим «коэффициент» Сводеша по методике Старостина было предложено снизить с четырнадцати выпадающих слов до пяти из ста за тысячу лет).

Рекомендуем по этой теме:

Сегодня в рамках Московской школы компаративистики активно функционирует специальный проект «Глобальная лингвистическая база данных», где мы в основном занимаемся тщательным выверением старых и составлением новых «списков Сводеша» с тем, чтобы наконец создать единую, хорошо отлаженную, унифицированную систему лексических данных, к которым можно будет применить несколько разных вариантов, как старых, так и новых лексикостатистического анализа. По сути, эта система — фундамент для будущей общей генеалогической классификации всех языковых семей мира с возможностью привязки этой классификации к более или менее конкретным историческим датировкам.

Starostin, George. Preliminary lexicostatistics as a basis for language classification: a new approach. // Journal of Language Relationship, v. 3, 2010, pp. 79-117.