Что такое машинный перевод? Как подходят к задачам машинного перевода сегодня? Как осуществляется контроль смысла переведенного текста? Об этом рассказывает кандидат филологических наук Леонид Иомдин.

Исторически сложилось, что первые системы машинного перевода моделировали деятельность человека, деятельность переводчика и, кроме того, моделировали деятельность лингвиста. Именно таковы были системы машинного перевода, которые были основаны на правилах. Исторически это первые системы, и они до сих пор сохраняют актуальность. Потому что в таких системах можно осуществить контроль смысла, который полностью зависит от человека. Бывает очень трудно осуществить контроль смысла переводимого текста. Поэтому у машинного перевода благодаря правилам есть большой потенциал.

Наша система машинного перевода называется «ЭТАП». Она работает в основном с двумя языками — русским и английским — и переводит с русского языка на английский и с английского на русский. Делается это вполне в традиционной манере, а именно: мы пользуемся тем алгоритмом, придуманным людьми, которые были первопроходцами в этом деле. Другое дело, что в нашей системе используется очень много ресурсов, которые мы разработали сами. К этим ресурсам относятся, во-первых, очень хорошие разветвленные словари, а во-вторых, очень хорошо описанная грамматика. Описать язык — это значит описать две вещи: описать словарь, слова этого языка, и описать грамматику. Если у нас есть система перевода, если мы используем в этой системе два языка, то мы должны иметь два словаря и две грамматики. Но еще и систему перевода между некоторыми структурами входного языка и структурами выходного языка.

Рекомендуем по этой теме:
5692
Начала компьютерной лингвистики
Под интегральным описанием языка понимается очень простая вещь — это соответствие между словарем и грамматикой. Надо сказать, что, когда имеется традиционное, некомпьютерное описание языка, между грамматикой и словарем могут появляться большие расхождения. Если эти расхождения есть, то в компьютерной системе ничего не получится, мы моментально придем к какому-нибудь противоречию и окажемся в тупике. Чтобы не быть голословным, я приведу один пример. В русском языке есть конструкции с частицей «ни». Можно сказать: «в комнате не было ни одного человека», «у меня не осталось ни одного литра воды» и так далее. Имеется частица «ни», и с отрицанием она используется. А иногда бывает так, что слово «одного» можно опустить, например: «в комнате не было ни души», «у меня нет ни копейки», «в стакане не было ни капли воды» и так далее. Это возможно, но не всегда. Например, сказать, что «в комнате не было ни студента», невозможно, «он сегодня не написал ни статьи» — невозможно. Это хорошо написано в грамматике, но в словарях этого нет.