Access to educational programs

Log in

Forgot password?

Sign Up

Semantics for connoisseurs

Считается, что в английском языке имеется более двадцати пяти тысяч фразеологизмов (идиом). Это неразделимые цепочки символов, несущие закодированный смысл. Разбейте их пословно или поменяйте порядок слов в них и смысл идиомы будет утерян. И в лексическом, и в грамматическом отношении “Kick the bucket” (“Сыграть в ящик”) близко к “Hit the bucket” (“Ударить по ведру”), но значения, заложенные в этих высказываниях, различны. Так же и в русском: как писал С.Я. Маршак, “кровь с молоком” совсем не то же, что “молоко с кровью”.

Если носители языка обычно не испытывают затруднений с пониманием или использованием идиом, то для иноязычного читателя или слушателя они нередко представляют непреодолимые препятствия. К счастью, иноязычный читатель может теперь получить перевод бесплатно и быстро – благодаря развитию средств машинного перевода, таких как Гугл-переводчик или Яндекс-переводчик. Тем не менее, пытливый ум может поинтересоваться степенью риска, с которым связано использование таких средств.

Пытливый ум открывает Гугл-переводчик и вводит фразу “he’s all fur coat and no knickers”. Русский перевод выскакивает мгновенно. Он гласит: “Он все мех и без трусов". Яндекс-переводчик предлагает “он все в шубе и без трусиков”, тогда как подходящий русский эквивалент оригиналу может звучать, например “в ушах серьги, а шея немытая”. Неугомонный скептик теперь предлагает “All but kitchen sink” (что означает “беспорядок”, “все вверх дном”). Гугл и Яндекс выдают пословный перевод “все, кроме кухонной раковины”, в котором смысл оригинала потерян для русскоязычного читателя.

Переключаем направление перевода и вводим русский фразеологизм “Точить лясы”. Гугл переводит “sharpen lyacy” (“заточить лиясы”), Яндекс – “Sharpening the woods” (“Оттачивая леса”). Фразеологизм “Комар носа не подточит” Гугл преводит как “mosquito nose is not undercut” (“Нос комара не подрезан”), Яндекс – “The mosquito nose will not undermine” (“Нос комара не подорвет”).

Выявление бессмысленных переводов может продолжаться бесконечно, тем более, что кроме существующих идиом, уже зафиксированных в системе языка, постоянно возникают новые.

Еще одним барьером, который необходимо преодолевать автоматическим переводчикам, являются омоформы – разные слова, графически совпадающие в отдельных грамматических формах. Так, словоформа “графине” может быть дательным падежом слова “графиня” или предложным слова “графин”. Для автомата распознавание правильной формы представляет трудности. Вот несколько примеров.

Омоформа: пища
Фраза для тестирования: Пища от восторга Марина выбежала в сад.
Перевод Гугла: Food from delight Marina ran into the garden.
Смысл перевода Гугла: Еда от восторга Марина выбежала в сад.

Омоформа: полей Фраза для тестирования: Жена попросила: "Полей цветы и помой посуду".
Перевод Гугла: My wife asked: "Field flowers and wash the dishes."
Смысл перевода Гугла: Моя жена попросила: “Полевые цветы и помой посуду”.

Эти тесты демонстрируют, что, судя по всему, автоматические переводчики не понимают смысла текста и работают по принципу формального перевода известных им лексико-грамматических фрагментов. Семантика текста при этом не учитывается, а поскольку в большом числе текстов автомат все-таки правильно передает сообщение, то она, по-видимому, устраняется как лишний компонент.

Интуиция подсказывает, что устранение семантики из уравнения, которое принимает исходный текст и создает перевод, выглядит страшновато. Вроде как исключение умственной деятельности из процесса принятия решений или вынесения судебных постановлений и передача этих задач на усмотрение машин. Перевод всегда был искусством, теперь его забирает себе наука в компании с техникой. Искусство не убивают, от него просто отказываются. Автоматический перевод – решение проблемы для тех, кто хочет или должен читать текст на иностранном языке, но не обладает достаточными для этого знаниями. Так же, как ребенок из пробирки является решением проблем для бездетной семьи. Но достаточно ли хорошо мы знаем, как пробирочное зачатие влияет на дальнейшее развитие и будущее искусственно зачатого человека?

В 1974 году автор знаменитой книги “Искусство программирования” Дональд Кнут на церемонии вручения ему премии Тюринга сказал: “Наука - это комплекс знаний, который мы изучили настолько хорошо, что можем передать его компьютеру, но если мы не до конца понимаем эти знания, приходится обращаться к искусству.” Это звучит как предостережение. Действительно ли мы понимаем куда идем?