115

Почему переводчикам в ближайшие годы можно не опасаться машинного перевода, или на что пока не способны нейросети. Часть II – примеры.

Данный пост является окончанием задуманного изначально как единое целое поста, рассказывающего о том, почему нейросети не смогут в ближайшем будущем заменить человека на поприще перевода. Теория вместе с различными примерами призвана была произвести более убедительное впечатление, но текст оказался чрезмерно длинным, поэтому его пришлось разбить на части – теория отдельно, примеры отдельно.

Начало находится здесь: http://pikabu.ru/story/pochemu_perevodchikam_v_blizhayshie_g...

В списке ниже рассмотрим то, что гарантированно "сломает зубы" любому машинному переводчику, не достигшему уровня сильного ИИ. Список мог бы быть много больше, но думаю, что и этих примеров будем достаточно. Начнём с того, что и человеку даётся с большим трудом - тексты, перевод которых представляет собой в чистом виде творчество, а далее, спускаясь по уровням, покажем, что нетривиальной задачей для машинного переводчика могут оказаться и совершенно нетворческие тексты технического характера.


В процессе подготовки текста мне в голову нередко приходила мысль, что я объясняю некие совершенно азбучные и очевидные вещи про "непереводимое в переводе", которые абсолютно самоочевидны, поэтому иногда возникало желание даже отказаться от идеи поста. Впрочем, как показывает опыт общения с людьми, которые имеют о переводе лишь отдалённое представление, чтобы сломать представление о компьютере как о "магическом чёрном ящике с нейросетью внутри", в который закладывают тексты и который выдаёт готовые переводы отличного качества, без подобных объяснений не обойтись. Однако тот, кто знаком с переводом не понаслышке, может этот пост спокойно пропустить - он адресован по большей части всем остальным.

I. На верхнем уровне по степени непереводимости стоят тексты, обыгрывающие неизвестный читателю перевода контекст, а также каламбуры, завязанные на уникальные синтаксические особенности данного конкретного языка и/или отсутствующие в языке перевода реалии. Фактически перевод подобного даже нельзя назвать собственно переводом - от переводчика необходимо, основательно вникнув в контекст, придумать нечто такое, что донесло бы до читателя перевода "цель высказывания" (насмешило/заставило бы задуматься так же, как читателя оригинала), обеспечив тем самым прагматическую эквивалентность, что возможно далеко не всегда.

Например, рассказы Пелевина, относящиеся к жанру соцарта и представляющие собой виртуозную сатиру на соцреалистические штампы, построены в стилистике "срыва шаблонов": рассказ, начинающийся как совершенно привычный для советского читателя и скучный для него до зевоты трафарет, к середине вдруг начинает преображаться и к концу шаблон "выворачивается наизнанку", рождая у читателя когнитивный диссонанс. Перевод всего этого с полным сохранением прагматической эквивалентности для жителя страны, не знавшей соцреализма с его штампами, просто невозможно, то есть точный и правильный перевод просто не достигнет цели. А что возможно? Взять за основу некий жанр, хорошо известный читателю перевода (например, поучительный рассказ проповедника), и проделать подобную трансформацию уже с ним, достигнув некой условной прагматической эквивалентности. Однако проблема в том, что на всех остальных уровнях переводом уже не будет - хорошо ещё, если будет пересказом на тему, как пересказ "Алисы в стране Чудес" Владимиром Набоковым, где Алиса превратилась в Аню, а викторианские стишки обыграны переводами в стилистике тогдашних стихотворений русских поэтов. Отличные примеры подобного приведены в статье М. Фрейдкина о абсолютно непереводимом поэте Брассенсе (ссылка в окончании статьи).

Кто-то возразит: а почему переводчика должно волновать, поймет ли читатель перевода все заложенные в оригинал смыслы, завязанные на контекст, или не поймёт? Его задача – выполнить максимально точный перевод, а остальное уже – проблемы читателя. Не понял – пусть изучает культуру носителей языка оригинала. На это можно задать встречный вопрос: а для кого, собственно, переводчик выполняет перевод? Исключительно для тех, кто понимает контекст? Или же его задача – обеспечить, чтобы читатель перевода, взяв в его руки, в идеале испытал бы чувства, максимально приближенные к тем, которые испытал бы автор оригинала? И вообще, что это такое - "максимально точный перевод"?

Собственно, само это словосочетание, по идее, должно означать наличие эквивалентности по всем пяти уровням, про которые шла речь в предыдущем посте. Если уж переводчик передаёт иноязычный синтаксис своим, иноязычные идиомы – своими, значит, его волнует, чтобы читатель что-то понял, иначе можно было бы просто перевести все на первом уровне (языковых знаков), обеспечив механическое соответствие на уровне Промта (и нарушив его на всех остальных), и сказать «Остальное – проблемы читателя». Или просто ничего не переводить, сказав «Это проблемы читателя – пусть учит иностранный язык и читает в оригинале». Но переводчик такого сказать не может – иначе зачем он нужен? А значит, тезис «переводчика не должны волновать проблемы читателя» изначально неверен.

Истинная же проблема заключается в том, что прагматический уровень эквивалентности в ряде случаев прямо противоречит эквивалентности на остальных уровнях. Грубо говоря – не можем мы, хоть тресни, добиться того, чтобы австралийский абориген при чтении переводов чукотских произведений испытал те же чувства, что и чукчи. Данная проблема, на мой взгляд, представляется в общем случае принципиально неразрешимой даже для человека, не говоря уже о компьютере. Потому что если "целевой аудитории" практически неизвестен культурный контекст происходящего в оригинале, необходимость перевода как такового иногда довольно сомнительна, а если взяться за дело всерьёз и пересочинять каждую шутку и игру слов, так гораздо проще будет написать с нуля что-то своё. Представьте, например, перевод на любой язык нашего КВН, пересматривая выпуски которого через год-два, мы и сами уже порой не понимаем и не помним, что в той или иной остроактуальной на тот момент шутке было такого уж смешного. Мало чем отличается от этого, например, и перевод на русский язык плотно завязанных на американские реалии "Гриффинов", которые выходят далеко за рамки хорошо известной нам американской массовой культуры.

Даже перевод заголовков прессы может обернуться головоломной задачей из-за того, что в них нередко заложена уйма скрытых цитат и отсылок, сопровождающихся разного рода вариациями, наподобие: "Cold man and the sea", "Bulls in the China Shop", "The Disillusionment of the Land-Fit-For-Heroes", "The Tale of the Tapes", "No country for old boomers". Из российских примеров: "Здесь будет город заражён", "Скажи, Медведев, ведь недаром?", "Плохому водителю знаки мешают", "Ночь длинных ковшей", "Куда уходят средства, в какие города?" В ряде случаев, когда в языке перевода нет адекватного аналога, точный перевод подобного "очистит" текст от присущего ему изначального смысла. "Разглядит" ли нейросеть отсылку к фильму в заголовке "No country for old boomers", "вспомнит" ли русский перевод названия фильма, чтобы выдать перевод "Бэби-бумерам здесь не место"?

А вот примеры сложной игры слов, от переводчика которых тоже требуется фактически не перевести их, а придумать что-то своё "на заданную тему" - и ему крупно повезет, если в переводе останется хотя бы часть исходного смысла. В большинстве же случаев подобное просто заменяется полностью некоторой более или менее удачно придуманной отсебятиной: прагматическая эквивалентность достигается за счёт утраты всех остальных уровней.


1. Штирлиц стрелял вслепую, слепая упала навзничь, Взничь вскочил и убежал.


Мало того что используется флективность русского языка в сочетании с падежами, так читателю перевода ещё неплохо бы знать, кто такой Штирлиц и как его персонаж связан с подобными "абсурдными анекдотами".


2. You can cage a swallow, can't you? But you can't swallow a cage. Can you?


Используется аж две модели, отсутствующие в русском языке - образования глаголов от существительных и наоборот без изменения формы слова + "расчлененные вопросы". Ну и на закуску - вся фраза является палиндромом. Переводить будете сами или предпочтете отдать нейросети? :-)


3. Lock, stock and two smoking barrels (то, что у нас перевели как "Карты, деньги, два ствола").


На самом деле здесь "в одном флаконе" сразу две английские идиомы, завязанные в тугой узел - и что делать переводчику? Выдать нечто в духе "Любовь зла, вылетит - не поймаешь?" Задачка та ещё. Переводчика тут можно уподобить персонажу из концовки фильма, зависшему вот в таком положении:

Почему переводчикам в ближайшие годы можно не опасаться машинного перевода, или на что пока не способны нейросети. Часть II – примеры. Перевод, Машинный перевод, Трудности перевода, Нейронные сети, Искусственный интеллект, Смысл, Переводчик, Длиннопост

Примеры в этом плане можно множить до бесконечности – пространство языковой игры, которая заставляет ломать голову переводчиков, необозримо. Все те хорошие переводы этой игры, за которые ценят хорошие студии перевода и благодаря которым нас доходит определенная часть юмора оригинала – плод каторжного труда тысяч безвестных героев переводческого фронта, которые делают то, что, строго говоря, уже выходит за рамки перевода. Несколько примеров навскидку из необозримого моря более-менее удачных находок:

1. "President Bush is so dumb that when someone asked him what the capital of Texas is, he said, 'Capital T.'" (из "Вечернего шоу с Дэвидом Леттерманом").

"Президент Буш настолько туп, что когда его спросили, с чего начинается Родина, он ответил "С буквы Р".


Обыграна игра слов "Capital = столица / прописная буква".


2. "Can you herd sheep?" - asks the little ranchman. - "Do you mean have I heard sheep? says I" (О. Генри, "Как скрывался чёрный Билл").

"А не можете ли вы пасти овец? - говорит этот недоросток. - Не могу ли я спасти овец? - удивился я".


Обыграно созвучие "herd - heard".


3. "It didn't exaсtly beggar description, but it certainly had that word on the lookout for the mendicancy squad" (О. Генри, "Дары волхвов").

"В обстановке не то чтобы вопиющая нищета, но скорее красноречиво молчащая бедность".


Игра слов "beggar description" ("не укладываться в голове"), из которой автором взят изначальный смысл слова "beggar" (бедняк) и к нему "пристегнуто" словосочетание "mendicancy squad" совершенно непереводима, в итоге переводчик полностью заменил её на своё собственное изобретение, сумев при этом сохранить противопоставление за счёт использования совершенно иных языковых средств.


4. "Surely, that can't be serious" - "I'm serious. And don't call me Shirley" (х/ф "Аэроплан).

Почему переводчикам в ближайшие годы можно не опасаться машинного перевода, или на что пока не способны нейросети. Часть II – примеры. Перевод, Машинный перевод, Трудности перевода, Нейронные сети, Искусственный интеллект, Смысл, Переводчик, Длиннопост

"Не, ну с тобой невозможно о серьезном!" - "Я о серьёзном. И не называй меня Ниной".

Перевод Гаврилова:

"Но-но, Вы шутите". - "Нет, не шучу. И не называйте меня Нонной".

Для сравнения - более "гладкий" перевод на немецкий:

"Das meinen Sie doch nicht ernst". - "Das meine ich doch, und nennen Sie mich nicht Ernst".


Чистой воды отсебятина, более или менее удачная, с целью сохранить изначальный посыл - передать неправильное восприятие какого-либо слова как имени. В английском языке игра слов подобного рода, в связи с тем, что одному и тому же звучанию могут соответствовать самые разные слова, распространена гораздо шире, чем в русском.

5. "It's an entirely different kind of flying... altogether!" - Собеседники: "It's an entirely different kind of flying". (из фильма "Аэроплан").

"Я летал на совершенно другом самолёте, а на таком попробуйте повторить!" - Собеседники: "Я летал на совершенно другом самолёте, а на таком".


По-английски "altogether" одновременно значит "абсолютно" и в то же время совпадает со звучанием фразы "All together!" - "Все вместе".


6. "I scratched my hand when Jack kicked the bucket".

"Я оцарапала руку, когда Джек протянул ноги и опрокинул ведро" (из шоу Бенни Хилла).


Проблема в том, что простой перевод "kicked the bucket" как "протянул ноги" не годится из-за того, что на ведро завязана вся сцена, поэтому, чтобы передать все смыслы, приходится городить вот такой огород.


7. "She is beautiful and she uses Ponds" - "I use Ponds" - "So does a duck" (диалог жены с мужем из шоу Бенни Хилла).

"Она элегантна, она не расстаётся с Бурдой". - "И я не расстаюсь с Бурдой" - "Да ни один обед без неё не обходится".


Поскольку дословный перевод был бы полнейшей чепухой на постном масле, здесь перевод осуществлен за счет полной замены контекста: Ponds - марка средств для ухода за кожей и одновременно "пруд", "Бурда" - журнал мод и одновременно невкусное варево. Перед переводчиком остаётся только снять шляпу: он ухитрился перевести непереводимое, передав одну реалию другой и заставив зрителя улыбнуться. А что выдал бы нам искусственный интеллект?

Ну а ниже - пара примеров игры слов, где переводчики "сломали зубы":

1. "Bingo!" - фраза героя Лесли Нильсена из фильма "Голый пистолет" ("С пистолетом наголо"). Герой произносит эту фразу после того, как заглядывает в ящик стола во время обыска дома. Англоговорящий читатель думает, что герой нашёл то, что нужно ("Bingo" по-английски - "вот оно", "есть", "то, что надо"), но в следующей сцене из ящика извлекается... лото ("Bingo" по-английски в том числе и "лото"). Семантические поля здесь настолько тесно переплетены в рамках исключительно короткого высказывания, что адекватно передать эту игру слов просто не представляется возможным.

Почему переводчикам в ближайшие годы можно не опасаться машинного перевода, или на что пока не способны нейросети. Часть II – примеры. Перевод, Машинный перевод, Трудности перевода, Нейронные сети, Искусственный интеллект, Смысл, Переводчик, Длиннопост

2. "Well, I have to save my ass" - "What kind of knight are you?" (Из фильма "Шрек").


В оригинале обыгрывается игра слов: "ass" означает одновременно "осёл" и "задница", что ставит смысл высказывания "с ног на голову": на самом деле Шрек не трус, как кажется принцессе, а тот, кто хочет помочь своему другу. Ни в одном из 8 имеющихся переводов, включая переводы Гоблина, Гаврилова и Гланца, эта игра слов не передана. Хотя, в принципе, передать это при должном желании возможно, полностью сменив контекст (как в примере 7 выше) - естественно, не выходя при этом за рамки происходящего на экране.

Разумеется, всё это в той или иной степени имеет свои пределы. Взять, например, игру слов в русском языке, завязанную на созвучии слова "песец" и широко известного ядрёного словца, означающего "конец, кирдык, крышка".

Почему переводчикам в ближайшие годы можно не опасаться машинного перевода, или на что пока не способны нейросети. Часть II – примеры. Перевод, Машинный перевод, Трудности перевода, Нейронные сети, Искусственный интеллект, Смысл, Переводчик, Длиннопост

Представим себе пост на Пикабу, в котором автор упомянул бы какой-то случай из жизни, где бы это самое созвучие обыгрывалось тем или иным образом. Что последовало бы в комментариях, выйди этот пост "в горячее"? Разумеется, сотни шуток на эту тему, бурные юмористические обсуждения, а также десятки обыгрывающих это созвучие картинок. А теперь представим себя на месте переводчика, которому вдруг зачем-то дали задание перевести подобный пост на английский, причем максимально точно. Если бедолага подавит первое желание застрелиться, что ему остаётся? Разумеется, точный перевод "песец" (a polar fox) не годится. Следующий шаг - постараться найти аналогичное созвучие в английском языке. Если это получится - придумать англоязычные аналоги всем шуткам (от "3.14здец" до отсылок к фильму "Пипец") и нарисовать новые фотожабы, где вместо песца фигурирует это самое созвучное животное. Адская и довольно бессмысленная работа. Ну а если такого созвучия не найдется в принципе, хоть тресни? Вот тогда переводчику впору поднимать руки кверху - для него наступил "полный песец". Прониклись ситуацией? А теперь представьте на месте нашего незадачливого переводчика компьютер с нейронной сетью...

II. Серьезно осложняет жизнь переводчика перевод достаточно старых текстов, которые должны сохранить свою "архаику" и в переводе. Если речь идет о научных работах, то там проблемы не возникают - реалии передаются транслитерацией с соответствующими комментариями. С художественной литературой гораздо сложнее. Допустим, если в оригинале некоторые герои романа говорят на древнеанглийском языке, то абсолютно невозможно перевести их речь древнерусскими фразами, потому что мы таким образом внесем в перевод абсолютно неуместный в нём национальный колорит. Хочешь-не хочешь, а придётся поступиться прагматической эквивалентностью и перевести всё неким условным "старорусским языком" - это нечто пафосное и велеречивое, но не имеющее никакого отношения к древнерусскому. "Натравить" нейросеть на полученный массив переведенных текстов, конечно, можно, только какое отношение это будет иметь к переводу древнеанглийского? Это даже если опустить вопрос, откуда нам этот массив взять (может, и переводов-то таких было 5 штук за 20 лет).

III. Примыкает к предыдущему пункту и передача средствами языка перевода различного рода жаргона, просторечия, акцентных особенностей и т.д. В своей книге "Великое искусство" Корней Чуковский относил эту задачу к одной из труднейших для переводчиков. Однако по сравнению с предыдущими задачами эта представляется несколько более простой, потому что во всех языках есть свои жаргоны, просторечие, акценты... Другое дело, что подобные явления иногда могут различаться качественно - например, если в немецком языке диалектные различия очень сильны, то в русском они сильно сглажены, и переводчику немецкого фильма, где обыгрываются диалектные особенности, будет очень непросто. Как передавать различие литературного немецкого и швабского диалекта? Вологодским акцентом? И немецкий тут не одинок - вспомните целиком построенный на обыгрывании различий стандартного французского языка и одного из его диалектов фильм "Бобро поржаловать". Да и гораздо более однородный английский тоже не так уж однороден, и использование различий между британским и американским / различными британскими вариантами даёт создателям фильмов простор для творчества, а переводчику - повод задуматься. Однозначного решения тут опять же не существует - соответственно, если говорить про машинный перевод, ожидать от него каких-либо результатов не приходится.

IV. Фразеологизмы. В общем случае проблема решаема за счет того, что значительной части фразеологизмов языка оригинала соответствуют те или иные аналоги в языке перевода. Однако машинного переводчика здесь ждёт "подводный камень", который заключается в том, что некоторые фразеологизмы нельзя переводить их аналогами "из словаря" по причинам, которые уже были указаны в п. 2 - недопустимое создание национального колорита. Скажем, крайне странно будет смотреться перевод в английском тексте, повествующем об английских реалиях, пословицы "to carry coals to Newcastle" как "ездить в Тулу со своим самоваром". Переводчик, исходя из контекста, каждый раз будет решать эту задачу по-разному. Соответственно, некоего массива текстов, "натравив", на которые нейросеть, можно вывести некий усредненный перевод того или иного фразеологического выражения, в нашем распоряжении просто не будет. Аналогично не годится и перевод "прямым соответствием" тогда, когда имеет место частичная или полная "обратная семантизация", т.е. слова, утратившие в составе фразеологизма изначальный смысл, обретают его снова (см. примеры про "beggar description" и "kick the bucket" из п. I).


V. Технические/бытовые реалии, отсутствующие в языке перевода. В наш век стремительного научного прогресса практически каждый новый текст на иностранном языке привносит с собой какую-либо новую терминологию, ранее неизвестную, будь то NFC или Vape. Для данных конкретных терминов устоявшиеся переводы уже существуют, однако что будет делать нейросеть, натолкнувшись на термины, которые встретились впервые? Транслитерировать? Переводить дословно? Останавливаться и, жалобно пища и мигая лампочками, информировать переводчика, что требуется ручной перевод?

VI. Технические/бытовые реалии, присутствующие в языке перевода, но не попавшие в массив текстов для анализа (например, по той причине, что по данной тематике до сих пор не было переводов; потому что они существуют исключительно в устной речи в качестве профессионального сленга; или же просто потому, что "руки не дошли" и перевод, сделанный 20 лет назад, пылится где-то исключительно в бумажном виде). Мой любимый пример из книги "Профессия - переводчик" (Г.Э. Мирам):


"Попался нам с коллегой перевод текста по технике безопасности на нефтехимическом предприятии. В тексте расписывались обязанности рабочих смены в случае пожара и эвакуации персонала установки. Казалось бы, что тут может быть сложного. А вот что.

А ну-ка, попробуйте подыскать русские аналоги таких временных должностей, как Fire Manager (вроде бы ответственный за пожарную безопасность на смене, да не совсем), Fire Team Leader (начальник добровольной (добровольной ли?) пожарной команды на смене), Fire Contact (лицо, ответственное за установление и поддержание связи с муниципальной пожарной командой, полицией и скорой помощью; что, вот такой эквивалент и оставить?), Fire Master (вроде бы то же, что и Fire Team Leader, но Fire Team Leader сидит в конторе и руководит действиями пожарников оттуда, a Fire Master непосредственно возглавляет борьбу с огнем, а что же, спрашивается, тогда делает Fire Manager?), Evacuation Captain (человек, который ведет смену в убежище), Evacuation Controller (тот, кто контролирует проведение эвакуации, следит, чтобы никого не забыли и т.д.). И это только малая часть должностей, те, что я запомнил...

Конечно, точные русские эквиваленты подыскать можно, но для этого потребовался бы не один день работы с литературой (в каких библиотеках?), со словарями (какими? где взять?), консультации со специалистами (какими?)) иными словами, это работа на несколько дней для специалистов по разработке технической терминологии".

VII. Просто нерегулярные соответствия, обусловленные различием синтаксисом двух языков и иногда даже не имеющие ни единого ключевого слова для привязки, но даже если привязка к какому-то слову есть, вычленение её крайне сложно (например, в русском: именительный падеж существительного + творительный падеж этого же существительного, вроде "свинтус свинтусом", "отдых отдыхом, но..."; глагол в инфинитиве + глагол в прошедшем времени, вроде "дочитать дочитал"; именительный + творительный + рознь, вроде "яблоки яблокам рознь"; в английском - "a something of someone", вроде "a jerk of a fireman").

VIII. И, наконец, самое "простое" - более или менее регулярные соответствия синтаксических структур, сопровождающиеся, однако, существенным изменением структуры предложения. На фоне предыдущих пунктов этот может показаться сущим пустяком и, казалось бы, что-то, а подобное даже статистические методы должны "брать" - однако они, увы, подобные различия "не "схватывают". Например, русский и английский технические тексты - два совершенно разных стиля. Опытный переводчик понимает, как нужно изменить текст, чтобы он "звучал по-русски", компьютер - нет, хотя материала для сравнения у него вроде как более чем достаточно. Про публицистику и художественные тексты и говорить не стоит.


1. The infrared radiation of this tank is collected by the optical system and focused on the oscillated mirror which in turn bounces the signal onto a detector array comprised of numerous tiny sensors. After the sensor signal is amplified, the electronic picture is picked up as an image by the display array. The observer perceives the visible image by viewing the picture display reflected from the back of the same mirror.


Испускаемое танком инфракрасное излучение фокусируется оптической системой на плоском качающемся зеркале, после чего попадает на матричный приёмник излучения, состоящий из множества микроскопических чувствительных элементов. Полученный сигнал, пройдя через усилитель, превращается в электронное изображение на матричном дисплее, которое после проецирования на обратную сторону качающегося зеркала превращается в видимое изображение, доступное для наблюдения.


2. After a part has been produced using a combination of manual and electric control and the action in the form of signals from selsins recorded on magnetic tape, the tape is played back for automatically producing successive parts.


По мере того, как станок с ЧПУ под управлением оператора изготавливает ту или иную деталь, координаты для позиционирования инструмента по сигналам с сельсинов записываются на магнитную ленту. Воспроизведение этой ленты позволяет изготовить дальнейшие детали автоматически.


3. The falling shadows of evening bring no silencing to its towering skeletons of steel, its dropping and rising buckets unloading barges of coal, sand and gravel, or its great dry docks capable of lifting the greatest ships so that men may work under its monstrous keels.


Шум, висящий над их возносящимися ввысь ажурными стальными конструкциями, над причалами, где идёт разгрузка барж с углем, песком и гравием, над вместительными сухими доками, рассчитанными на работу под килями самых больших существующих судов, не стихает и тогда, когда на землю ложатся предзакатные тени.

Как видим, от синтаксиса оригинала в переводе остаётся либо ничего, либо крайне мало - а всё по причинам, изложенным в предыдущем посте (синтаксис - не догма, а руководство к действию). Переводчик берёт смысл и строит на его основании текст перевода; компьютер же, будь то статистический алгоритм или слабый ИИ на основе нейросети, вынужден брать за основу синтаксис оригинала - именно потому, что ему катастрофически не хватает мощности той базы данных, которая построена на основе сравнения / на основе вычленения каких-то концептов.

Уже предвижу возмущение в духе "большая часть посвящена трудностям перевода художественных текстов, так нечестно по отношению к компьютеру!". Однако, во-первых, кто сказал, что всё будет легко и просто? Раз мы готовим полноценную замену человеку, то и трудности надо брать "по всему фронту работы", а он вовсе не исчерпывается переводами технического характера. Да и те энтузиасты нейросетей, которые пишут в комментариях нечто в духе "Вы не представляете возможностей машинного перевода и уподобляетесь тем, кто отрицал необходимость автомобилей и компьютеров" тоже никак не разграничивают технический и художественный перевод, то есть, надо полагать, считают, что никакой принципиальной разницы тут нет - ну, на нет и суда нет. Во-вторых, напомню простую вещь - перевод, даже на первый взгляд самый простой, есть не что иное, как акт межкультурной коммуникации. Любой текст, даже самый что ни на есть технический, написан на языке, особенности которого отражают особенности культуры носителей этого языка, "растёт" из соответствующего этой культуре контекста, поэтому любой перевод без погружения в этот контекст всегда останется изучением кругов на воде без попыток выяснить, что за живые существа в водоёме эти самые круги пускают.

Думаю, на этом можно и закончить - надеюсь, я сумел донести до читателя весь "масштаб бедствия". Ну а если всё изложенное выше всё равно не убедило каких-то энтузиастов машинного перевода, у которых возникли возражения в духе "Автор просто не понимает, о чем говорит - все эти проблемы решаемы, поскольку 1), 2), 3)..." - приглашаю высказываться в комментариях. Но на всякий случай повторю ещё раз - лично у меня особых сомнений в появлении более-менее адекватного машинного переводчика в более-менее отдалённом будущем нет. Другое дело, что, на мой взгляд, по всем описанным выше причинам появление такого переводчика будет означать появление искусственного интеллекта, сопоставимого с человеческим, а это значит, что совет "вам стоит поискать другую работу, профессия переводчика в будущем бесперспективна" будет чем-то из разряда совета человеку, который в ожидании ливня стоит под деревом: "Это дерево скоро промокнет, лучше перейдите под другое". Когда появится и пойдет в широкий обиход "сильный" ИИ, мы окажемся в совсем другом мире с совсем иными проблемами - но это уже совсем другая история.

Для дальнейшего чтения:


Станислав Лем. "Сумма технологии" (1967), раздел "Сомнения и антиномии".

http://e-libra.ru/read/342260-summa-tehnologii.html


Корней Чуковский. "Высокое искусство" (1964).

http://e-libra.ru/read/176983-vysokoe-iskusstvo.html


Марк Фрейдкин. О трудностях перевода французского поэта Брассенса.

http://sova-f.dreamwidth.org/91943.html


Ольга Седакова. Перевести Данте.

http://magazines.russ.ru/znamia/2017/2/perevesti-dante.html


Игра слов: чего боятся профессиональные переводчики.

https://theoryandpractice.ru/posts/6975-kommentarii-perevodc...


О переводе фильма "Бобро поржаловать".

http://www.interfax.ru/culture/135626

https://www.exler.ru/films/07-06-2010.htm


Елена Вешняковская. Читать 2.0: компьютеры учатся добывать из текста смысл.

https://www.nkj.ru/archive/articles/25308/


Джеймс Баррат. "Последнее изобретение человечества. Искусственный интеллект и конец эры Homo Sapiens" (русский перевод - 2015).

http://readli.net/poslednee-izobretenie-chelovechestva/

Найдены дубликаты

65 комментариев

по актуальности
+10

Ну ты силён, столько накропать. Но прочитал с превеликим интересом.

раскрыть ветку 18
+5
Спасибо. Эх, жаль, что больше почти никого не заинтересовало. Самый непопулярный пост оказался из всех, посвященных переводу.
раскрыть ветку 17
+3
Потрясающий пост, вдохновляет каждая вторая фраза. Я поражаюсь отдельном мыслям и всей теме в целом. У Вас прекрасный кругозор, отличное чувство юмора и замечательная база (не знаю, специально ли Вы готовились и "лопатили" огромное количество информации, или просто очень эрудированы). Многие абзацы перечитывала по несколько раз, чтобы насладиться. Сейчас предвкушаю, как полностью перечитаю еще раз обе части поста, а потом открою рекомендованные книги. Большое Вам спасибо, получила колоссальное удовольствие! Очень надеюсь, что Вы продолжите писать о переводе!
раскрыть ветку 1
+2

Человека технического эти посты не очень заинтересуют, просто потому что вы делаете совершенно не правильные с технической точки зрения выводы.
Любая новая технология должна сперва начать хорошо работать на 80% самой простой информации. Художественная литература на попадает ни в 20%, ни в 5%, её исчезающе мало.
В этом посте (втором в серии) вы вообще рассказываете о настолько крохотной части всех текстов, что перевод этих вещей без всяких проблем можно передать переводчикам.
Подобное построение своих мыслей оттолкнет любого, кто в состоянии провести аналогию:
"Вот есть ткачи, они ручками ткут ткани, вяжут носки. Есть такие мастера, которые могут связать цельновязанные, бесшовные вещи, никакая машина такого не сможет сделать. Значит ткачи никогда никуда не денутся."
На деле же, в ближайшие годы (5 лет - это максимальный срок), услуги переводчиков не потребуются для таких вот вещей:
- перевод информационных сайтов: там где дается информация без художесвенных изысков.
- перевод информационных статей: редкие обзоры содержат очень уж заковыристые фразы, авторам проще будет приспособиться писать так, что бы по одному клику перевести статью на десятки языков.
- научные статьи: специализированный язык довольно прост, решить проблему правильного подбора эквивалентов терминов не столь и сложна, контекст довольно хорошо очерчивается.
- всевозможные информационные бумажки, руководства и прочее.

Многие социальные статьи просто изменятся, проще сократить список используемых фразеологизмов ради того, что бы не пришлось платить за перевод.

Как результат, машинные перевод скоро отнимет работу у 80% переводчиков. Естественно, у серой массы, тех, кто не может офигенно переводить самые сложные и интересные тексты.
Все произойдет очень аналогично с другими профессиями, будь то ткачи, токари или кто то еще: останутся только самые лучшие, которые смогут решат настолько сложные задачи, которые машина не будет решать по экономическим причинам.

раскрыть ветку 7
+1
Как-то начал смотреть американский сериал Jerry Seinfeld Show и у меня такой же вопрос возник, как перевести  на русский. Там много шуток, которые связаны с культурой и историей, опытного переводчика поставит в тупик, а ИИ и подавно не потянет.
раскрыть ветку 2
+1
Тема слишком абстрактная. По сути, общение на уровне "сейчас МТ не справляется, давайте поговорим о том, как космические корабли бороздят просторы большого театра".

Плюс довольно разное вИдение конкуренции в отрасли, как у того юзера, например, который считает что рынок русскоговорящего населения (168 млн человек по скромным оценкам) никому не нужен бугагашечка

раскрыть ветку 3
+5

всегда поражалась мастерству перевода Алисы в Стране Чудес... найти такие эквиваленты - это много стоит. и это может только очень мудрый и умный человек. так что нейроперевод - это реалии очень отдаленного будущего. если вообще возможно будет.

+4
Я слышал ещё такой вариант перевода эпизода "Аэроплана!":
- Вы серьёзно что ли?
- Я говорю серьёзно. И не называйте меня Штоллем.
раскрыть ветку 1
+1

Неплохой вариант :-) Уж точно лучше, чем вариант Гаврилова с "Но-но". И вообще - Гаврилов, при всем к нему уважении, с переводом "Аэроплана" справился хорошо если на тройку.

+3

C огромным удовольствием прочитал оба Ваши материала и отослал ссылки жене с рекомендацией. Навеяло тем, что она с зимы помогала дочке писать диплом и прошерстила сотни тематических статей из английской прессы первого эшелона (к сожалению всё меньше из них доступны в онлайне бесплатно). При том, что до этого дальше школьной программы (и того, что можно назвать языковым образованием в неязыковом ВУЗе) она не двигалась. Как говорится, нужда заставила калачи есть - вот и она отталкивалась от гуглоперевода, маялась сама и терроризировала меня с разъяснениями и помощью. С учетом её дотошности и ненаписанной кандидации (в смутное и голодное время ей пришлось уйти из науки за хоть каким-нибудь рублем) работа в итоге была способна потянуть на диссертацию, паче чаяния кому-нибудь пришла бы в голову такая идея.

Короче, спасибо! Читая Ваши материалы, периодически примерял на себя зубодробительные примеры (экое масляное масло вышло, однако!) и вспоминал похожие случаи из своей практики. К сожалению у меня нет системного языкового образования, за плечами только советская спецшкола (9 лет английского) и, скажем так, некоторое чутьё и способности к языкам, плюс неплохая практика уже в более зрелые годы. В смутные времена был опыт работы фрилансером в техническом переводе для разных контор и конторок, немного пробовал перо в переводе тогда еще не до конца захлестнувшей рынок фантастики и триллеров, и даже немного (один учебный день (:-)) устного перевода в нашем учебном центре (подготовка специалистов сварки и техники безопасности для нефтегазовых компаний), где я заведовал IT-делами. Как всегда неожиданно заболел приглашенный переводчик, и мне пришлось стать посредником между нашим преподавателем и группой индийских студентов, проходивших двухнедельный курс. Что характерно - справился (:-)), хотя и чувствовал себя выжатым лимоном уже к середине дня...

Но это так, лирическое отступление. Главное - то удовольствие, которое доставили Ваши тексты.

В комментариях видел Вашу полемику с некоторыми "упертыми" технарями. Я считаю, что им можно оставить их убежденность Как говорится: "слесарю- слесарево" (без личностей и обид (:-)). Есть такое высказывание: - Он не знал, что это неразрешимая задача. Потому и решил её.

Пусть работают, хуже не будет. И если при этом не совсем понимают Ваши доводы или не(внимательно) читают Ваши слова - я считаю, что это не самый большой грех.

Ссылку на эти материалы я взял у Олега Макаренко, aka Фриц Морген, на КОНТе. Я думаю, от него к Вам придет немало читателей, поэтому останавливаю свое словоизвержение.

Успехов Вам.

Игорь

P.S. Из-за Вас пришлось (:-)) зарегистрироваться на pikabu ...

раскрыть ветку 3
+1

В жизни бы не подумал, что мои материалы будет распространять Фрицморген. >_< Поискал этот КОНТ в сети. Жаль, что там в описании указано "в техническом переводе человек против робота не устоит", моя идея была не в последнюю очередь в том, что и в этой области роботу с человеком пока тягаться рановато. В любом случае спасибо за обстоятельный комментарий, рад, что материалы пригодились и доставили приятные минуты :) Иногда возникает ощущение, что только тот технарь, которые в своё время как следует окунулся в перевод, может понять весь масштаб задачи, а иначе все эти рассуждения для него - сотрясение воздуха.

раскрыть ветку 2
+1

Не только на конте. http://fritzmorgen.livejournal.com/1072245.html

раскрыть ветку 1
+1
Интересно.
В случае с ослом и задницей спецом глянул немецкий фильм - там тоже не заморачивались и смысл потерялся.
На русском стоило бы в начале фильма Шреку назвать осла "шкурой", связав таким образом осла и шкуру, и на этом сыграть в эпизоде:
"Ну а пока мне надо спасти мою шкуру" или что-нибудь в этом роде.
раскрыть ветку 1
0
А что, отличный вариант! Единственно, что слово "шкура" в качестве ругательства слегка устарело и современные детишки могли бы его и не понять.
+1

Огромное спасибо за статью. Читал с очень большим интересом, особенно примеры

+1
По -моему самое прямое доказательство того, что машинный перевод пока не готов работать без поддержки человека.
Иллюстрация к комментарию
раскрыть ветку 1
0

Вот тут как раз я не уверен в том, что это машинный перевод :-) Помню подобные тексты в духе "Нога, корень здоровья" ещё по 90-м, когда машинных переводчиков с китайского ещё не существовало. Скорее, работа дядюшки Лю с китайско-русским словарём. Сейчас, кстати, такие корявые переводы с китайского уже сходят на нет - у китайцев, видимо, уже достаточно денег, чтобы привлечь нормальных переводчиков.

+1
Спасибо огромное за реально интересный и познавательный пост!!! И отдельное спасибо за ссылки на книги, особенно Маршака) удачи вам и ждем новых постов!
+1
Прекрасная статья. Поделюсь с ценителями.
Иногда досада берет при чтении перевода - например, самый распространенный ляп - mince pies. В 3х мне известестных книгах везде был перевод "пирожок с фаршем", "мясной пирожок".В одной вообще была нелепица- перевели о заготовке "фарша" за несколько месяцев , чтобы настоялся. На самом деле речь о сладком угощении к рождеству в англии.Сладкую начинку готовят загодя, с бренди, изюмом итд. Непонятно, от куда такие ляпы , особенно во времена гугла.
+1

Очень интересно! Пожалуй, перешлю свое дочери-студентке с приказом принудительно изучить совместно с товарищами. А то задрали уже присылать маме-переводчику гуглопереводы с просьбой "поправить, чтоб норм было". Каждый раз приходится ругаться и объяснять, что это называется не "поправить" а "перевести заново".

раскрыть ветку 6
0
"поправить, чтоб норм было" - согласен, это настоящее бедствие, которое появилось тогда, когда компьютер уже более-менее научился приглаживать синтаксис. Когда всё было на уровне Промта, тогда с первого взгляда было ясно, что перевод никуда не годится; в наши дни, когда есть согласование падежей и нет фраз в духе "голый кондуктор бежать под тележкой", убедить людей в том, что текст представляет собой не перевод, а убогую кальку, стало гораздо сложнее.
раскрыть ветку 5
+1
убедить людей в том, что текст представляет собой не перевод, а убогую кальку, стало гораздо сложнее.
А тут скрыта отдельная проблема: многие люди не носители родного языка, а переносчики. Они не видят разницы между нормальным текстом и аццкой калькой.
раскрыть ветку 4
+1
Транслитерировать?

Таки да. Есть техника разбития непонятных слов на куски и попытки перевода их.

слабый ИИ на основе нейросети, вынужден брать за основу синтаксис оригинала

Почему? А как же столь любимая нынче архитектура Encoder-Decoder, в которой идёт попытка извлечь смысл исходного предложения, и переводить на основе его, а не синтаксиса?


А вообще, очень интересный текст, спасибо. И с остальными вашими пунктами я согласен - текущие статистические системы действительно такое не осилят.

раскрыть ветку 3
0

Вроде уже извлекают смысл главная проблема это длинные последовательности.

0
"в которой идёт попытка извлечь смысл исходного предложения" - так в том и проблема, чтобы извлечь смысл. Если мы научимся его извлекать, то остальное уже - дело техники. Но встаёт вопрос, возможно ли извлечь смысл, не забив предварительно в компьютер, нейросеть или что-то ещё все знания о человеческой цивилизации в виде некой перекрестной базы данных - об этом подробнее в предыдущем посте. Потому что ведь смысла текста самого по себе не существует, он всегда произрастает из чего-то большего, чем сам текст.
раскрыть ветку 1
+2

Конечно, он извлекается неидеально, и там много проблем, но я это написал к тому, что нынче упор на синтаксис исходного предложения больше не идёт (по крайней мере, в переводе с помощью глубокого машинного обучения).

+1

Ну и прекрасно, в следующем году выпускаюсь, как раз об этом задумываться начал

0
Привет! Порегался потрещать. В целом-то я полностью согласен с темой двух постов. Но вот пример

3. "It didn't exaсtly beggar description, but it certainly had that word on the lookout for the mendicancy squad" (О. Генри, "Дары волхвов").
"В обстановке не то чтобы вопиющая нищета, но скорее красноречиво молчащая бедность".

НЕ является хорошим переводом. Переведена не суть фразы вообще.

Поясню.


Игра слов "beggar description" ("не укладываться в голове"), из которой автором взят изначальный смысл слова "beggar" (бедняк) и к нему "пристегнуто" словосочетание "mendicancy squad" совершенно непереводима, в итоге переводчик полностью заменил её на своё собственное изобретение, сумев при этом сохранить противопоставление за счёт использования совершенно иных языковых средств.

beggar - это попрошайка, а не бедняк. и это 100% потверждается наличием производного от mendicant. Кстати, куда подевался squad в этом "удачном" переводе? Так вот, неправильно, пмсм, использовать рафинированное идиоматическое значение, игнорируя его суть и корни. Beggar description, это байка нищеброда, которой он жалуется на судьбу, обосновывая необходимость получить деньги. И при этом, само собой, врет, как сивый мерин. Или как Троцкий на Кубани. И вот это, пмсм, гораздо более близкие идиомы.

Но ближе к сути. Смысл фразы в том, что "это" исключало формальное определение модус вивенди как "попрошайничество/бродяжничество", но с т. з. "mendicancy squad", а именно, подразделения полиции по борьбе с оными, было именно тем самым определением. А игра слов на тему что беггар мог с жаром рассказывать прохладные истории о том что он не беггар, но властям от его слов было ни холодно ни жарко, лишь раскрашивает смысл.

Т.е. переводчик затруднился перевести именно mendicancy squad, и сделал красивую залепуху.
раскрыть ветку 6
0

Спасибо за подробное интересное объяснение с экскурсом в историю. Век живи - век учись! Таких тонкостей я не знал; когда читал этот рассказ в оригинале, в словарь не залезал, и, честно говоря, думал, что "mendicancy squad" - это что-то типа красивого оборота, чтобы обозначить нечто в духе "толпа попрошаек", так что ваше объяснение открыло для меня новые горизонты. В моем представлении, раз "beggar" - это бедняк (или "попрошайка") , а "mendicancy squad" - якобы "толпа попрошаек", то, стало быть, комната пока что не самая бедная, но стоит на пороге великой бедности. А оно вон как на самом деле оказалось :-)

А спорить тут не о чем. Я, кстати, и не писал, что это "хороший перевод" - выше у меня красной нитью проходит тема "отсебятины, в которой хорошо, если получится передать часть смысла". Ну да, получается, что это "красивая залепуха". Но адекватно перевести это, передав игру слов, имхо, не легче, чем "Lock, stock and two smoking barrels".

Так что основной посыл поста после этого только усилился. Профессиональный переводчик не справился, а мы робота хотим научить :-)

раскрыть ветку 5
0
>комната пока что не самая бедная

не, не в бедности дело. про отдел полиции по делам бедных я что-то пока не слышал. криминогенность, скорее.
т.е. комната, была почти ночлежкой, и "почти" было столь мало, что полисмены не делали различий.

> Профессиональный переводчик не справился

а он, скорее всего, не должен был. просто потому что это профессия - ему за это деньги платят. если он на каждый фразеологизм будет разбираться, он с голоду помрет. тратить несколько часов на разбор, а в доинтернетные времена дней на подобную фразу - непрактично, проще состряпать залепуху.

Я не профессиональный переводчик, но мне сразу резануло, что неясно вообще, что такое "IT" и что оно конкретно "DID NOT". полез за контекстом, оказалось что it - это "объявление о сдаче мебилированных комнат внаём".

А тогда, опуская идиомы и игру, перевод будет таков:

Объявление не было совсем уж "beggar description", но именно слово "beggar" приходило на ум полицейским из департамента по борьбе с бродяжничеством.

Дальше дело за малым, решить каков будет перевод, простой:

Объявление не было совсем уж враньем, но слово "ночлежка" сразу же приходило на ум полицейским из департамента по борьбе с бродяжничеством.

с полукалькой, смещая акцент на "небылицу":

Объявление не было совсем уж попрошайкиными небылицами, но именно слово "попрошайка" сразу же приходило на ум фараонам из департамента по борьбе с бродяжничеством.

Если совсем не терпится, можно и с идиомами:

Объявление не было совсем уж из разряда "про семь бочек арестантов", но именно слово "арестант" тут же приходило на ум фараонам из департамента по борьбе с бродяжничеством.

ну или без оных, но с каламбуром, и свободным полетом фантазии а-ля "Boromir smiled"

Объявление не было совсем уж стопроцентным враньем, но фараоны из департамента по борьбе с бродяжничеством на облавах процентов не считали.

могу еще пяток каламбуров накидать, пока ходил в спортзал, все в голове крутилось :-)


т.е. непрофессионал, но для кого это интересно, и есть немного времени - справляется. хотя, несомненно, одного желания мало, кругозор нужен. Где вот грань между "хорошим переоводом" и "продуктивностью" - неясно. Самый поганый перевод что я видел - был "Автостопом по галактике", не помню, кто именно. Переводил явно студент, резал по живому.
раскрыть ветку 4
0

Я думал тут будет обзор современных метод((

Что то вроде word2vec или нейронный сетей с вниманием ((

-2
NFC или Vape.

Out of Vocabulary, или как там эта штука называется. В словаре конкретной сетки не будет даже всех используемых слов.


Ну а если в целом по тексту: это больше технические ограничения. Любая двухслойная сетка может выучить все возможные комбинации переводов -- нужно только дать их ей. А если их нет у человека -- так с чего вдруг нейросеть должна знать больше, чем человек?

раскрыть ветку 10
0
"Любая двухслойная сетка может выучить все возможные комбинации переводов -- нужно только дать их ей" - ну, только если дать ей впридачу ещё и бесконечный объём памяти. Однако даже если б это было возможно мы уперлись бы в то ограничение, что число текстов, как и их переводов, бесконечно, а то, что мы можем подать на вход нейросети - конечно, даже если это десятки миллиардов текстов. Так что эта задача простым наращиванием статистики не решается. Как пишет Лем в "Сумме технологии":

"...Пусть так, скажет кто-нибудь, пусть хорошие переводы образуют множество, может быть, даже потенциально бесконечное, но можно справиться и с этим, использовав понятие континуума... Оно благородного рода, ибо происходит от математики, но конструкторы... не хотят – осмотрительно! – принимать столь великодушный подарок. Одно дело – почтенный, хоть и бессильный синонимический словарь, и совсем другое – пресловутый континуум, чья бесконечность способна разворотить любые словари. Разумеется, мы, когда беседуем, не страшимся этого континуума – ведь мы-то понимаем, что говорим."

раскрыть ветку 9
-1
число текстов, как и их переводов, бесконечно

Да ну?

раскрыть ветку 8
-6
>уровню сильного ИИ
Дальше не читал.
ещё комментарий
Похожие посты
Возможно, вас заинтересуют другие посты по тегам: