Искусственный интеллект в мире перевода: заменят ли роботы специалистов?

11 октября 2024

Проблемы на книжном рынке и развитие искусственного интеллекта (ИИ) ставят под угрозу труд переводчиков. Будут ли дальше читатели и издатели ценить тонкую профессиональную работу высококвалифицированных специалистов? Или всем им суждено стать лишь редакторами текстов, созданных ИИ? О том, что об этом думают переводчики со скандинавских языков, оказавшиеся на краю пропасти инноваций, в колонке для Eurozine пишет Ян Жиль, председатель Шведско-английской ассоциации литературных переводчиков (SELTA), исследовавший влияние переводной скандинавской литературы на британский литературный рынок XX—XXI вв.ека.

О чате GPT и генеративном ИИ (так называют систему ИИ, которая способна генерировать текст, изображения или другие медиаданные) активно заговорили в конце 2022 года. Вы могли задуматься о влиянии ИИ на издательское дело после расследования The Atlantic в 2023 году. В нем говорилось, что ИИ учился на сотнях тысяч книг из пиратской библиотеки.

В январе 2024 года Общество авторов Великобритании провело опрос своих участников о том, как генеративный ИИ повлиял на их работу. Результаты, опубликованные весной, заставили задуматься. Более 40% респондентов сообщили о снижении доходов из-за ИИ. И более 75% опрошенных переводчиков ожидают, что ИИ негативно повлияет на их будущие доходы.

Лично у меня внутри все сжалось, когда в феврале 2024 года я прочитал в шведской газете Aftonbladet статью с провокационным заголовком «ИИ заменит всех переводчиков». В ней Калле Хедстрём Густафссон паниковал по поводу вторжения ИИ в мир перевода и неминуемого вымирания профессии. Он говорил, что переводчики зарыли голову в песок и что ИИ уже создает переводы некоторых видов литературы, которые можно публиковать после минимального редактирования. И, что еще более ужасно, доминирование технологии во всех видах литературы неизбежно.

Читая, я понимал, что это «пугалка». Но реакция моего организма не подводила — многое из этого «пророчества» было правдой. Если роботы пришли за переводчиками на шведский, то они придут и за мной, работающим на шведском. Я впервые стал серьезно думать, чем бы я мог заниматься кроме перевода. Почему я не задумывался об этом раньше, если всерьез мог в скором времени остаться без работы?

Технические возможности

В начале 2010-х годов, когда я начал карьеру, компания Google уже 10 лет предоставляла возможность онлайн-перевода в том или ином виде. К 2012 году к сервису Google Translate ежемесячно обращались порядка 200 миллионов человек, а статистический машинный перевод (SMT) использовался в течение шести лет. Инженер Google Франц Ох говорил: «То, что все профессиональные переводчики в мире делают за год, наша система переводит примерно за один день». Он предлагал читателям «представить будущее, в котором каждый человек может обмениваться информацией или потреблять ее, независимо от того, на каком языке она написана».

Неудивительно, что мои коллеги тогда шутили, что дни нашей переводческой практики сочтены. Однако профессия не вымирала так быстро, как мы ожидали. Возможно, отчасти потому, что в мире коммерческого перевода инструменты автоматизированного перевода (CAT) использовались давно. Я говорю о ситуациях, когда программное обеспечение разбивает исходный текст на сегменты (чаще всего по предложениям), а затем специалист переводит каждый сегмент, и он сохраняется в памяти переводов. Впоследствии программа и ее пользователь могут обращаться к ней и использовать ее в своих интересах. Инструменты CAT значительно повысили производительность труда в переводческой отрасли. Но качество SMT было недостаточно высоким, чтобы говорить о его быстром развитии. Тем не менее, было ощутимо, что роботы вошли в обиход коммерческих переводчиков.

В середине 2010-х годов случился новый прорыв: появился нейронный машинный перевод (NMT). NMT констатировал: предложения машинного перевода становятся все лучше. По крайней мере, в случае шведского и английского — относительно близких в лингвистическом отношении языков и имеющих большие массивы данных для создания таких систем. Цены на услуги не росли. Сроки выполнения работ сокращались. Во время пандемии казалось, что настало время технологий. А потом 30 ноября 2022 года был запущен ChatGPT, и мир слегка сошел с ума.

Скандинавский книжный рынок

Неудивительно, что появление полноценного генеративного ИИ не улучшило ситуацию для коммерческих переводчиков. Казалось, литературных переводчиков это не коснется. Но такой подход оказался ошибочным.

Прошлым летом крупное датское издательство, которое пыталось выйти на рынок перевода электронных и аудиокниг, написало мне [про использование ИИ]. «Мы разрабатываем идеи, которые помогут повысить эффективность конвейера переводов». Они писали об использовании CAT-инструментов и, что еще важнее, результатов машинного перевода и постредактирования.

Другое крупное скандинавское издательство, которое тоже хотело «завоевать мир», использовало, по словам моего коллеги, аналогичный подход. СМИ писали, что у компании финансовые трудности. Если раньше они инвестировали в работу переводчиков, то теперь обращались к переводческим компаниям. Вероятнее всего, те демпинговали и пользовались всеми бесплатными лайфхаками для перевода из интернета.

В Скандинавии хорошо развита культура грамотности и чтения, а также книжный рынок. В XXI веке он выглядит все более инновационным. Хотя электронные книги в Скандинавии не стали популярны, как в других странах (возможно, потому, что Amazon только недавно вышел на рынок), регион стал пионером в мире стриминга аудиокниг, «гибридной» модели книгоиздания (авторы частично оплачивают публикацию). А на рынке иностранных прав он может потягаться с англо-американским агентурным миром. К осени 2022 года в Швеции появилось новое литературное агентство, обещавшее помочь авторам добиться публикации в Швеции, и, что еще важнее, выйти на зарубежный рынок, минуя «экономически неэффективный подход», то есть «дорогих» переводчиков. К началу 2023 года шведские СМИ писали, что издательство Lind & Co решило использовать ИИ для перевода фантастики на шведский язык, а специалисты негодовали в соцсетях.

Назад в 2024. Оттепель

Вернемся к тому мрачному предзнаменованию Калле Хедстрёма Густафссона в Aftonbladet. Через день после того, как я его прочитал, мне позвонил шведский литературный агент и спросил, смогу ли я за 36 часов перевести большой кусок текста с помощью ИИ. Мне снова поплохело. Становление скандинавской индустрии прав во многом обусловлено использованием длинных образцов переводов оригиналов на английский язык, и их производство — ценный источник работы для таких переводчиков, как я. На этот раз я был действительно занят и мог отказаться от проекта без раздумий.

Конечно, причина такой спешки заключалась в том, что до Лондонской книжной ярмарки (LBF) оставалось всего несколько дней. Я прибыл туда в мрачном настроении. В первый же день я увидел в журнале The Bookseller статью о том, что литературные скауты «переключились» на использование ИИ в своей работе, это касалось и «сэмплов». Позже я видел, как была переполнена площадка Центра литературного перевода, где шла дискуссия на тему перевода и ИИ.

Когда шумиха вокруг LBF осталась позади, тошнота, которую я чувствовал в феврале и марте, отступила. Мне льстили те, кто покупал и ценил мои переводы. Тревожные статьи отошли на второй план, поскольку я получал от клиентов комиссионные за переводы, сделанные мной. Но тут я получил еще один запрос — на «опытного переводчика» для редактирования книги, переведенной с помощью DeepL Pro, требовалось довести ее до «высочайшего качества». После долгих раздумий — в конце концов, такие образцы переводов стоят дорого и экономия на расходах, возможно, — мудрое бизнес-решение литературного агента — я вежливо отказался без объяснения причин.

И тут — бам — скандинавская тяга к инновациям дала о себе знать. В мае было объявлено о запуске нового издательства Aniara Press. Эта шведская компания будет заниматься переводом, публикацией и распространением книг на семи языках на 14 рынках — и все это с помощью ИИ, создающего переводы, и пост-редактирования. Основатель компании заверил потенциальных авторов, что переводчики и редакторы по всему миру будут готовы «проверять» переводы их произведений, выполненные ИИ. Это тревожно.

На перепутье

Отчасти проблема с ИИ — в нечеткой терминологии. Слово «ИИ» часто употребляется без уточнения — речь про большие языковые модели (БЯМ) и генеративный ИИ, например ChatGPT, или другой, негенеративный, аналитический или ориентированный на задачу ИИ. В контексте перевода мы чаще всего используем «ИИ» для обозначения интеллекта, ориентированного на решение конкретных задач, в виде статистического машинного перевода и NMT. Но не всегда. Даже в рамках одной сферы — много противоречий.

В статье для летнего выпуска 2024 года журнала Британского авторского общества «Автор» переводчица Рут Ахмедзай Кемп исследует вопросы, связанные с литературным переводом и ИИ. При упоминании ИИ каждый специалист думал о своем. Переводчик с казахского на английский рассказывал о преимуществах и недостатках работы с CAT-инструментом с опцией машинного перевода, с которым можно консультироваться. По его словам, это то же самое, что старый добрый словарь под рукой, который можно быстро и эффективно пролистать. Другой переводчик, работающий с французским языком, говорил о трудностях, возникающих при редактировании текстов после машинного перевода. Переводчик, работающий с немецким языком, подчеркивал, что сам термин «постредактирование» — туманный: экономные издатели надеятся, что машина сделает всю тяжелую работу, а человек лишь немного ее отполирует и перевод получится быстрее и с меньшими затратами. Тем не менее, тщательное редактирование требует больших усилий, поскольку необходимо сопоставить весь переведенный текст с источником.

«Непереводчики» часто думают, что мы можем просто «скормить» ИИ книгу и взять все, что он выдаст. Следовательно, это будет быстро и дешево. Переводчики воспринимают такую работу как-то, что им нужно будет взять «перевод» ИИ и проверить его. То есть пройти через рутинный, скучный и ресурсозатратный рабочий процесс. Однако я вижу, что издатели, как правило, вообще отказываются от услуг переводчика, они просто поручают редактору отшлифовать текст, подготовленный ИИ, и тот не обращается к оригиналу.

Следовательно, качество продукта падает. Хедстрем Густафссон настаивает на том, что ИИ может многое переводить хорошо. С этим в целом согласен и шведский издатель Кристоффер Линд. Его компания использует машинный перевод только при работе с фантастикой. Во время дискуссии по этому поводу, многие отмечали, что такой перевод часто используется для произведений и авторов, которые в противном случае просто остались бы непереведенными. Однако шведская переводчица Йоханна Свартстрем утверждает, что большинство переводов, выполненных ИИ, можно назвать «любительскими». Она спорит с Густафссоном о том, что все, что остается сделать с таким текстом — лишь отполировать.

И снова можно сказать, что они говорят о разном. Густафссон (и Линд) предполагают, что ИИ создает переводы, достаточно хорошие для того, чтобы профессиональный редактор (не обязательно знающий язык оригинала) мог превратить их в текст, пригодный для публикации. Это может быть не самый лучший перевод, но это будет читабельная книга. Свартстрем же сосредоточена на качестве переведенного текста.

Восприятие качества имеет значение. Член группы по организации семинаров и конференций по компьютерному литературному переводу (CALT) британского Университета Суонси, доктор наук Рой Юдейл спрашивает, не мираж ли то, что показывает нам генеративный ИИ, например, ChatGPT. По его словам, для таких инструментов важнее всего скорость, в угоду которой они склонны «додумывать». Этот «мираж» — то, что также часто называют «галлюцинациями» (тенденцией ИИ ошибаться). В статье «ChatGPT — это чушь», опубликованной в журнале Ethics and Information Technology в июне этого года, авторы утверждают, что БЯМ, подобные ChatGPT, не просто «галлюцинируют», они на самом деле становятся машинами для создания чуши.

Возникает вопрос, что читатели ждут от книжных переводов? Гладкую отделку или что-то, что сущностно отражает оригинал?

Что насчет копирайта?

В своей статье Кемп рассмотрела ситуацию с авторскими правами литературных переводчиков в новую эпоху. Она доказывала, что важно сохранить авторское право за переводчиками даже при работе с NMT или ИИ. Кемп отметила не только то, что «процесс [перевода] остается сложным, творческим, потому что переводчик балансирует между двумя текстами: одним неизменным, а другим появляющимся», но и то, что «человек — а это действительно подготовленный, опытный двуязычный переводчик — контролировал» все инструменты «и продолжает контролировать (с точки зрения авторского права и морали) переведенный текст после его отправки».

Это расходится с недавним мнением Датского агентства по культуре и дворцам, высказанного в ответ на запрос Датской ассоциации переводчиков о пост-редактировании. В запросе говорилось о появлении практики, когда издатели переводили целые книги с помощью ИИ, а затем перед публикацией их существенно правили одноязычные редакторы, которые затем указывались как «переводчики». Вопрос был в том, имеют ли эти «переводчики» право на получение выплат (public lending right). В июне 2024 года правительство ответило резким «нет». Пост-редакторы не могут быть создателями произведений и не имеют права на получение этих выплат.

Эксперты по качеству и переводу

В 2012 году Франц Ох пришел к выводу, что точнее человека никто не переведет, и в случае, когда это критически важно, лучше обращаться к специалисту. Это верно и с технологией SMT, и с современным ChatGPT.

Помимо опыта фрустрации, был и позитивный опыт. Один литературный агент сказал при мне о романе своего клиента: «В качестве эксперимента мы попробовали прогнать первые несколько глав через ИИ, но это оказалось недостаточно хорошо». Фух. Другой агент сказал мне, что они избегают ИИ, потому что продвигались на рынке как издательство, работающее с высококвалифицированными переводчиками и готовое инвестировать в это время и деньги. Они настолько верили в произведение и его автора, что готовы были потратить максимум, чтобы показать ее потенциальным покупателям. И снова — фух.

Еще один агент сказал, что им только что удалось продать право на произведение одного из своих авторов британскому издательству (для писателя это дебют на английском языке), потому что перевод, который я им передал, был успешным.

Кажется, что аудитория глупа, невежественна и ей «просто все равно» [какого качества будет перевод], но я с этим категорически не согласен — я думаю, что люди посчитают такие ожидания глубоко оскорбительными", отмечает Эд Цитрон, скептически настроенный в отношении ИИ.

Всего лишь инструмент?

Возможно, вы помните забастовку Гильдии сценаристов США в 2023 годе против Альянса продюсеров кино и телевидения, которая сорвала съемки на несколько месяцев. В отличие от ситуации с литературными переводчиками в Европе, Гильдия заключает соглашения со студиями на коллективной основе — чтобы работать, люди фактически обязаны вступить в профсоюз. В числе причин забастовки были и вопросы, связанные с ИИ. В своей резолюции, принятой в ходе переговоров, Гильдия добилась принятия обязательств, согласно которым ИИ не может быть использован для переписывания литературного материала, а созданный ИИ материал не может быть использован для подрыва заслуг писателя. Сценаристы могут использовать ИИ как инструмент, но их нельзя принуждать к этому. Студии также обязаны раскрывать информацию о том, что предоставляемые ими материалы генерируются ИИ, и не допускать распространения материалов писателей для обучения ИИ.

Кемп, поддерживающая использование ИИ, в своей статье для журнала The Author прагматична и оптимистична: она не видит угрозы вымирания для профессии переводчика, и считает, что симбиоз человека и машины — «эволюция профессиональных ролей», а «человеческий, двуязычный взгляд, инстинкт и интуиция» всегда будут нужны. Она выступает за появление рынка «переводов, созданных человеком, международной литературы с человеческим участием». Как отмечает Кемп в отдельной статье, «даже с учетом того, что машинный перевод — вспомогательный инструмент, литературный перевод — это [все еще] плохо оплачиваемый вид тяжелого, высококвалифицированного труда» и «если инструменты могут ускорить нашу работу, это должно быть нам на пользу, а не во вред с точки зрения оплаты».

С ней согласен и шведский обозреватель Сельве Дальгрен, который отмечает, что выиграют профессионалы рынка, которые адаптируются к технологическим изменениям. В конце концов, «электроинструменты могут заменить отвертки, но хорошие плотники по-прежнему востребованы».

Не только качество

«Если мы доверим наше искусство машинам, они со временем, возможно, создадут адекватный симулякр искусства. Но адекватность — это плохая замена человеку», — считает ирландский литературный переводчик Фрэнк Уинн. Я склонен согласиться. Я писал, что «многие все еще хотят переводить, и я верю, что есть аудитория, которая желает получить переведенный человеком контент», я считаю, что состоявшиеся переводчики могут воспользоваться этим привилегированным положением.

Мы можем кричать с крыш о ценности переводчиков, но что можно сделать на практике? Концентрация на качестве результатов работы «машин по производству чепухи» под руководством ИИ — заманчивый, но ложный маневр. Густафссон предлагает отказаться от дискуссий о качестве и «душе», и вместо этого заняться решением сложного вопроса, возникающего в каждой отрасли, которой угрожает ИИ: есть ли внутренняя ценность в выполнении человеком определенных видов работ, и если да, то в чем она заключается? На кону — реальный вопрос финансирования. Мы можем утверждать, что качество перевода ИИ не на высоте и что читателям нужен контент, переведенный человеком, но если никто не будет за это платить, все это не имеет значения.

Нам нужно продолжать отстаивать свои интересы перед читателями и издателями, нужно призвать к ответу мошенников, укравших нашу работу для создания этой технологии, нужно, чтобы New York Times выиграла иск против OpenAI и Microsoft (ранее NYT подала в суд на них за обучение чат-ботов на ее статьях), нужны сильные профсоюзы для поддержки переводчиков и всех других творческих работников, нужны организации вроде CEATL (Европейского совета Ассоциации литературных переводчиков) для изучения ситуации в разных странах и на разных рынках, чтобы мы могли лучше реагировать, нужно разработать схемы лицензирования ИИ, и нам отчаянно нужно регулирование ИИ. И все это нужно делать, пока мы беспокоимся о будущем и суетимся, чтобы заработать на жизнь сейчас.

Остается надеяться, что Эд Цитрон прав и что нашим читателям не все равно.

Пересказал(а): Корченкова Наталья