Как искусственный интеллект угрожает прошлому

Andreas Schulze, Wandmalerei Zeichnungen, 1988

Уже сегодня дипфейки способны так правдоподобно имитировать голоса политиков, что с их помощью можно раздуть скандал, способный повлиять на ход выборов. К счастью, есть и хорошая новость — общество способно распознать фейки и понять, что стоит за текущими событиями. Но, если насчет настоящего оптимизм пока сохраняется, то риск переписывания истории и подделки прошлого действительно вызывает опасения.

Генеративный искусственный интеллект (то есть такой ИИ, который способен генерировать текст, изображения или другие медиаданные в ответ на подсказки) может подделывать не только настоящее, но и прошлое. История может стать мощным инструментом манипуляций.

Новый контент можно защитить от вмешательства ИИ с помощью встроенных систем с водяными знаками: фактически — добавлением незаметной информации в цифровой файл, которая позволяет отследить его происхождение. Но при этом остается целый мир файлов, на который эти знаки не наносились. Если нанесение водяных знаков станет распространено и люди привыкнут не доверять контенту без знаков, то все, что было создано до этого, будет гораздо проще поставить под сомнение.

Это создаст кладезь возможностей для подкрепления ложных утверждений с помощью сгенерированных документов: от фотографий, на которых исторические личности оказываются в компрометирующих ситуациях, до переписывания материалов в старых газетах и имен в документах на право собственности. Хотя все эти приемы использовались и раньше, противостоять им стало гораздо сложнее, когда стоимость создания практически идеальных подделок сильно упала.

В истории немало примеров, подкрепляющих этот прогноз. Различные силы и ранее манипулировали историческими данными в своих целях. Сталин вычеркивал из истории нелояльных ему товарищей: сначала их репрессировали, а потом убирали с фотографий, будто их никогда не существовало. Словения, став независимой страной в 1992 году, «вычеркнула» из реестра резидентов более 18 тысяч человек — в основном представителей народа рома и других этнических не-словенцев. В результате многие лишились жилья, пенсий и доступа к другим услугам, говорится в докладе Комиссара Совета Европы по правам человека за 2003 год.

Фальшивые документы нередко помогают переписывать историю. Печально известные «Протоколы сионских мудрецов», впервые опубликованные на русском языке в 1903 году, якобы представляли собой протоколы заседаний евреев-заговорщиков, которые хотели установить контроль над миром. В августе 1921 года впервые стало понятно, что это подделка, компиляция тезисов из множества несвязанных источников. Однако «Протоколы» все равно сыграли значимую роль в нацистской пропаганде и долгое время использовались для оправдания антисемитского насилия, включая цитату в статье 32 Хартии ХАМАС, принятой в 1988 году.

В 1924 году газета The Daily Mail за четыре дня до всеобщих выборов в Великобритании опубликовала «Письмо Зиновьева» — секретное коммюнике председателя советского Коминтерна, обращенное к Коммунистической партии Великобритании. Оно призывало британских коммунистов содействовать укреплению отношений с правительством большевиков. Письмо, происхождение которого так и не было доказано, стоило лейбористам победы на выборах. Уже в ту эпоху многие были не уверены в подлинности письма, а расследование в 1990-е выявило, что, скорее всего, оно было делом рук «белогвардейцев» — русских эмигрантов, выступавших против коммунистической власти.

Спустя десятилетия СССР запустит дезинформационную кампанию под названием «Инфекция», распространяя конспирологическую теорию о том, что вирус, провоцирующий СПИД, изобрели в США, чтобы использовать его как биологическое оружие. А в 2004 году телеканал CBS News отказался от размещения скандального сюжета, поскольку не смог подтвердить подлинность документов, ставящих под сомнение предыдущую службу Джорджа Буша-младшего, тогда еще президента, в ВВС Нацгвардии. Позже оказалось, что документы были фальшивыми. Количество фейков с годами только растет, и сегодня все проще переписывать историю или заставлять нас сомневаться в своем представлении о ней. И это пугает.

К счастью, те же компании, что создали эти риски, проложили и путь вперед. Разработчики ИИ фактически создали системы и базы данных, которые вскоре будут содержать весь цифровой контент человечества. Они могут работать в направлении борьбы с историческими фальсификациями уже сегодня, оцифровывая первоисточники: газетные архивы и другие материалы, добавляя на них водяные знаки, чтобы фейки на их основе могли быть мгновенно обнаружены.

Но этой работе кое-что мешает. Google, отсканировавший миллионы книг из мировых библиоте, чтобы выложить их в открытый доступ, натолкнулся на права интеллектуальной собственности, в результате чего исторический архив оказался непригодным. Компания не может сделать эти тексты доступными для поиска любому интернет-пользователю.

Инвестиции Google оказались неудачными. Кто будет готов оплатить аналогичную масштабную работу по созданию неизменяемых версий исторических данных? И у правительства, и у крупного бизнеса есть серьезные стимулы для этого, но они не могут сделать доступный для поиска онлайн-архив с документами, помеченными водяными знаками, поскольку согласно правам интеллектуальной собственности многие из этих документов не должны быть общедоступными.

Создание такого исторического архива может не только работать на общественное благо, но и приносить пользу крупным компаниям-разработчикам ИИ. Согласно новым исследованиям, когда модели ИИ обучаются на данных, созданных ИИ, их производительность снижается. Таким образом, отделение первоисточников от вновь созданных «фактов» может быть критически важным.

Сохранение прошлого также означает сохранение обучающих данных, связанных с ними инструментов и даже среды, в которой эти инструменты были запущены. Один из «отцов интернета» Винт Серф назвал этот тип записей «цифровым пергаментом», он необходим нам для обеспечения безопасности информационной среды.

Такой пергамент станет мощным инструментом. Он поможет компаниям создавать более совершенные модели, позволяя им анализировать, какие данные следует включать, чтобы получить качественный контент, а регуляторам — распознавать предвзятость и вредоносный контент в моделях.

Технологические гиганты уже предпринимают подобные усилия по учету нового контента, который создают их модели. Отчасти это происходит потому, что им приходится обучать свои модели на текстах, созданных человеком, а данные, полученные после внедрения больших языковых моделей, могут быть испорчены сгенерированным контентом. Пришло время направить эти усилия на прошлое, пока сгенерированная история еще не успела существенно исказить нашу политику.

Пересказал(а): Корченкова Наталья