Великий подражатель: почему художников ИИ пугает больше, чем писателей

Я разделяю широко распространенное мнение, что генеративный ИИ повлияет на все виды офисной работы. Художники, писатели, программисты – все, кто попадает под определение «белые воротнички», – находятся в опасной зоне.

Искусственный интеллект может рисовать красивые картины, создавать приличную прозу, писать понятные программы и выполнять множество промежуточных задач. И даже если он не делает это безупречно, то в перспективе способен негативно повлиять на рабочие места, связанные с интеллектуальной и творческой занятостью. Уже скоро один человек, использующий современную систему ИИ, будет стоить целой команды людей.

ChatGPT оказался тревожным звонком для каждого. Некоторые люди знали о нем заранее – генеративный ИИ разрабатывался в течение нескольких лет, прежде чем появился популярный чат-бот, – но большинство об этом не знало. Поэтому сегодня во всех новостях одно – грядут большие перемены.

Я и сейчас знаю нескольких человек, которые даже не в курсе, что такое искусственный интеллект, но с каждым днем всё больше людей понимают: генеративный ИИ – это переломный момент. Некоторые профессионалы, видя в нем преимущества прогресса и продуктивности, воспринимают системы ИИ как средство расширения своих возможностей.

А другие нет. Другие враждебно настроены к техническому прогрессу в той степени, в какой он угрожает их образу жизни. Они ненавидят его, и хотя иногда мотивы исключительно личные, в большинстве случаев это отражает более глубокий конфликт с той силой, которая двигает мир вперед, – и которой всё равно, кто останется на обочине.

Но эта группа – что меня удивляет больше всего – весьма неоднородна. Неприятие генеративного ИИ особенно характерно для нескольких профессий. И стоит понять почему.

Художники воспринимают генеративный ИИ очень серьезно

На мой взгляд, художники (общий термин для дизайнеров, живописцев, иллюстраторов и т. д.) выглядят более раздосадованными и напуганными, чем остальные. Если допустить, что ярость свидетельствует об опасности (хотя версия о повышенной эмоциональности художников тоже способна объяснить эту разницу), можно сделать вывод – они чувствуют себя наиболее уязвимыми. Легко понять, почему программисты взбудоражены от ИИ, но писатели, работающие в тех же условиях, что и художники, кажутся на удивление спокойными. Разве им ничего не угрожает?

С тех пор как в начале 2021 года новый сюжет с искусственным интеллектом начал набирать обороты, я часто вижу, как художники, работающие в традиционной манере, проявляют беспокойство и даже враждебность по отношению к инструментам для создания изображений, таким как DALL-E и Stable Diffusion. Некоторые очень громко высказываются в соцсетях (не всегда выбирая выражения) и предпринимают радикальные шаги для борьбы за свои права. Они едины в стремлении давить на политиков, чтобы те обеспечили адекватное регулирование генеративного ИИ (я это поддерживаю), и обеспокоены не вполне законной практикой компаний, занимающихся ИИ (например, извлечением веб-контента с помощью кода без разрешения или указания авторства). Судебные разбирательства уже начались, они могут достичь или не достичь своих целей. Но стремление есть.

И хотя очевидно, что для писателей ИИ может представлять столь же серьезную угрозу, я не вижу похожей реакции. Вижу, глядя на своих коллег, что на фоне художников они ведут себя совершенно иначе. Либо учатся пользоваться преимуществами генеративного ИИ, либо отвергают его как бесполезный, либо вообще игнорируют.

Я не вижу враждебности или гнева. Не вижу страха.

«Конечно, плохие писатели будут его использовать, а хорошие – нет. Я бы никогда не стал этого делать по той же причине, по которой не стал бы прибегать к услугам литературного раба. Не хочу, что мое имя было связано с чужим текстом», – Пол Грэм.

Как писатель я чувствую примерно то же самое. Я не ощущаю угрозы со стороны ИИ. Этого не было ни три года назад с GPT-3, ни сейчас с ChatGPT. Хотя в моем случае это даже анекдотично – на меня сильно повлияло мое знание ИИ, но думаю, что подобные чувства характерны и для моих коллег.

Оценить эти впечатления количественно возможности у меня нет, поэтому считайте это эссе не исследованием, а пробным поиском ответов, объясняющих поведенческий разрыв (если, конечно, он есть) между двумя большими группами профессионалов, которых – на первый взгляд – недавние разработки в области генеративного ИИ должны были задеть в равной мере.

По моим ощущениям, разница в том, насколько ИИ угрожает художникам и писателям, действительно есть – и она значительна. Не буду говорить о том, как мир ценит эти две профессии, потому что я бы сказал, что не очень и примерно в равной степени. Вместо этого сосредоточусь на том, как искусство создается и воспринимается в зависимости от его природы.

Визуальное искусство – это (прежде всего) стиль

На прошлой неделе я поделился своей гипотезой в соцсетях и получил много интересных откликов. Большинство из них были вариантами одной и той же мысли – стиль, понимаемый как набор элементов, составляющих индивидуальность художника, в визуальном образе гораздо заметнее, чем в тексте.

Уилл Найт из Wired заявил, что «в образе вы можете сразу узнать черты стиля других художников, [но] в тексте это подражание почувствовать гораздо труднее». А Парваз Кази продемонстрировал, что «заметить влияние кубизма» легко, но чтобы распознать фразу в стиле Хемингуэя, нужен подготовленный читатель.

Я согласен с этим: стиль – фундаментальное свойство визуального искусства. Он также присущ и тексту, но в меньшей степени (ниже объясню почему).

И это делает отдельных художников уязвимыми перед незаурядной способностью ИИ смешивать визуальные данные, на которых он «учился», для создания чего-то достаточно оригинального, чтобы не выглядеть плагиатом, но не настолько, чтобы исчезло ощущение знакомого стиля. Генеративные модели, такие как Stable Diffusion и Midjourney, могут легко воспроизводить стили – достаточно использовать имя автора в подсказке, чтобы в полученном рисунке чувствовалась его уникальная манера.

Но если вы просмотрите внимательнее – или у вас острый глаз художника, – вы поймете, что в подражании стилю ИИ не так хорош. Сначала это кажется отличной работой, но чем дольше вы смотрите, тем сильнее ваше внимание привлекают странные детали – и магия совершенства начинает разрушаться. А на взгляд эксперта, эта попытка подражания вообще достаточно топорна.

Иллюстратор Холли Менгерт – яркий тому пример. Она стала жертвой стремления воспроизвести ее стиль без согласия: пользователь Reddit сделал на ее работах тонкую настройку Stable Diffusion + DreamBooth и этим открыто поделился. В интервью блогеру Энди Байо о сгенерированных рисунках Менгерт сказала:

«Что касается персонажей, я не узнала в них себя. Лично я не увидела, чтобы ИИ принимал те же решения, которые… приняла бы я, поэтому я чувствую дистанцию от результатов».

«Мне кажется, ИИ способен имитировать текстуры кисти и рисовку, подбирать некоторые цвета и формы, но это не обязательно то, что делает вас действительно привлекательным в качестве иллюстратора или дизайнера».

Если сила художественных моделей ИИ заключается в копировании стилей, но они испытывают сложности с их точным воспроизведением, почему тогда художники так сильно реагируют на попытки «плагиата» своих работ?

Причина заключается не в том, как мы искусство создаем, а в том, как его воспринимаем. Художники не больше, чем писатели, беспокоятся о том, что ИИ способен идеально воспроизвести что-то, с чем они себя отождествляют (их собственный стиль) – на самом деле, они довольно часто смеются над «искусством» ИИ. Но они опасаются, что не-художники (большинство потребителей) не смогут отличить «искусство» от искусства из-за неспособности глубоко оценить последнее.

Если художникам работы генеративного ИИ могут казаться откровенно плохими, то для остального – неподготовленного – мира они могут быть вполне хорошими.

Образы и язык мы воспринимаем по-разному

Есть фундаментальная причина, почему сказанное выше применимо к визуальному образу, а не к тексту – в первом случае люди менее чувствительны к границам «правильного–неправильного» и «хорошего–плохого», чем во втором. Для генераторов изображения порог восприятия результата как «достаточно хорошего» ниже, чем для генераторов текста. Как сказал по этому поводу Бенедикт Эванс:

«Если бы я попросил Stable Diffusion сделать мой портрет в стиле Эгона Шиле, диапазон возможных результатов, которые не были бы неправильными, очень широк. И все они соответствовали бы образцу. С текстом у нас связаны другие ожидания – ему проще оказаться “неправильным”».

Это экстраполируется на все уровни языка. Если я напишу «езык», любой поймет, что это неправильно. Или «бесцветные зеленые идеи яростно спят» – любой скажет, что содержание бессмысленно. Это относится и к целым текстам – слабому месту таких языковых моделей, как ChatGPT. Текстовые инструменты ИИ обладают идеальной грамматикой, но из фактов они составляют противоречивые эссе и не могут создать целостный образ персонажа на протяжении даже одной главы книги, например, в стиле фэнтези.

В целом элементы языка (письменного, устного, жестового и т. п.) гораздо сильнее связаны со значением, чем образы. В результате любая ошибка ChatGPT приводит к тому, что в это невозможно дальше верить – и я «ухожу». Небольшие отклонения от визуальной «правильности» имеют меньше значения и сигнализируют о более низком пороге, когда мы считаем, что изображение соответствует нашим представлениям о желаемом.

Язык живет в царстве определенности. Связь между замыслом писателя и восприятием читателя прямая, вполне определенная – и даже однозначная. Для визуального искусства это не всегда так. Глядя на картину, я с трудом могу связать образы со значением и замыслом, стоящими за ними, – по этой причине совпадений в интерпретации слов больше, чем в интерпретации изображений. Фразу «лучше один раз увидеть, чем сто раз услышать» обычно трактуют как богатство и полноту визуальности, но она также может предполагать и меньшую конкретику.

В итоге можно сказать, что писателям генеративный ИИ угрожает слабее, потому что, во-первых, в отличие от изображения текст не так сильно зависит от стиля (сильная сторона ИИ). Во-вторых, неспособность ИИ идеально копировать стиль для образов не так значима, как для текстов. Низкий порог признания «творений» ИИ хорошими или правильными создает идеальную цель. И эта цель – визуальное искусство. Поэтому ничего странного в том, что художники так расстроены.

Сообщение Великий подражатель: почему художников ИИ пугает больше, чем писателей появились сначала на Идеономика – Умные о главном.