Язык человеческий: как и зачем отличать текст, созданный ИИ

Подозрение и симпатия, тревога и волнение. У большинства людей есть смешанные чувства по отношению к языку, сгенерированному ИИ, независимо от того, всегда ли они его распознают. Читая текст, созданный ИИ, люди чувствуют, что он звучит странно или неестественно. И напротив, в тексте, написанном человеком, есть характерный голос или личный оттенок.

Что именно делает язык человечным или похожим на тот, что создан искусственным интеллектом? И имеет ли значение, если язык, созданный ИИ, никогда по-настоящему не достигнет человеческого звучания?

Я изучаю институционализацию английского языка. Существует долгая и сложная история, в которой люди положительно или отрицательно относятся к различным вариантам языка, поощряя то, как на нем говорят или пишут одни слои общества, и обесценивая то, как он используется другими.

С появлением инструментов генеративного искусственного интеллекта для обработки языка эти проблемы усугубились. Крупномасштабные языковые модели обучаются на текстах из общедоступного интернета. Инструкции предписывают моделям звучать как формальный язык. Из-за этого крупные языковые модели в конечном итоге обучаются на всех предвзятостях, заложенных в стандартизированных человеческих текстах и идеях.

Я встречала людей, которые никогда бы не доверились интернету в вопросе о том, что правильно, а что неправильно, но при этом доверяют генеративному искусственному интеллекту в вопросе о том, как писать.

Человек против ИИ

Чтобы распознать текст, написанный ИИ, нужно, во-первых, попытаться понять, что люди имеют в виду, когда говорят, что письменная речь звучит по-человечески. Это понимание повысит вашу грамотность в области ИИ. Что наиболее важно, это позволит вам научиться распознавать два качества, которые отличают человеческий язык от языка, созданного ИИ: разнообразие и легкость чтения.

В человеческом языке сохраняются устойчивые, хотя и тонкие, лингвистические закономерности вариативности и читаемости. В отличие от этого, ИИ использует то, что я называю экзаменационным языком: довольно формальный, насыщенный язык, который предпочтителен в академических тестах и работах. Он менее разнообразен и хуже читается. Люди воспринимают его как роботизированный, но в то же время он создает ощущение высокого интеллекта.

«Я не знаю, как тебе это сказать, правда сложно объяснить… я не смогу прийти в пятницу. извини. но как будет минутка, пиши мне в течение вечера. в любом случае, надеюсь, твоя поездка пройдет хорошо. увидимся в следующем семестре».

«Привет! Мне очень жаль, но я не смогу прийти в пятницу вечером. Надеюсь, вы все отлично проведете время, и увидимся в следующем семестре!»

Читатель, вероятно, сразу заметит несколько закономерностей. В первом сообщении больше «текстового жаргона»: по умолчанию используются строчные буквы. Во втором тексте используются заглавные буквы, запятые и орфография.

У людей могут быть и другие впечатления. Возможно, первый текст кажется более личным, тон такой, словно человек немного сомневается. А второй может показаться чопорным, словно написанным официально. Первый текст содержит разные типы фраз и предложений, в то время как второй текст повторяет одну и ту же структуру предложения четыре раза.

В какой-то степени читатели-люди улавливают подобные закономерности. Большинство людей сказали бы, что первый текст написан человеком, а второй — искусственным интеллектом. Действительно, второй фрагмент был сгенерирован ChatGPT.

Даже эта простая иллюстрация показывает, что в человеческом языке присутствует вариативность в употреблении слов и грамматических структурах, которая разделяет информацию и передает личный смысл. В языке, созданном искусственным интеллектом, вариативность меньше, а группы существительных более плотные. В исследованиях эти закономерности неоднократно встречаются в разных жанрах и регистрах.

Изменения языка

Инструменты для написания текстов с использованием ИИ развиваются, и большие языковые модели различаются. Например, GPT 5 печально известен довольно холодным тоном по сравнению с предшественником GPT 4.

И, скорее всего, эти закономерности сохранятся. Язык, созданный ИИ, похож на тот, что всегда ценился в академической среде: однородный и плотный в информации. И пока что обучение моделей ИИ следовать инструкциям человека лишь делает язык, созданный ИИ, менее похожим на человеческий. Ситуацию усугубляет и то, что боты обучаются на текстах созданных ИИ.

В итоге, сегодня искусственный интеллект обучается языку на основе гораздо более узкого языка, чем тот, который используется в реальном, коллективном человеческом общении. Люди же, напротив, используют не просто язык, который кажется подходящим, а язык, который возможен. В основе этого лежит разнообразие языка, которое они наблюдали, творческая способность к созданию новых высказываний и склонность к смешиванию личных и безличных языковых конструкций.

Две версии языка

Если вы лучше поймете различия между языком, созданным искусственным интеллектом, и человеческим, эти знания помогут вам более продуктивно использовать оба варианта языка. Вот несколько шагов, которые следует предпринять:

Используйте языковые обозначения. При описании конкретного отрывка используйте такие обозначения, как «сложный», «простой», «межличностный» или «информативный», а не социальные ярлыки типа «звучит умно» или «звучит странно». Подумайте об изучении реальных закономерностей в английском языке как у людей, так и у искусственного интеллекта, и попытайтесь описать их, а не чувства по этому поводу, другими словами.

Пользуйтесь инструментами ИИ избирательно. Человеческий язык не только обладает более доступными и разнообразными моделями, но и задействует мозг сильнее, чем языковые инструменты ИИ. Чтобы ИИ-язык не вытеснил разнообразный человеческий язык в мире, используйте ИИ избирательно.

Используйте специально подобранные инструменты. Небольшие языковые модели и программы, которые можно добавить в веб-браузер для устранения предвзятости, например, Bias Shield, помогают людям принимать обоснованные решения об использовании искусственного интеллекта. Такие инструменты, как транслингвальные чат-боты, также могут привнести гораздо большее разнообразие человеческого языка со всего мира.

Обращайте внимание на то, что звучит умно. Полтора века научного языка дают подсказку, что сложные, безличные письменные конструкции — это умно. Но, как и любые языковые конструкции, они имеют свои плюсы и минусы. Они не особенно располагают к себе и нелегко читаются, особенно для разнородной аудитории. Они не отражают всего многообразия современного языка во всем мире.

Конечно, есть причины использовать версию академического языка, но не только потому, что его генерируют боты с искусственным интеллектом, или потому, что люди научились воспринимать его как более интеллектуальный.

В лучшем случае, ИИ — это языковая база данных, основанная на статистике. Она большая, но она шаблонная. История показывает, что полный набор вариантов языка, распространенных в мире, предоставляет людям наибольшие возможности для самовыражения и общения.

Сообщение Язык человеческий: как и зачем отличать текст, созданный ИИ появились сначала на Идеономика – Умные о главном.