Портал DTF совместно со Сколтехом создал нейросеть, которая пишет неотличимые от настоящих комментарии в интернете. Её обучили на сообщениях реальных пользователей.
Для нейросети GPT-2 собрали три датасета: с комментариями пользователей vc.ru, TJournal и DTF. В итоге на указанных выше сайтах появилась кнопка «Нейротекст», при нажатии на которую комментарий за пользователя «допишет» или «напишет» нейросеть.
Обучение заняло несколько недель. Всего было использовано 6,5 млн уникальных комментариев длиннее десяти символов. Сообщается, что при тренировке нейросети применяли NVIDIA Quadro RTX 6000.
Что интересно, нейросеть может стилизовать комментарии под каждый сайт из трёх.
«В процессе тренировки мы генерировали комментарии для тестов и не могли поверить, насколько осмысленно выглядят некоторые из них», — поделился один из участников проекта.
Чтобы пользователи отличали фейковые комментарии от настоящих, первые помечены плашкой «Нейротекст».