Исследователи из Университета Дьюка и Лаборатории армейских исследований США разработали GUIDE — новую систему обучения ИИ, которая использует обратную связь с человеком в реальном времени, а не полагается только на большие массивы данных. GUIDE будет представлена на конференции NeurIPS 2024 в декабре.
Система позволяет людям направлять ИИ в процессе обучения задачам, предоставляя непрерывную и подробную обратную связь. В ходе первых испытаний GUIDE помогла ИИ-игроку улучшить свои навыки в игре в прятки. Инструкторы использовали градиентную шкалу, чтобы давать «нюансы» вместо базовых оценок «хорошо» или «плохо».
В исследовании с участием 50 человек было показано, что всего 10 минут обратной связи с человеком повысили производительность ИИ на 30% по сравнению с прежними методами. Исследователи также разработали симуляцию человека-наставника, который продолжит направлять ИИ после того, как помощь человека закончится.