Тестировщики Google оценивали ответы чат-бота Bard наугад

Подрядчики, работавшие над проектом Google по оценке чат-бота Bard, признались, что из-за нехватки времени часто оценивали ответы ИИ на сложные запросы наугад. Свой поступок они объясняют сжатыми сроками.

Перед подрядчиками, работавшими в компании Appen, стояла задача помочь Google улучшить согласованность и точность чат-бота. Однако из-за сжатых временных рамок и сложности некоторых ответов многие оценщики прибегали к оценке ответов наугад, чтобы перейти к следующему заданию, без осмысленного анализа.

Appen считает, что более углубленный анализ ответов чат-бота Bard требует по несколько часов (в то время, как на некоторые из них давали по паре минут), так как, в случае неправильного ответа чат-бота, им приходилось в развёрнутом виде объяснять все неточности нейросети.