Ученые разработали новый метод машинного обучения, который значительно улучшает способность алгоритмов не только распознавать объекты, но и понимать их ориентацию в пространстве.
Техника самонаправленного обучения, которая использует данные без меток, справляется с задачей классификации объектов, но имела проблемы с определением положения объекта в различных позах. Это ограничение особенно актуально в таких областях, как автономное вождение, где важно различать, например, автомобиль, который приближается на большой скорости, и тот, что просто проезжает мимо.
Для решения этой проблемы группа исследователей разработала новую модель обучения, которая учитывает как объекты, так и их ориентацию. В их подходе используется новый набор данных, включающий изображения одного и того же объекта, снятые с небольшими изменениями угла камеры. Эти изображения не содержат меток, что имитирует процесс работы робота, который изучает окружающую среду, двигаясь вокруг объекта.
Новый метод, в отличие от предыдущих, улучшает оценку положения объекта на 10−20%, что значительно улучшает точность распознавания поз, не снижая эффективности классификации объектов. Такой подход позволяет алгоритмам лучше обрабатывать изображения новых объектов, которых робот никогда не видел раньше.
Wang et al.