В пресс-службе Института искусственного интеллекта AIRI сообщили, что ученые разработали алгоритм, который помогает подбирать оптимальный порог фильтрации данных для рекомендательных систем. Исследователи отмечают, что неправильная фильтрация сильно влияет на качество рекомендаций и замедляет развитие таких технологий.
Ученые всесторонне изучили проблему «холодного старта», когда новые пользователи или недавно добавленные товары содержат мало информации для искусственного интеллекта (ИИ). В таких случаях данные обычно отсекаются, но выбор порога часто делается произвольно, что ухудшает точность рекомендаций.
Анализ сотен научных работ показал, что лишь около 10% исследователей объясняют необходимость фильтрации, и практически никто не указывает, почему выбран конкретный порог. Это привело к разработке нового подхода, который позволяет автоматически определять оптимальное значение для каждого набора данных и алгоритма.
Тестирование методики на четырех популярных алгоритмах с использованием данных о рейтингах фильмов, предметов искусства, отзывах о косметике и оценках пива подтвердило ее эффективность.
Оказалось, что оптимальный порог значительно различается не только для разных задач, но и для разных алгоритмов. Некоторым системам потребовалось в разы больше данных о взаимодействиях пользователей. Это доказывает необходимость индивидуального подхода к настройке каждой рекомендательной системы.