Исследователи лаборатории Yandex Research разработали новую нейросетевую архитектуру под названием TabM, предназначенную для анализа табличных данных. Система позволяет эффективно обрабатывать большие массивы информации и строить точные прогнозы, что востребовано в различных сферах — от медицины до бизнеса.
Технологию уже протестировали в международных конкурсах на платформе Kaggle. В одном из проектов TabM использовали для прогнозирования выживаемости пациентов после трансплантации костного мозга. Разработки на основе этой архитектуры принесли участникам соревнований призовой фонд в размере 60 тысяч долларов.
Особенность TabM заключается в использовании ансамбля моделей. Каждая нейросеть в системе проводит свой анализ, после чего все результаты усредняются. Такой подход обеспечивает точность при относительно низких затратах вычислительных ресурсов.
По итогам тестов на 46 разных датасетах TabM показала высокую стабильность и в среднем заняла первое место среди конкурентов. При этом она смогла превзойти классические алгоритмы — такие как CatBoost, XGBoost и LightGBM — по точности и надежности.
Код нейросети уже открыт для разработчиков на GitHub, а научная статья доступна на платформе arXiv.