Робототехническая компания Figure представила новую модель машинного обучения для роботов-гуманоидов под названием Helix. Это «генералистская» модель Vision-Language-Action (VLA) использует машинное зрение и языковые команды для обработки информации.
Как сообщает портал TechCrunch, это новое явление в области робототехники, которое позволяет роботам обучаться с помощью комбинации видео и языковых моделей. Helix комбинирует визуальные данные и языковые подсказки для управления роботом в режиме реального времени.
Модель обладает общим пониманием объектов и способна осуществлять различные задания, просто посылая роботу голосовые команды на естественном языке. Helix «помогает преодолеть разрыв между зрением и обработкой языка в робототехнике».
Helix предлагает решения для различных сценариев, таких как передача предметов другому роботу или размещение их в определённом месте. «Также модель представляет собой значительный шаг в робототехнике и открывает новые возможности для управления гуманоидными роботами», — отмечается в материале.
Благодаря Helix гуманоиды общаются между собой посредством обмена сообщениями. При этом роботы способны создавать автономные сценарии для перемещения в пространстве и взаимодействия с другими машинами.