Ученые из Северной Америки разработали более эффективный способ обучения компьютеров находить нужные моменты в обучающих видео. Они обучили модель искусственного интеллекта определять действия, используя только видео и их автоматически сгенерированные расшифровки.
Этот метод, разработанный исследователями из Массачусетского технологического института и Лаборатории искусственного интеллекта Watson MIT-IBM, позволяет модели точно определять действия в длинных видеороликах с несколькими этапами. По сравнению с другими подходами, их метод более точен и позволяет лучше идентифицировать пространственную и временную информацию.
Этот метод может быть полезен в различных областях, включая образование и здравоохранение. Ученые надеются, что он поможет быстрее находить ключевые моменты в обучающих видео, делая процесс обучения более эффективным и удобным для пользователей.
arXiv