В России разработали систему искусственного интеллекта (ИИ), способную распознавать и переводить древнеегипетские иероглифы. Проект реализован специалистами из Института AIRI, ИСП РАН и университета ИТМО.
Основой для обучения модели стал «Thesaurus Linguae Aegyptiae» — крупнейшая база древнеегипетских текстов с переводами. Точность работы системы проверялась как с помощью автоматических методов, так и при участии профессиональных египтологов из НИУ ВШЭ.
Разработанная технология способна сделать изучение древнеегипетского языка доступным даже для новичков. В перспективе ее можно будет использовать в мобильных приложениях. Например, турист сможет навести камеру телефона на артефакт в музее и сразу увидеть перевод надписи. Также система может облегчить дешифровку новых текстов и помочь студентам-египтологам в обучении.
Одной из сложностей при создании модели стало огромное количество символов — в отличие от алфавитных систем, древнеегипетское письмо насчитывает сотни знаков, многие из которых похожи между собой. Для распознавания использовались OCR-модели, учитывающие контекст, что позволило точнее различать визуально схожие иероглифы.
Чтобы увеличить объем данных, исследователи применили диффузионные модели, генерирующие реалистичные изображения текстов. Средняя строка из базы данных содержит около 35 иероглифов.
Сейчас доступ к системе открыт по запросу для специалистов. Разработчики уже представили результаты работы на международных конференциях SIGGRAPH, ICCV, IEEE ISMAR и ACM Multimedia.