Учёные Smart Engines «научили» ИИ распознавать рукописный текст на русском языке

Российские учёные улучшили алгоритмы распознавания текстов нейросетями

Российские специалисты из компании Smart Engines научили искусственный интеллект распознавать трудные рукописные слова без опоры на языковой контекст. В компании рассказали, что новая нейросеть анализирует только особенности соединения букв на изображении, не используя знаний о русском языке. Это позволило снизить вероятность так называемых «галлюцинаций» — ошибок ИИ, особенно на редких словах, таких как «шиншилла». Разработка уже улучшила работу систем распознавания документов, которые применяются в банках, у сотовых операторов и других крупных организациях.

Слово «шиншилла» выбрано не случайно — оно стало своеобразным тестом для проверки точности систем распознавания рукописного текста. В Smart Engines объяснили, что из-за особенностей кириллицы строчные формы букв «ш», «л» и «и» часто сливаются при небрежном написании, что делает их практически неразличимыми. Для обучения нейросети «Да Винчи» разработчики использовали 1,2 миллиона строк синтезированного рукописного текста с равномерным распределением сочетаний букв, что помогло уменьшить риск ошибок.

Генеральный директор Smart Engines Владимир Арлазаров подчеркнул, что цель разработки — создать метод, который читает текст без домысливания. Это особенно важно для работы с документами, где нейросеть должна распознавать именно то, что написано, например, в паспортах или штампах о регистрации. Он добавил, что исключение «галлюцинаций» критично, так как данные из документов влияют на важные бизнес-процессы и скоринговые модели.