Российские учёные улучшили алгоритмы распознавания текстов нейросетями
Российские специалисты из компании Smart Engines научили искусственный интеллект распознавать трудные рукописные слова без опоры на языковой контекст. В компании рассказали, что новая нейросеть анализирует только особенности соединения букв на изображении, не используя знаний о русском языке. Это позволило снизить вероятность так называемых «галлюцинаций» — ошибок ИИ, особенно на редких словах, таких как «шиншилла». Разработка уже улучшила работу систем распознавания документов, которые применяются в банках, у сотовых операторов и других крупных организациях.
Слово «шиншилла» выбрано не случайно — оно стало своеобразным тестом для проверки точности систем распознавания рукописного текста. В Smart Engines объяснили, что из-за особенностей кириллицы строчные формы букв «ш», «л» и «и» часто сливаются при небрежном написании, что делает их практически неразличимыми. Для обучения нейросети «Да Винчи» разработчики использовали 1,2 миллиона строк синтезированного рукописного текста с равномерным распределением сочетаний букв, что помогло уменьшить риск ошибок.
Генеральный директор Smart Engines Владимир Арлазаров подчеркнул, что цель разработки — создать метод, который читает текст без домысливания. Это особенно важно для работы с документами, где нейросеть должна распознавать именно то, что написано, например, в паспортах или штампах о регистрации. Он добавил, что исключение «галлюцинаций» критично, так как данные из документов влияют на важные бизнес-процессы и скоринговые модели.