В пресс-службе Новосибирском государственном университете (НГУ) сообщили, разработали нейросетевую модель, которая превосходит существующие аналоги для русско-бурятского перевода. Этот алгоритм станет основой для первого в России онлайн-переводчика на бурятский язык.
Бурятский язык считается малоресурсным, что осложняет создание параллельного корпуса данных для перевода. В интернете можно найти лишь электронные словари или разговорники. Молодежь все меньше интересуется сохранением бурятского языка, что подтверждает снижение числа владеющих им, согласно переписи населения России, отметили в пресс-службе.
Разработчика Дария Батурова создала параллельные корпуса для русско-бурятского и русско-монгольского перевода, состоящие из текстов и их переводов. Она обучила две модели перевода и сравнила их с существующими аналогами, выяснив, что одна из них показала лучшие результаты.
В будущем планируется создать сайт с русско-бурятским онлайн-переводчиком, который будет полезен для носителей языка, изучающих, исследователей и всех, кто заинтересован в сохранении бурятского языка.