
В Югре создают цифровые корпусы хантыйского и мансийского языков для сохранения культурного наследия
В Ханты-Мансийском автономном округе активно ведётся работа по созданию цифровых корпусов мансийского и хантыйского языков. Об этом сообщил губернатор Югры Руслан Кухарук в Международный день коренных народов мира, 9 августа.
"В преддверии праздника провел рабочее совещание по вопросам создания корпусов мансийского и хантыйского языков – обширной базы данных текстов, которая используется для их изучения, анализа структуры, лексики и грамматики", – поделился губернатор в своих социальных сетях.
Корпус мансийского языка уже практически готов. Он содержит параллельный перевод предложений с русского на мансийский язык, аудиозаписи речи носителей, оцифрованные произведения мансийских авторов и периодические издания на мансийском языке. Кроме того, разработан мансийский языковой портал с сервисом автоматического перевода и словарем. Сам корпус насчитывает 146 тысяч пар предложений, которые будут интегрированы в сервис "Яндекс.Перевод". О завершении цифровой обработки мансийского языка Руслан Кухарук сообщил ещё в июне на международном IT-форуме в Ханты-Мансийске. Презентация готового корпуса мансийского языка запланирована на конец года и приурочена к юбилею Ханты-Мансийского автономного округа.
Параллельно ведётся работа над созданием корпуса хантыйского языка.
"Уже сформировано более 10 тысяч пар параллельных предложений на русском и хантыйском языках. Мы продолжим эту работу, чтобы сохранить и приумножить культурное наследие Югры, России", – подчеркнул Руслан Кухарук.
Создание цифровых корпусов языков коренных малочисленных народов Севера является важным шагом в сохранении и развитии их культуры и самобытности, а также способствует популяризации языков и облегчает их изучение.
"В преддверии праздника провел рабочее совещание по вопросам создания корпусов мансийского и хантыйского языков – обширной базы данных текстов, которая используется для их изучения, анализа структуры, лексики и грамматики", – поделился губернатор в своих социальных сетях.
Корпус мансийского языка уже практически готов. Он содержит параллельный перевод предложений с русского на мансийский язык, аудиозаписи речи носителей, оцифрованные произведения мансийских авторов и периодические издания на мансийском языке. Кроме того, разработан мансийский языковой портал с сервисом автоматического перевода и словарем. Сам корпус насчитывает 146 тысяч пар предложений, которые будут интегрированы в сервис "Яндекс.Перевод". О завершении цифровой обработки мансийского языка Руслан Кухарук сообщил ещё в июне на международном IT-форуме в Ханты-Мансийске. Презентация готового корпуса мансийского языка запланирована на конец года и приурочена к юбилею Ханты-Мансийского автономного округа.
Параллельно ведётся работа над созданием корпуса хантыйского языка.
"Уже сформировано более 10 тысяч пар параллельных предложений на русском и хантыйском языках. Мы продолжим эту работу, чтобы сохранить и приумножить культурное наследие Югры, России", – подчеркнул Руслан Кухарук.
Создание цифровых корпусов языков коренных малочисленных народов Севера является важным шагом в сохранении и развитии их культуры и самобытности, а также способствует популяризации языков и облегчает их изучение.
Автор: служба информации
Войдите или зарегистрируйтесь, чтобы оставить комментарий