Осетинский язык в цифре
В начале недели в Художественном музее имени Махарбека Туганова состоялась презентация общественно-государственного проекта цифровизации осетинского языка «ossetic.ru». Инициатор проекта - АНО «Фонд цифрового развития осетинского языка», директор Тимур Гудиев. Проект был поддержан Главой республики Сергеем Меняйло. Цель инициативы – сделать осетинский язык видимым и слышимым в цифровых сервисах. Это и перевод текстов, озвучка и распознавание речи. Ожидаемый результат работы команды по итогам его реализации - сделать так, чтобы голос осетинского языка появился в популярных сервисах, был доступен онлайн-перевод с осетинского на русский и обратно, также было доступно распознавание речи, озвучка текстов на сайтах, включая субтитры, голосовой поиск.
Официальный старт проекта был открыт Сергеем Меняйло. Обратившись к собравшимся с приветственным словом, он отметил важность данного проекта: «Основой нашей культуры и традиций является язык. Нас упрекают в том, что наша молодежь все меньше и меньше разговаривает на родном языке. Поэтому для укрепления и развития языка был создан этот проект, к которому мы шли долго. Цифровизация осетинского языка даст возможность молодежи, не насаждая, заинтересоваться цифровой платформой. Важно, чтобы язык передавался из поколения в поколение. Через давление мы не получим нужного результата, но надеемся получить его через работу, проводимую в дальнейшем».
Язык и цифровая сфера
О целях и задачах проекта также рассказал советник Главы республики по вопросам цифровизации Александр Нартиков: «Язык, который не существует в цифровой сфере, потихоньку сходит на нет. Русский и английский языки у нас везде – в телефонах, в сервисах, искусственный интеллект (ИИ) говорит на этих языках. Родной язык у нас дома, на праздниках, и еще есть уроки осетинского. Это не значит, что молодежь забыла про корни. Цифровой мир устроен так, что в нем не бывает места малым языкам, поэтому это место нужно создавать самостоятельно. Если не включить осетинский язык в технологии, у него есть шанс стать музейным экспонатом, и, наоборот, включив в цифровую повестку, есть шанс, что он станет обиходным в нашей жизни».
Цель представленного проекта в том, чтобы на осетинском языке заговорили голосовые помощники, чтобы можно было пользоваться мессенджерами, можно было проверять орфографию, пунктуацию, чтобы детям было интересно учить родной язык. Первое, что должен сделать любой желающий поддержать данную работу, - проверить корпус осетинского языка. Очень много фраз нужно перевести с русского языка, собрав их из разных источников (журналов, газет), бытовую речь. ИИ относится к языку не как к душе народа, а как к простым данным, если их нет, то он не может нас понять, перевести фразу. Корпус языка – это основа для того, чтобы осетинский появился в цифре, чтобы ИИ ему обучился.
Синтез речи – еще одна задача, чтобы компьютер, машина заговорили на осетинском. Это аудиокниги на осетинском языке, новости с озвучкой, мультики, подкасты. Благодаря этому компьютер синтезирует речь. Главное в этом синтезе - зафиксировать правильное произношение, чтобы оно не исчезло.
Распознавание речи, это когда компьютер распознает речь и превращает ее в текст. В этом могут помочь люди старшего поколения, наговорив разные истории, зафиксировать в тексте и перевести на другие языки. Этот инструмент сделает язык удобным в реальной жизни.
Александр Нартиков на вопрос о том, как сделать язык модным, ответил следующим образом: «Во-первых, язык моден, когда молодежь смотрит на нем мемы, есть музыка, звучит в каких-то известных социальных мегасетях, появляется в играх компьютерных, да и просто на нем общаются в чате. Все эти шаги позволят развивать язык. На данный момент мы заручились поддержкой таких больших компаний, как Сбер, Яндекс. Держатели больших сервисов могут интегрировать наш язык в их платформы. Если создать условия технологичной готовности языка, то в большие сервисы осетинский язык будет попадать легко. Если мы сегодня ничего не будем делать, то язык исчезнет. Хотелось бы поддержки от населения в реализации проекта».
Как это будет работать
Каждый желающий в этом проекте может найти себе роль. Кто-то может перевести предложение, кто-то озвучит, кто-то поможет юридически, кто-то – с бухгалтерскими отчетностями. Можно будет перевести просто деньги, чтобы специалисты могли работать, не отвлекаясь.
Тимур Гудиев подробно рассказал о платформе: «Цифровая образовательная платформа, которую мы вам представили, потребовала немало усилий, велась активная разработка. Проект должен быть масштабным. Нужно создать условия и для языковых активистов, и для ИТ-специалистов. Около года назад было принято решение о создании фонда. Для нас важны доверие и прозрачность.
О самой платформе. Есть несколько ролей в системе, начиная от волонтера и заканчивая профессиональным переводчиком, экспертом. Также есть роли финансиста и тех, кто может являться наблюдателем в этом процессе. Все данные будут доступны уже сегодня. По сути это некий аналог Википедии, где вклад каждого участника, волонтера, переводчика виден и заметен. На самом деле процесс отработанный. Уже сейчас включились в перевод первой порции от Яндекса, а это тысяча предложений, которые хотим перевести. Те, кто будет переводить, могут делать это с телефона, компьютера. У каждой роли в системе есть свои ставки. Проводится аналитическая работа. Надо понимать, что источники могут быть разными, на первом этапе это могут быть СМИ, потом диалоговая речь, художественная литература. Есть обратная связь с переводчиком. Если переводчик сомневается в правильности своего перевода, он может отправлять предложения на обсуждение, то есть это еще одна исследовательская научная работа. На будущее планируем создавать большой осетинский словарь, который будет обогащен вариантами использования слов, формирующихся в системе. На главной странице платформы будет виден рейтинг, который будет стимулировать здоровую конкуренцию среди участников проекта. Все процессы прозрачны. Мы разработали виджеты для сайтов, которые можно разместить, например, на сайтах госучреждений. Просим помочь тех, у кого имеются какие-то сайты, выступить проводниками наших идей».
Присутствующий на презентации российский историк, кавказовед Руслан Бзаров назвал проект, связанный с цифровизацией языка, общенациональным, подчеркнув его необходимость. «Язык, который не идет в ногу со временем, не поддерживается подобными проектами, становится более уязвимым», - сказал он.
В работе над проектом приняли участие студенты факультета осетинской филологии СОГУ во главе с деканом Эльмирой Гутиевой. Одна из лучших студентов факультета Алина Кубатиева посчитала такой опыт интересным и отметила, что он является стимулом для совершенствования своих знаний, переводческой работы. Также Эльмира Гутиева сказала, что об этой работе они заявили в Санкт-Петербурге на научной конференции. «Начало работы было непростое, на каждое предложение мы тратили очень много времени, долго думали над тем, как лучше переводить – буквально, дословно, чтобы было красивее, художественнее. Думали над алгоритмом переводов, сверяли его, а площадка для обсуждений позволит еще раз вернуться к этим тонкостям», - подчеркнула она.
Всех собравшихся поблагодарила Ирина Кулешова, которая в данном проекте отвечает за координацию работы специалистов. Она находится в рядах активистов, поддерживающих и развивающих осетинский язык.
Также на презентации присутствовали представители СМИ, общественности и творческой интеллигенции.
Анна Дзалаева
Фото: Т. Матвеева



