14:26 21 Февраля 2023
День родного языка: как кыргызский язык внедрялся в Google Translate

Сегодня отмечается Международный день родного языка, провозглашенный Генеральной конференцией ЮНЕСКО 17 ноября 1999 года, с целью содействия языковому и культурному разнообразию и многоязычию. 

12 лет назад Фонд «Сорос-Кыргызстан» поддержал проект “Мы хотим кыргызский язык в Google Translate” общественного фонда «Кыргызское интернет сообщество» [ISOC]. С тех пор была проделана большая работа по внедрению кыргызского языка в Google Translate.

В 2011 году группа энтузиастов вела активную дискуссию по поводу того, как развить кыргызский язык, как в интернете, так и в повседневном использовании, в группе на Фейсбуке, которую назвали «We want Kyrgyz language in Google Translate» (“Мы хотим Кыргызский язык в Google Translate”). На тот момент Google Translate поддерживал всего 64 языка, языков среди стран центральноазиатского региона не было. Для того чтобы кыргызский язык попал в этот сервис, тогда необходимо было предоставить компании Google более 1 000 000 кыргызских слов в предложениях с аналогичным переводом на английском языке для статистического машинного перевода — принципа работы Google Translate, который строится на подборе фрагментов текста из сотен миллионов документов. Проект получил поддержку также от Посольства США, оператора сотовой связи Билайн, Аппарата Президента Кыргызской Республики, Национального Центра Информационных Технологий, Национальной комиссии по государственному языку.

В 2012 году собранная база данных готовых переводов была предоставлена компании Google на рассмотрение. В базу было загружено 1 054 596 слов, которые были полностью проверены и утверждены старшими переводчиками. Тем не менее колоссальная и скрупулезная работа энтузиастов и переводчиков не была принята из-за изменения технологического подхода корпорации к включению новых языков. В результате увеличения таких запросов от других стран, была создана платформа сообщества Google Translate, предлагающая фразы для перевода, а переводчики-волонтеры в странах должны были обеспечить их перевод. «Вся наработанная до этого база перевода оказалась не нужна», — сказала Лира Самыкбаева, бывшая директор информационной программы Фонда Сорос-Кыргызстан. “Однако к тому времени движение добровольных переводчиков в Кыргызстане достаточно сильно развилось, что позволило быстрыми темпами реализовать поставленные задачи по переводу 800 тысяч пар фраз,” — добавила она.

В 2016 году в Google Translate, наконец, появился кыргызский язык. Директор общественного фонда «Биздин мурас» Чоробек Сааданбеков рассказал, что в Кыргызстане около 700 волонтеров перевели примерно около 4 миллионов слов. При этом, студенты Кыргызско-Турецкого университета «Манас» перевели больше половины всей работы. Он также отметил вклад Тилек Мамутова, который в то время работал в подразделении компании Google.

В 2022 году на круглом столе «Системы и технологии искусственного интеллекта: риски, возможности и подходы к регулированию в Кыргызстане» директор ОФ «Гражданская инициатива Интернет политики» Татту Мамбеталиева сообщила, что улучшение переводческих функций Google зависит от активности самих кыргызстанцев, которые пишут максимальное количество замечаний. В сервисе есть специальное окошко, куда можно написать, что то или иное выражение неправильно перевели. Благодаря этому с каждым разом система улучшается. 

Стилистика и грамматика авторов сохранена.

Еще новости от «Сорос-Кыргызстан» (13)

Последние

03.06.2023
Кыргызская Википедия: 21 год развития и успехов в популяризации кыргызского языка

03.06.2023
В Кыргызстане создана система повышения квалификации муниципальных служащих по ведомственному направлению

02.06.2023
Прокуроры приняли участие в работе круглого стола

01.06.2023
Три компании из сферы туризма получат инвестиции от Accelerate Prosperity

01.06.2023
Акция «Душевный БЕЛЕК»

31.05.2023
Нацстатком завершил работы по переходу на основные изменения расчетов ВВП в соответствии с международным стандартом Системы Национальных Счетов 2008 года (СНС 2008)

31.05.2023
Руководители швейных компаний изучили принципы построения эффективной организации швейного производства

31.05.2023
Горячая линия 118 обучает сотрудников новым навыкам

30.05.2023
В Оше проходит завершающее обсуждение проекта Правил поведения участников судебных разбирательств

30.05.2023
5-летняя веха с момента открытия первых Центров развития детей на базе библиотек

Комментарии
Комментарии будут опубликованы после проверки модератором
Для добавления комментария необходимо быть нашим подписчиком

×