Разработан частотный словарь казахского языка, передает корреспондент Tengrinews.kz.
Разработан частотный словарь казахского языка, передает корреспондент Tengrinews.kz.
Автором разработки является Саятбек Оразбеков, преподаватель Международного университета информационных технологий.
Как сообщили в пресс-службе Министерства образования и науки РК, проектом заинтересовался министр Ерлан Сагадиев, который намерен использовать словарь в обновлении методик обучения казахскому языку.
По словам Саятбека, его изначальной целью было создание поисковой системы, ориентированной только на казахскоязычную аудиторию. Однако он столкнулся с проблемой отсутствия электронной базы казахского языка. Из научного интереса к родному языку за несколько месяцев родился проект словаря. В октябре Саятбек приступил к работе: собрал максимальное количество книг двадцатого века в электронном формате, создал на их основе базу данных из 150 тысяч казахских слов. Далее написанная им программа начала определять наиболее часто встречающиеся слова, однако Саятбеку пришлось дорабатывать механизм, указывая программе на однокоренные слова. Владение родным языком позволило ему проделать всю работу в одиночку, без помощи лингвистов.
Частотный словарь, созданный на произведениях авторов XX века, в большинстве состоит из слов, которые и сегодня активно используются в нашей речи. Например, топ-5 слов казахского языка – это "да", "бір", "деп", "де", "мен". Словарь станет основой мобильного приложения, предназначенного для ускоренного изучения казахского языка, и будет применяться в разработке новых методик обучения казахскому языку.
В дальнейших планах у Саятбека - сбор данных со всех казахоязычных вебсайтов, в особенности с комментариев посетителей новостных ресурсов и постов пользователей Facebook. Разработчика волнует то, что казахоязычная аудитория сегодня вынуждена подстраиваться под современные технологии: "Мои родные в ауле абсолютно казахоговорящие, тем не менее, свои запросы в поисковиках они делают на русском языке, так как тот же Google пока не способен правильно отображать данные по запросам на казахском языке".
Сейчас автор словаря учится по программе PhD.
Институт языка имени Байтурсынова в течение нескольких лет уже занимался созданием рукописи частотного словаря. По словам одного из составителя, Аскара Жубанова, основой данного словаря является словарь Калдыбайя Бектаева "Ана Тілі", который был создан в 1968 году.