21 октября 2020 | 08:59

Голосовые помощники смогут понять казахский. Ученые НУ оцифровали родную речь

Мейирим Смайыл руководитель спецпроектов Tengrinews.kz
Фото:elements.envato.com

Ученые Назарбаев Университета записали и обработали 2000 голосов, собрали огромную базу аудиоданных на казахском языке, чтобы сделать возможным автоматическое распознавание родной речи, передает корреспондент Tengrinews.kz. Это не только поможет научить голосовые помощники понимать наш государственный язык, но и позволит внедрять другие новые технологии с поддержкой казахской речи.

ПОДЕЛИТЬСЯ
Иконка комментария блок соц сети

Ученые Назарбаев Университета записали и обработали 2000 голосов, собрали огромную базу аудиоданных на казахском языке, чтобы сделать возможным автоматическое распознавание родной речи, передает корреспондент Tengrinews.kz. Это не только поможет научить голосовые помощники понимать наш государственный язык, но и позволит внедрять другие новые технологии с поддержкой казахской речи.

Желающих записать свой голос для развития казахского языка собирали по всему Казахстану через социальные сети, блогеров и медиа. Объявление выходило и на Tengrinews.kz. Благодаря этому ученые из Института умных систем и искусственного интеллекта НУ (ISSAI) смогли записать две тысячи человек, которые вместе наговорили 300 часов казахской речи - 154 тысячи предложений. 

Реклама
Реклама

На основе получившейся огромной базы голосовых данных ученые Назарбаев Университета впервые создали корпус казахской речи - обучили искусственный интеллект распознаванию языка, смысловым связкам, особенностям произношения и разным значениям слов. Протестировать технологию можно здесь. По ссылке также можно получить доступ к собранной базе данных.

Система по распознаванию казахской речи может быть интересна разработчикам виртуальных помощников - таких как Siri, Alexa, Алиса и Cortana, позволит понимать команды на казахском в различных технологиях умного дома и в автомобилях.

Но области применения технологии почти бесконечны, поэтому ученые НУ решили бесплатно поделиться своей разработкой со всеми, кто пожелает внедрять казахскую речь в своих приложениях. К слову, обычно такими проектами занимаются крупные компании, которые затем коммерциализируют свою деятельность.

Но благодаря ученым Назарбаев Университета бесплатный доступ уже получили KaspiBank, Beeline, BTS Digital, Yandex, система распознавания речи Silero Speech, а также несколько университетов, включая частный гуманитарный Суортмор-колледж в США, Казахстанско-Британский технический университет, Алматинский университет энергетики и связи, Технический университет имени Сатпаева в Алматы.

К слову, в 2018 году Yandex уже сообщал о планах научить "Алису" казахскому, но компания пока не представила обновление своего голосового помощника. Возможно, работа ученых НУ ускорит процесс. 

"Прежде отсутствие достаточно большой базы данных было препятствием для применения казахского языка в цифровом мире, поэтому мы и инициировали этот проект. Сейчас мы готовы поделиться собранной базой данных казахской речи с открытым исходным кодом со всеми исследователями и предпринимателями, чтобы максимально задействовать ее в развитии экономики и общества страны", - отметил директор ISSAI NU профессор Атакан Варол.

Также ученые надеются, что эта их разработка поможет людям с ограниченными возможностями, например слабовидящим и незрячим, а также позволит преобразовывать речь в текст для людей с нарушенной координацией.

Только главные новости - в Telegram-канале Tengrinews.kz! Подпишись и получай самое важное прямо на свой телефон.

Вопрос от автора
Что вы об этом думаете?
news135
Отправить
Комментарии проходят модерацию редакцией
Показать комментарии

Читайте также
Реклама
Реклама
Join Telegram Последние новости
Лого TengriNews мобильная Лого TengriSport мобильная Лого TengriLife мобильная