Ученые Назарбаев Университета записали и обработали 2000 голосов, собрали огромную базу аудиоданных на казахском языке, чтобы сделать возможным автоматическое распознавание родной речи, передает корреспондент Tengrinews.kz. Это не только поможет научить голосовые помощники понимать наш государственный язык, но и позволит внедрять другие новые технологии с поддержкой казахской речи.
Ученые Назарбаев Университета записали и обработали 2000 голосов, собрали огромную базу аудиоданных на казахском языке, чтобы сделать возможным автоматическое распознавание родной речи, передает корреспондент Tengrinews.kz. Это не только поможет научить голосовые помощники понимать наш государственный язык, но и позволит внедрять другие новые технологии с поддержкой казахской речи.
Желающих записать свой голос для развития казахского языка собирали по всему Казахстану через социальные сети, блогеров и медиа. Объявление выходило и на Tengrinews.kz. Благодаря этому ученые из Института умных систем и искусственного интеллекта НУ (ISSAI) смогли записать две тысячи человек, которые вместе наговорили 300 часов казахской речи - 154 тысячи предложений.
На основе получившейся огромной базы голосовых данных ученые Назарбаев Университета впервые создали корпус казахской речи - обучили искусственный интеллект распознаванию языка, смысловым связкам, особенностям произношения и разным значениям слов. Протестировать технологию можно здесь. По ссылке также можно получить доступ к собранной базе данных.
Система по распознаванию казахской речи может быть интересна разработчикам виртуальных помощников - таких как Siri, Alexa, Алиса и Cortana, позволит понимать команды на казахском в различных технологиях умного дома и в автомобилях.
Но области применения технологии почти бесконечны, поэтому ученые НУ решили бесплатно поделиться своей разработкой со всеми, кто пожелает внедрять казахскую речь в своих приложениях. К слову, обычно такими проектами занимаются крупные компании, которые затем коммерциализируют свою деятельность.
Но благодаря ученым Назарбаев Университета бесплатный доступ уже получили KaspiBank, Beeline, BTS Digital, Yandex, система распознавания речи Silero Speech, а также несколько университетов, включая частный гуманитарный Суортмор-колледж в США, Казахстанско-Британский технический университет, Алматинский университет энергетики и связи, Технический университет имени Сатпаева в Алматы.
К слову, в 2018 году Yandex уже сообщал о планах научить "Алису" казахскому, но компания пока не представила обновление своего голосового помощника. Возможно, работа ученых НУ ускорит процесс.
"Прежде отсутствие достаточно большой базы данных было препятствием для применения казахского языка в цифровом мире, поэтому мы и инициировали этот проект. Сейчас мы готовы поделиться собранной базой данных казахской речи с открытым исходным кодом со всеми исследователями и предпринимателями, чтобы максимально задействовать ее в развитии экономики и общества страны", - отметил директор ISSAI NU профессор Атакан Варол.
Также ученые надеются, что эта их разработка поможет людям с ограниченными возможностями, например слабовидящим и незрячим, а также позволит преобразовывать речь в текст для людей с нарушенной координацией.