Alpamys Batkalov – автор комментариев на Tengrinews.kz :interval

место в рейтинге
0
Комментарии
0
рейтинг
0
Казахстан разрабатывает собственную языковую модель
  • Alpamys Batkalov
  • 0
Сперва надо собрать хотя бы 1.5 милиона казахских слов с описаниями. Надо к этому подходит методм Мюррея первого редактора Оксфордского словоря. Сделать онлайн и опенсоурсным. Все на этузиазме знающих казахский язык. Редактора фильтрируют доля автоматизаций. Потом сделать нормальный переводчик с правилами языка а не статистический алгоритм. Потом только будет нормальный LLM модел с пермоментным казахским словарем. Ото делать из того что англиским логикой модел это пустая трата рессурсов. Она никогда не поймет правильно слова акынов и жырау. Это как англичанин изучающи казахский язык пытается понять со своей языковой (англиский) логикой понять жырау. Меня беспокоет что в эру ИИ мы войдем с потерей культурного наследия.
Казахстан разрабатывает собственную языковую модель
  • Alpamys Batkalov
  • 3
Согласень. Надо хотя бы собрать около 1.5 милиона слов казахского языка с разяснениями. Потом только переводчик с правилами. А потом только занятся LLM моделями занятся. Ото в новую эру ИИ мы зайдем с потерей культурного наследия казахов (турков). Потому как тексты акынов и жирау понимает только казах. Даже англичанин изучаюши языки, живущи в казахстане не поймет тексты как надо (LLM c логикой англисских слов). А было бы LLM с боле полной пермаментным словарем казахских слов то понимал бы. Но делать модел LLM с изначальной словарем англиских слов для казахского пользователя это не решает проблему. Тіл Қазына собрало около 400 тысяч слов. Это очень мало. Думаю данес мысль правильно.
Alpamys Batkalov

  • 1