Будущее казахского языка в ИИ

Будущее казахского языка в ИИ

Объявляется сбор данных для создания большой модели казахского языка – «Kaz LLM», передает DKnews.kz.

В целях создания и запуска большой модели казахского языка АО «Национальные информационные технологии» (АО «НИТ») приступает к использованию сервиса от лидера в области машинного обучения – Hugging Face. На базе платформы будет организован открытый сбор данных, к которому может присоединиться профессиональное IT-сообщество Казахстана и держатели открытых данных.

Что такое Hugging Face?

Hugging Face – ведущая платформа, предназначенная для обмена исследованиями в области машинного обучения, на базе которой пользователи могут разрабатывать инструменты и создавать ИИ модели. Пользователи платформы взаимодействуют с открытым исходным кодом, что делает искусственный интеллект более доступным и поощряет культуру обмена знаниями и прогрессом. Hugging Face помогает делиться моделями ИИ, которые далее в своей работе используют другие компании, включая Google, Microsoft Corp., Amazon, Meta Platforms Inc и другие. По состоянию на 2023 год на платформе было зарегистрировано более 1,2 миллиона пользователей, а только в январе 2024 года сайт посетили почти 30 миллионов человек. В числе самых активных пользователей сервиса жители США, Китая, Японии и Индии.

Для чего это нужно?

Создание современной языковой модели казахского языка – это важный шаг к укреплению цифровой независимости Казахстана и продвижению национальной культуры в глобальном цифровом пространстве. Первым этапом к созданию любой языковой модели является сбор данных.

В результате общего сбора данных и будет создана высококачественная модель обработки казахского языка (NLP). В будущем это поможет не только улучшить автоматический перевод, но и повысить качество и точность обработки текстов на казахском языке в целом.

Представители профессионального IT-сообщества и держатели открытых данных могут присоединиться к сбору. Сбор данных будет осуществляться на специально созданном аккаунте АО «НИТ». Пользователи могут, авторизовавшись на платформе, загружать файлы на аккаунт huggingface.co/nitec. Загрузке подлежат текстовые файлы разных стилей и жанров на казахском языке в форматах txt, .csv, .json.

ЗАЧЕМ МЫ ДЕЛАЕМ Эксперт KZ

Нам хочется жить в стране, где люди увлечены своим делом, ставят цели и добиваются их, мыслят творчески и видят стакан, который наполовину полон, а не наполовину пуст. Они получают удовольствие от жизни, но не проживают ее зря. Своей работой они меняют мир к лучшему и точно знают, что невозможное возможно. Мы хотим, чтобы русские стали самой активной, предприимчивой, довольной жизнью и успешной нацией в мире. Мы поддерживаем их на этом пути: вдохновляем удачными примерами, предостерегаем от ошибок, подсказываем новые дороги и помогаем брать следующую ступень в развитии.

КОМАНДА Эксперт KZ:



Руководитель:
Ералы Тугжанов


Редакционный коллектив.
Журналист: Талғат Ерғалиев
Журналист: Бақытжан Сағынтаев


Корреспондент: Баниямин Файзулин
Модератор: Талғат Ерғалиев
Корректор: Бақытжан Сағынтаев

Эксперт KZ – независимое издание новостного формата об общественных тенденциях и политике

Мы фокусируемся на контексте актуальных событий и рассказываем об общественных вызовах, свободах и границах безопасности, о людях, которые отстаивают базовые права и меняют представление о том, как может быть устроен мир. Эксперт KZ основали в 2011  году в Москве  журналисты Катерина Сергацковская и Роман Степанкович. Изначально издание рассказывало на нарушениях прав человека в России и консервативных тенденциях в обществе. Сегодня Эксперт KZ больше известен глубокими репортажами, расследованиями, документальными видеопроектами, комиксами и концептуальным подходом к сторителлингу.

Дайджест новостей
On Top