Будущее казахского языка в ИИ

Будущее казахского языка в ИИ

Объявляется сбор данных для создания большой модели казахского языка – «Kaz LLM», передает DKnews.kz.

В целях создания и запуска большой модели казахского языка АО «Национальные информационные технологии» (АО «НИТ») приступает к использованию сервиса от лидера в области машинного обучения – Hugging Face. На базе платформы будет организован открытый сбор данных, к которому может присоединиться профессиональное IT-сообщество Казахстана и держатели открытых данных.

Что такое Hugging Face?

Hugging Face – ведущая платформа, предназначенная для обмена исследованиями в области машинного обучения, на базе которой пользователи могут разрабатывать инструменты и создавать ИИ модели. Пользователи платформы взаимодействуют с открытым исходным кодом, что делает искусственный интеллект более доступным и поощряет культуру обмена знаниями и прогрессом. Hugging Face помогает делиться моделями ИИ, которые далее в своей работе используют другие компании, включая Google, Microsoft Corp., Amazon, Meta Platforms Inc и другие. По состоянию на 2023 год на платформе было зарегистрировано более 1,2 миллиона пользователей, а только в январе 2024 года сайт посетили почти 30 миллионов человек. В числе самых активных пользователей сервиса жители США, Китая, Японии и Индии.

Для чего это нужно?

Создание современной языковой модели казахского языка – это важный шаг к укреплению цифровой независимости Казахстана и продвижению национальной культуры в глобальном цифровом пространстве. Первым этапом к созданию любой языковой модели является сбор данных.

В результате общего сбора данных и будет создана высококачественная модель обработки казахского языка (NLP). В будущем это поможет не только улучшить автоматический перевод, но и повысить качество и точность обработки текстов на казахском языке в целом.

Представители профессионального IT-сообщества и держатели открытых данных могут присоединиться к сбору. Сбор данных будет осуществляться на специально созданном аккаунте АО «НИТ». Пользователи могут, авторизовавшись на платформе, загружать файлы на аккаунт huggingface.co/nitec. Загрузке подлежат текстовые файлы разных стилей и жанров на казахском языке в форматах txt, .csv, .json.

ЗАЧЕМ МЫ ДЕЛАЕМ Эксперт KZ

Нам хочется жить в стране, где люди увлечены своим делом, ставят цели и добиваются их, мыслят творчески и видят стакан, который наполовину полон, а не наполовину пуст. Они получают удовольствие от жизни, но не проживают ее зря. Своей работой они меняют мир к лучшему и точно знают, что невозможное возможно. Мы хотим, чтобы русские стали самой активной, предприимчивой, довольной жизнью и успешной нацией в мире. Мы поддерживаем их на этом пути: вдохновляем удачными примерами, предостерегаем от ошибок, подсказываем новые дороги и помогаем брать следующую ступень в развитии.

КОМАНДА Эксперт KZ:



Руководитель:
Ералы Тугжанов


Редакционный коллектив.
Журналист: Талғат Ерғалиев
Журналист: Бақытжан Сағынтаев


Корреспондент: Баниямин Файзулин
Модератор: Талғат Ерғалиев
Корректор: Бақытжан Сағынтаев
комментарий Минтранса без руки алкилат маникюр СПИД полиция алматы роль президента РК изменение субсидирование племенное животноводство новый генплан контрабандный вывоз безопасный город транспортные развязки транспортная система транспортная логистика мусоросортировочный комплекс наркосбыт Семей Водоканал Жилищный фонд Автосалон Права потребителя ссора авиатехника граффити трудовое законодательство трудовые отношения защита трудовых прав Формула I Макс Ферстаппен Silk Way Star сковородки Бурятия Жети Ата генетические мутации родственные браки экспортная продукция Нурымбет Сактаганов Жамбыл Жабаев Оман самосвалы Куда Звонить связанный мальчик бутан пропан декретные с миллионом флорист Талгат Жайлауов редакционная коллегия Песочница сыр радиохирургия испытание состояние пациентов внедрение инноваций цифровизация АПК бомж замаакима чиновники госслужба соблюдение условий служба пробации

Эксперт KZ – независимое издание новостного формата об общественных тенденциях и политике

Мы фокусируемся на контексте актуальных событий и рассказываем об общественных вызовах, свободах и границах безопасности, о людях, которые отстаивают базовые права и меняют представление о том, как может быть устроен мир. Эксперт KZ основали в 2011  году в Москве  журналисты Катерина Сергацковская и Роман Степанкович. Изначально издание рассказывало на нарушениях прав человека в России и консервативных тенденциях в обществе. Сегодня Эксперт KZ больше известен глубокими репортажами, расследованиями, документальными видеопроектами, комиксами и концептуальным подходом к сторителлингу.

Дайджест новостей
On Top