Будущее казахского языка в ИИ

Будущее казахского языка в ИИ

Объявляется сбор данных для создания большой модели казахского языка – «Kaz LLM», передает DKnews.kz.

В целях создания и запуска большой модели казахского языка АО «Национальные информационные технологии» (АО «НИТ») приступает к использованию сервиса от лидера в области машинного обучения – Hugging Face. На базе платформы будет организован открытый сбор данных, к которому может присоединиться профессиональное IT-сообщество Казахстана и держатели открытых данных.

Что такое Hugging Face?

Hugging Face – ведущая платформа, предназначенная для обмена исследованиями в области машинного обучения, на базе которой пользователи могут разрабатывать инструменты и создавать ИИ модели. Пользователи платформы взаимодействуют с открытым исходным кодом, что делает искусственный интеллект более доступным и поощряет культуру обмена знаниями и прогрессом. Hugging Face помогает делиться моделями ИИ, которые далее в своей работе используют другие компании, включая Google, Microsoft Corp., Amazon, Meta Platforms Inc и другие. По состоянию на 2023 год на платформе было зарегистрировано более 1,2 миллиона пользователей, а только в январе 2024 года сайт посетили почти 30 миллионов человек. В числе самых активных пользователей сервиса жители США, Китая, Японии и Индии.

Для чего это нужно?

Создание современной языковой модели казахского языка – это важный шаг к укреплению цифровой независимости Казахстана и продвижению национальной культуры в глобальном цифровом пространстве. Первым этапом к созданию любой языковой модели является сбор данных.

В результате общего сбора данных и будет создана высококачественная модель обработки казахского языка (NLP). В будущем это поможет не только улучшить автоматический перевод, но и повысить качество и точность обработки текстов на казахском языке в целом.

Представители профессионального IT-сообщества и держатели открытых данных могут присоединиться к сбору. Сбор данных будет осуществляться на специально созданном аккаунте АО «НИТ». Пользователи могут, авторизовавшись на платформе, загружать файлы на аккаунт huggingface.co/nitec. Загрузке подлежат текстовые файлы разных стилей и жанров на казахском языке в форматах txt, .csv, .json.

ЗАЧЕМ МЫ ДЕЛАЕМ Эксперт KZ

Нам хочется жить в стране, где люди увлечены своим делом, ставят цели и добиваются их, мыслят творчески и видят стакан, который наполовину полон, а не наполовину пуст. Они получают удовольствие от жизни, но не проживают ее зря. Своей работой они меняют мир к лучшему и точно знают, что невозможное возможно. Мы хотим, чтобы русские стали самой активной, предприимчивой, довольной жизнью и успешной нацией в мире. Мы поддерживаем их на этом пути: вдохновляем удачными примерами, предостерегаем от ошибок, подсказываем новые дороги и помогаем брать следующую ступень в развитии.

КОМАНДА Эксперт KZ:



Руководитель:
Ералы Тугжанов


Редакционный коллектив.
Журналист: Талғат Ерғалиев
Журналист: Бақытжан Сағынтаев


Корреспондент: Баниямин Файзулин
Модератор: Талғат Ерғалиев
Корректор: Бақытжан Сағынтаев
Шығыс Салбұрыны Разводы Средний коридор Достык орден Достык Орден Достык II качество воздуха тарифы на водоснабжение тарифы на водоотведение Павлодар – Кызылорда Валютный контроль Шлем шести королей КПЛ Казахстанская Премьер-Лига Джеффри Эпштейн британский принц Эндрю WTA-500 служебная дисциплина извинения Mercedes-Benz Угон машины Гизат Нурдаулетов ЧП в аэропорту бомба серая схема импорта карго перевозки стартап-проекты Инвестиции. Германия бот техподдержка Windows 10 заведения нелегальные трудовые мигранты Нелегал – 2025 профилактика правонарушений меценаты туристический поток пополнение бюджета Клумба нападение на школьницу обращение безрботных возвращение средств нарушители освобождение заложников антибиотик бактерия угон авто сноуборд каннабис опасные игры строгие диеты Барсы Атырау Национальная лига алкоголизм Утонул ребенок леопард тигр Кровля медианная зарплата паломничество

Эксперт KZ – независимое издание новостного формата об общественных тенденциях и политике

Мы фокусируемся на контексте актуальных событий и рассказываем об общественных вызовах, свободах и границах безопасности, о людях, которые отстаивают базовые права и меняют представление о том, как может быть устроен мир. Эксперт KZ основали в 2011  году в Москве  журналисты Катерина Сергацковская и Роман Степанкович. Изначально издание рассказывало на нарушениях прав человека в России и консервативных тенденциях в обществе. Сегодня Эксперт KZ больше известен глубокими репортажами, расследованиями, документальными видеопроектами, комиксами и концептуальным подходом к сторителлингу.

Дайджест новостей
On Top