Интересное

После резонанса вокруг KazLLM: эксперт объяснил, куда двигаться дальше

Публичные высказывания вокруг KazLLM вышла далеко за пределы технологического сообщества. После того как Касым-Жомарт Токаев на расширенном заседании по цифровизации усомнился в цифрах по числу пользователей модели, проект оказался под пристальным вниманием не только экспертов, но и общества. Tech News попытался разобраться, сможет ли Казахстан ускорить развитие «интеллектуальной генерации» или ставка на цифровой суверенитет требует стратегического пересмотра.

Что происходит вокруг KazLLM

Формально всё выглядит амбициозно. KazLLM представлена как элемент цифрового суверенитета страны. Разработка велась при участии ISSAI при Nazarbayev University, более 140 специалистов из 26 научных организаций формировали корпус казахского языка по 115 дисциплинам. Проект размещён в открытом доступе на платформе Hugging Face для исследовательского использования. По официальным данным, модель интегрирована более чем в 40 информационных систем, включая eGov AI.

Однако на заседании правительства прозвучала иная цифра: около 600 тысяч пользователей. Это примерно всего 3% населения страны. Глава государства привел сравнение — сервисом ChatGPT пользуются 13% казахстанцев. Именно этот контраст и стал моментом дискуссии.

Почему KazLLM и ChatGPT это разные уровни системы

Ключевая проблема в позиционировании, говорит эксперт ИИ, MIT Рустем Бигари. KazLLM — это фундаментальная языковая модель, а не готовый пользовательский сервис. У неё нет массового интерфейса наподобие чат-бота. Это «ядро», которое предназначено для разработчиков и может использоваться в других продуктах. Отсюда возникает разрыв: гражданин не может «зайти и попробовать» KazLLM как привычный сервис. Без масштабного развертывания в дата-центрах (AlemCloud, Al-Farabium) модель остаётся исследовательским инструментом.

«Для обычного пользователя они могут выглядеть одинаково, но с точки зрения инженерии и стратегии — это разные уровни системы. В MIT мы изучаем как разделять любую ИИ-систему на две части: LLM (двигатель) и harness (обвязка). KazLLM — это «двигатель», результат сжатия колоссальных объемов данных в параметры модели. ChatGPT — это уже готовое приложение, которое использует такой двигатель для диалога. Сравнивать их — это как сравнивать электромотор с готовым электрокаром Tesla» — утверждает эксперт.

Более того, эксперт ссылается на исследование MIT 2026 года, согласно которому глобальные модели демонстрируют системные искажения: они выдают меньше информации из «длинного хвоста» (long tail) и чаще отдают приоритет глобально популярным источникам, игнорируя локальную специфику.

После обсуждений в публичном пространстве многие начали ставить вопрос в лоб: KazLLM это альтернатива ChatGPT? Казахстан собирается с ним конкурировать? Ситуацию разъяснил и бывший министр цифрового развития Багдат Мусин. По его словам, сравнение KazLLM и ChatGPT некорректно по своей сути. Фактически Мусин объяснял это через уровни системы:

«KazLLM — это базовая модель, своего рода двигатель. А ChatGPT — это уже готовый сервис, который построен поверх двигателя. Сравнивать их напрямую неправильно, это разные уровни технологической архитектуры. Фундаментальную модель нельзя “построить и забыть”. Это постоянная генерация и модернизация. Без инвестиций она теряет конкурентоспособность. Тогда зачем KazLLM? Не для того, чтобы конкурировать с конкретным прибором. А для того, чтобы: иметь собственную генерацию, снизить критическую зависимость, обеспечить контроль над обработкой данных, развивать научную школу, обеспечить технологический суверенитет. Можно полностью импортировать “интеллектуальную энергию”. Это удобно и часто дешевле на старте. Но стратегически — вопрос в том, есть ли у страны собственная генерация. Во всём мире это называется AI sovereignty.».

Эта позиция снимает главный источник спекуляций. Речь не идёт о прямой конкуренции с конкретным приложением. Речь идёт о создании собственной фундаментальной базы. Если продолжить объяснение, фундаментальная LLM — это как электростанция. Она генерирует «интеллектуальную энергию». А сервисы вроде ChatGPT — это уже приборы: удобные, пользовательские решения, подключённые к этой генерации.

Что нужно, чтобы KazLLM стал массовым?

По мнению эксперта Рустема Бигари, в эпоху ИИ популярность определяется не сложностью кода, а качеством данных и полезностью интеграций. Современное машинное обучение переходит в стадию AutoML, где технические детали отходят на второй план. Главное — чистота и релевантность данных, говорит он.

Технологически: нужно внедрять эмбеддинги — это способ превратить неструктурированные тексты (законы, архивы) в математические векторы. Это позволит создать на базе KazLLM сверхточные поисковые системы, которые находят информацию не по словам, а по смыслу. Маркетингово: мы должны четко позиционировать KazLLM как безопасный ИИ. Исследование MIT 2026 года выявило «скрытые политические решения» ИИ-гигантов, которые могут внезапно исключать целые страны из выдачи. Образовательно: нужно обучать людей «программировать данными». Нам нужно сообщество, которое будет уметь правильно готовить данные для дообучения KazLLM под нужды своих компаний.

3,9 миллиарда тенге: инвестиция или адаптация?

Отдельная дискуссия развернулась вокруг финансирования. По официальной информации, на разработку было направлено около 3,9 млрд тенге. При этом архитектура создавалась на основе открытой модели Meta Llama — что соответствует мировой практике. В публичном поле прозвучали аргументы о возможности дообучения моделей на казахском языке за минимальные средства. Однако, по словам эксперта, вопрос нельзя сводить только к стоимости.

«Это вопрос не просто справедливости, а стратегического выживания в цифровом мире. Согласно последним исследованиям, мы наблюдаем «взрывной рост» ИИ-поиска: например, количество ответов ИИ по критическим темам, таким как медицина, выросло на 5600% всего за год. Если государство не инвестирует в такие проекты, как KazLLM, оно добровольно соглашается на три критических риска: утрата контроля над истиной, технологическая рента и зависимость, угроза приватности», — резюмирует эксперт.

Перезапуск или корректировка?

Сегодня KazLLM находится в точке развилки. Либо проект чётко позиционируется как инфраструктурная база для государственных задач и локальных решений, с прозрачными метриками и понятной стратегией развития. Либо он продолжит существовать в режиме завышенных ожиданий и постоянных сравнений с глобальными игроками. Важно: сможет ли Казахстан обеспечить скорость итераций, прозрачность метрик и качество конечных продуктов, сопоставимые с ожиданиями общества?

Эксперт считает, что конкурировать с глобальными ИИ на поле универсальных ответов бессмысленно — их сила в масштабе. Преимущество KazLLM — в узких, «вертикальных» решениях. Национальная модель может быть интегрирована в eGov и банковские системы, работать с закрытыми базами данных и обеспечивать глубокий смысловой поиск. «Если инсайт требует вашей проприетарной информации — вам нужна своя модель», — подчёркивает он. При подключении к верифицированным источникам KazLLM способен обеспечить более высокую достоверность в профессиональных запросах.

 

Так, сможет ли KazLLM стать массовой? Теоретически, да. Если практически учесть все приведенные условия. Без этого KazLLM останется исследовательским активом, а не рыночным продуктом.

 

 

Shares:

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *