15 июля 2024 года Илон Маск представил новую версию своего искусственного интеллекта — Grok 4. Компания xAI позиционирует его как «самый продвинутый ИИ», способный решать сложные инженерные и аналитические задачи. Но что стоит за этими заявлениями и чем Grok 4 действительно отличается от конкурентов?
Архитектура и обучение
Согласно данным xAI, Grok 4 обучался с использованием в 10 раз большим количеством вычислительных ресурсов, чем предыдущая версия. Также добавили интеграцию внешних инструментов (поиск в сети, выполнение кода, доступ к базам данных) с самого начала обучения.
Это позволяет модели не просто генерировать ответы, но и:
- Проверять факты в реальном времени,
- Выполнять сложные вычисления,
- Анализировать актуальную информацию.
Однако независимых подтверждений эффективности такого подхода пока нет.
Режим Grok 4 Heavy
xAI заявляет о создании специального режима, где:
- Несколько «агентов» (копий модели) совместно решают задачу,
- Происходит взаимная проверка и корректировка результатов.
Точная стоимость и доступность этого режима не раскрываются.
Тестирование и возможности
- Лучшая среди ИИ интеграция с платформой X (Twitter) для работы с актуальными данными,
- Улучшенные возможности программирования и работы с кодом,
- Результаты в тесте ARC-AGI (15,9%) — пока только заявление xAI,
- Преимущество в бизнес-симуляциях (пример с торговыми автоматами) — демонстрация без независимой верификации.
Практическое применение
Сильные стороны (подтвержденные пользователями):
- Анализ трендов в социальных сетях,
- Решение технических задач и программирование,
- Работа с финансовыми данными.
Ограничения:
- Результаты в творческих задачах (поэзия, юмор) уступают ChatGPT-4,
- Случаи «переусложнения» простых вопросов
Grok 4 действительно представляет собой шаг вперед в развитии ИИ, особенно в области работы с актуальными данными и технических и аналитических задач.
Однако многие заявления xAI пока не имеют независимого подтверждения и требуют дополнительной проверки на практике
«Это многообещающая разработка, но для объективной оценки нужны реальные кейсы использования за пределами демонстраций xAI», — отмечают эксперты в области ИИ.
По мере поступления новых данных о работе Grok 4 мы обновим этот материал. Следите за нашими публикациями.
Фото: ПМЭФ пресс-материалы.