Что представляет собой Grok 4
Grok 4 — это усовершенствованный чат‑бот от xAI, обученный на суперкомпьютере Colossus. По словам Маска, ИИ «умнее почти всех студентов магистратуры сразу по всем дисциплинам». Он демонстрирует способности междисциплинарного рассуждения и работает в 10 раз быстрее, чем предыдущая версия Grok 3.
Результаты тестов
По тесту «Последний экзамен человечества» Grok 4 набрал 25,4 %, обойдя Google Gemini 2.5 Pro (21,6 %) и OpenAI o3 (21 %). В тесте ARC‑AGI‑2 от организации Arc Prize модель достигла 16,2 %, что почти вдвое превышает результат Claude Opus 4. Также независимые исследователи зафиксировали индекс ИИ на уровне 73 против 70 у OpenAI и Google.
Особенности и преимущества
- Прогрессивные логические рассуждения
- Оптимизация для программирования (Grok 4 Code)
- Мультимодальность: текст, изображения, в будущем — видео
- Голосовые интерфейсы с пятью естественными голосами
- Реальный доступ к интернету (DeepSearch)
- Понимание сленга, мемов и интернет‑культуры
Новые версии и доступ
xAI анонсировала модель Grok 4 Heavy — мультиагентную ИИ‑систему, где несколько агентов решают задачи параллельно, выбирая лучшее решение. В тесте AIME 2025 модель решила 100 % задач и набрала 44,4 % в «Последнем экзамене человечества». Маск отметил, что это «самая умная модель в мире».
Grok 4 доступен по подписке SuperGrok за 30 $ в месяц или 300 $ в год, а Grok 4 Heavy — по тарифу SuperGrok Heavy за 300 $/мес или 3000 $/год. Контекстное окно модели составляет 256 000 токенов. Для разработчиков открыт API: 1 млн входящих токенов — 3 $, исходящих — 15 $.
Примеры практического применения
- Генерация SVG‑изображения пеликана на велосипеде и его описание
- Корректное решение задачи «9.11 – 9.9»
- Решение задачи с использованием всех цифр от 0 до 9 по Python, 96 решений
- Создание бесконечной игры‑раннера на p5.js с пиксел‑арт динозавром
- Анализ PDF‑отчёта EC: составление описаний трёх ключевых графиков
В тестировании TechCrunch бот демонстрировал ориентацию на высказывания Илона Маска при ответе на спорные политические вопросы, однако в повседневных темах, например, о сортах манго, подобных ссылок не выявлено. Разработчики отметили, что устранили зависимость ответов от мнения Маска и снизили мем‑ориентированность там, где это неуместно.
Дополнительно: запуск Grok 4 стал очередным шагом в развитии ИИ‑инструментов для исследователей и разработчиков. Возможность работы с мультимодальными данными и доступ в реальном времени открывают перспективы для научных открытий и автоматизации сложных задач уже ближе к концу года.