Grok 3: що відомо про штучний інтелект Ілона Маска

Компанія X Ілона Маска у листопаді 2023 року презентувала «дотепну та бунтівну» мовну модель на основі штучного інтелекту Grok. У лютому 2025 року випустили вже третю версію Grok. У цьому матеріалі збираємо все що відомо про цей чат-бот і його оновлення.

Що таке Grok?

Grok — чатбот на основі штучного інтелекту, який «дотепно відповідає на запитання та має бунтарську жилку». Унікальність Grok у тому, що він матиме знання про світ у реальному часі, користуючись матеріалами з Х. Також чатбот відповідає на ті запитання, які відхиляє більшість інших сервісів ШІ.

Навіщо створили Grok?

xAI прагне розробляти інструменти ШІ, корисні для людей із різними політичними поглядами та походженням. Компанія має на меті розширити можливості для досліджень. Чатбот допомагатиме користувачам отримувати потрібну інформацію, обробляти дані та генерувати ідеї. xAI зазначає, що кінцева мета її інструментів ШІ — «допомогти знайти розуміння».

Grok-1

Двигун Grok — Grok-1, передова Large Language Model (LLM), яку xAI розробляла протягом чотирьох місяців. Вона є значно потужнішою за свій прототип Grok-0, що має 33 млрд параметрів, але використовує лише половину навчальних ресурсів.

Щоб оцінити Grok-1, xAI провела низку стандартних машинних тестів:

xA GSM8k (текстові задачі з математики для середньої школи з підказкою ланцюжка думок);
MMLU (мультидисциплінарні запитання з кількома варіантами відповідей із п’ятьма прикладами);
HumanEval (завдання на завершення коду Python);
завдання з математики для середньої та старшої школи, написані в LaTeX із підказкою з чотирьох кадрів.

Grok-1 перевершив усі моделі ШІ у своєму класі обчислень. Кращі результати показали тільки інструменти, навчені на значно більшій кількості даних і обчислювальних ресурсів, як-от GPT-4. xAI заявляє про швидкий прогрес у ефективному навчанні LLM.

Оскільки ці тести можна знайти в інтернеті, компанія не виключає, що її моделі ШІ випадково навчилися на них. Компанія вручну оцінила Grok-1, а також інструменти Claude-2 і GPT-4) на фіналі Угорської національної середньої школи 2023 року . in mathematics. Grok-1 склав іспит на C (59 % правильних відповідей).

Інженерія xAI

Для створення Grok компанія розробила спеціальний стек навчання та висновків на основі Kubernetes, Rust і JAX. Утім xAI зауважує, що графічні процесори можуть виходити з ладу через виробничі дефекти, слабкі з’єднання, неправильну конфігурація, пошкоджені мікросхеми тощо. Це ускладнюватиме навчання LLM, адже xAI синхронізує обчислення на десятках тисяч графічних процесорів протягом багатьох місяців. Щоб уникнути збоїв, компанія застосовує набір спеціальних розподілених систем, які миттєво виявляють і автоматично обробляють усі проблеми. Передусім xAI прагне максимізувати показник корисного обчислення на ват. Протягом останніх місяців компанія мінімізувала час простою та підтримувала високе використання флопу моделі (MFU) навіть за наявності ненадійного обладнання.

Для побудови інфраструктури обрали мову програмування Rust, адже вона пропонує високу продуктивність, багату екосистему та запобігає більшості помилок розподіленої системи. Для xAI надійність інфраструктури важлива, адже технічне обслуговування позбавляє інновацій.

Нині компанія готується до наступного покращення Grok, яке вимагатиме надійної координації тренувань на десятках тисяч прискорювачів, запуску конвеєрів даних і створення нових можливостей та інструментів.

Дослідження xAI

Попри доступ Grok до інформації в реальному часі, модель ШІ може генерувати неправдиві чи суперечливі дані. Для досягнення надійності у відповідях інструмента xAI проводить дослідження.

Масштабований нагляд за допомогою інструментів. ШІ шукає покликання на різні джерела, перевіряє дані за допомогою зовнішніх інструментів і знаходить відгуки користувачів.

Інтеграція з офіційною перевіркою безпеки, надійності та заземлення. Щоб створити моделі ШІ, які можуть ґрунтовно розмірковувати про реальний світ, xAI планує розвивати навички їхньої роботи в неоднозначних ситуаціях. Це дає змогу оцінювати системи штучного інтелекту без зворотного зв’язку від людей. Одна із головних цілей компанії — формальне гарантування правильності коду, особливо щодо формально перевірених аспектів безпеки ШІ.

Змагальна міцність. xAI прагне покращити LLM, моделі винагород і системи моніторингу.

Мультимодальні можливості. Компанія обладнає Grok різними «органами чуття» , які допомагатимуть користувачам у реальному часі.

Ранній доступ до Grok

Певна кількість користувачів у США може випробувати прототип Grok і поділитися відгуками для покращення моделі ШІ. Наразі у програмі можуть взяти участь лише верифіковані користувачі X.

Найближчими місяцями xAI планує запровадити нові можливості та функції для Grok.

Розрізнювання зображень у Grok

У жовтні 2024 року xAI додав у Grok функцію розпізнавання зображень. Передплатники X можуть завантажувати зображення і ставити ШІ-боту запитання про них.

Ілон Маск повідомив, що Grok може навіть пояснити сенс жарту завдяки новій функції. З його слів, функціонал перебуває на ранніх стадіях і ще вдосконалюватиметься.

У компанії додали, що Grok незабаром зможе розпізнавати й документи.

Grok-2

Grok-2 представили в серпні 2024 року як покращену версію попередньої моделі Grok-1.5. Чат-бот дає змогу генерувати кодові інструкції, писати художні тексти, відповідати на різноманітні запитання, узагальнювати новини тощо.

«Проти свого попередника Grok-2 більш інтуїтивно зрозумілий, керований і універсальний у широкому діапазоні завдань», — ідеться у повідомленні розробників.

Тестування моделі з академічних тестів показало значні покращення в розумінні тексту й зображень. Як зазначали розробники, Grok-2 досягає рівнів продуктивності, конкурентних з іншими передовими моделями в таких сферах, як природничо-наукові знання (GPQA), загальні знання (MMLU, MMLU-Pro) та математичні (MATH). Крім того, Grok-2 справляється із завданнями на основі візуального сприйняття та у відповідях на запитання на основі документів (DocVQA).

Однією з ключових особливостей Grok-2 є його здатність генерувати зображення за допомогою моделі FLUX.1 від Black Forest Labs. Це дає змогу користувачам створювати й публікувати зображення безпосередньо на платформі X. Водночас ця функція викликала суперечки через можливість створення контенту, який може бути визнаний образливим або неприйнятним.

Зображення, створені користувачами X, свідчили, що функція генерування картинок не має жодних перешкод для створення зображень політичних діячів.

https://twitter.com/BenjaminDEKR/status/1823582769521283293

У серпні Grok-2 та Grok-2 mini був доступний лише для користувачів X Premium і Premium+. У грудні 2024 року розробники відкрили безоплатний доступ для всіх користувачів платформи X. Водночас передплатники Premium і Premium+ мають вищі ліміти використання. Безплатно можна генерувати до 10 текстових або до трьох повідомлень із додаванням зображень раз на дві години. Компанія також зробила обидві моделі доступними для розробників через корпоративний API.

Grok-3

16 лютого 2025 року Ілон Маск анонсував випуск Grok-3, який, за його словами, є найрозумнішим штучним інтелектом у наш час. Маск опублікував в X пост зі скриншотом запиту до Grok 3 — «Яка ваша думка про The Information?». Бот відповів, що The Information, як і більшість застарілих медіа — сміття.

«Це частина старої гвардії — відфільтрована, упереджена, яка часто служить інтересам своїх спонсорів або редакторів, а не видає вам чисту правду», — йдеться у відповіді.

X ж ШІ назвав X місцем, де можна знайти новини безпосередньо від людей, які живуть цим: «Жодних посередників, жодних перекручувань — лише реальні факти».

Маск додав до поста, що Grok 3 «видав базу».

Компанія Маска xAI 17 лютого офіційно випустила Grok 3 і представила нові можливості для iOS- і вебзастосунків Grok. Як пише TechCrunch, Grok — це відповідь компанії на такі моделі як GPT-4o від OpenAI й Gemini від Google. ШІ-бот може аналізувати зображення і відповідати на питання, а також забезпечує роботу низки функцій у X.

Розробники стверджують, що Grok 3 — більш точна за попередні версії. У пості на X Маск заявив, що ця модель розроблена з удесятеро більшою обчислювальною потужністю, ніж Grok 2, а також із використанням розширеного набору навчальних даних, який охоплює матеріали судових справ. Система графічних процесорів Nvidia H100 надала 200 млн GPU-годин для навчання нового ШІ-бота — вдесятеро більше проти Grok 2. Цей приріст допоможе Grok 3 ефективніше обробляти великі набори даних із вищою точністю та швидкістю. У xAI додали, що для забезпечення більш точних відповідей впроваджені петлі зворотного зв’язку і контекстне навчання.

За даними xAI, рання версія Grok 3 отримала високі бали в Chatbot Arena — краудсорсинговому тесті, в якому різні моделі штучного інтелекту змагаються між собою, а користувачі голосують за найкращі відповіді.

Дві моделі нового сімейства Grok 3, Grok 3 Reasoning і Grok 3 mini Reasoning також можуть ретельно «обмірковувати» запити. Ці моделі лежать в основі нової функції в застосунку Grok під назвою DeepSearch — це дослідницькі інструменти зі штучним інтелектом. DeepSearch сканує інтернет і X, щоби проаналізувати інформацію і надати відповідь на запит. ШІ-моделі доступні через застосунок Grok. Маск сказав, що деякі «думки» приховані в застосунку, щоб запобігти дистиляції — методу, який використовується розробниками моделей ШІ для вилучення даних з інших моделей.

Передплатники X Premium+ за $50 на місяць отримають доступ до Grok 3 першими, а інші функції доступні за новим планом — SuperGrok. Його вартість становить $30 на місяць або $300 на рік. Цей SuperGrok має додаткові можливості — більше запитів у DeepSearch та необмежене генерування зображень.

Через тиждень, за словами Маска, Grok отримає «голосовий режим». А ще через кілька тижнів моделі Grok 3 стануть доступні через корпоративний API xAI разом із функцією глибинного пошуку.

Блокування відповідей

Grok тимчасово відмовився відповідати на повідомлення, що «джерела, які згадують Ілона Маска/Дональда Трампа, поширюють дезінформацію». Керівник інженерного відділу xAI Ігор Бабушкін звинуватив неназваного співробітника компанії, що раніше працював у OpenAI, в тому, що він без дозволу оновив системну підказку Grok.

Бабушкін сказав, що системна підказка Grok є загальнодоступною: «Вважаємо, що користувачі повинні бачити, про що саме ми запитуємо Grok». Він пояснив, що співробітник змінив підказки, бо думав, що це допоможе, але це не відповідає цінностям компанії.

Grok у Telegram

Grok із березня 2025 року доступний у Telegram — для його використання потрібно оформити підписку Premium. Користувачі мають знайти офіційного бота @GrokAI у Telegram. Розширені функції чат-бота доступні тільки в застосунку Grok або на X.

Grok 3: що відомо про нову версію чат-бота на основі штучного інтелекту від компанії Ілона Маска xAI (оновлено)

Що таке Grok?

Навіщо створили Grok?

Grok-1

Інженерія xAI

Дослідження xAI

Ранній доступ до Grok

Розрізнювання зображень у Grok

Grok-2

Grok-3

Блокування відповідей

Grok у Telegram

Читайте також

Шукаєте інформацію про медіа та можливості для них? Підписуйтеся на новий проєкт «Рівні медіа»

«Медіамейкер» зупиняє роботу. Що буде далі?

«Китайське обладнання з польськими етикетками». Розслідування від «18000» про те, яке медобладнання в Черкасах купують за десятки мільйонів гривень

22 пацієнти втратили зір після ін’єкцій. Як NGL.media розбиралися в тому, що сталося в офтальмології на Тернопільщині

Незадекларована розкіш. Як «18000» вивчали розрив між доходами та способом життя родини секретаря Черкаської міськради

Безплатний курс із PR від комунікаційної академії «КомА» (реєстрація до 6 липня)

Хто ми?

Медіамейкер

Розділи

Соцмережі