Український клуб штучного інтелекту: xAI Ілона Маска представляє нову флагманську модель, Grok 3

Штучний інтелект компанії Ілона Маска, xAI, у понеділок пізно ввечері презентувал свою нову флагманську модель, Grok 3, а також анонсував нові можливості для додатків Grok на iOS та веб.

Grok — це відповідь xAI на такі моделі, як GPT-4 від OpenAI та Google Gemini. Модель здатна аналізувати зображення та відповідати на запитання, а також забезпечує роботу низки функцій у соціальній мережі Маска, X. Grok 3, розробка якої тривала кілька місяців, мала бути випущена ще в 2024 році, однак через певні затримки реліз відбувся лише цього року.

Для навчання Grok 3 xAI використовував потужний дата-центр у Мемфісі, що містить близько 200 000 графічних процесорів (GPU). У своєму дописі на X Маск зазначив, що Grok 3 розроблявся з обчислювальною потужністю в "10 разів більше", ніж у попередника Grok 2, із розширеним набором даних, який включає судові документи та багато іншого.

"Grok 3 набагато потужніший за Grok 2", — заявив Маск під час трансляції презентації.

Не всі моделі та функції Grok 3 доступні наразі (деякі все ще перебувають на стадії бета-тестування), але їх почали запускати в понеділок. xAI стверджує, що Grok 3 випереджає GPT-4 за показниками, включаючи AIME (який оцінює виконання математичних завдань) та GPQA (оцінка моделей на основі задач із фізики, біології та хімії для докторських рівнів). Попередня версія Grok 3 також досягла хороших результатів у тестах Chatbot Arena, де різні штучні інтелекти змагаються за рейтинг від користувачів.

Нові моделі для розв'язування проблем

Серед новинок Grok 3 є дві моделі — Grok 3 Reasoning та Grok 3 mini Reasoning, які можуть ретельно «розмірковувати» над проблемами, подібно до моделей розмірковування, таких як o3-mini від OpenAI або R1 китайської компанії DeepSeek. Моделі розмірковування перевіряють себе перед тим, як видавати результати, що дозволяє уникнути деяких помилок.

xAI стверджує, що Grok 3 Reasoning перевершує найкращу версію o3-mini — o3-mini-high — за кількома популярними тестами, зокрема новим математичним тестом AIME 2025.

Моделі доступні через додаток Grok, де користувачі можуть попросити Grok 3 «подумати», або для складніших запитів активувати режим «Big Brain», що дозволяє використовувати додаткову обчислювальну потужність для більш складних міркувань. xAI зазначає, що ці моделі найкраще підходять для завдань з математики, науки та програмування.

Глибокий пошук та нові функції для підписників

Моделі розмірковування стали основою для нової функції в додатку Grok під назвою DeepSearch, що є аналогом таких інструментів для досліджень, як OpenAI Deep Research. DeepSearch аналізує інформацію в Інтернеті та на платформі X, формулюючи підсумки відповідно до поставлених запитань.

Підписники на Premium+ план X ($50 на місяць) отримають доступ до Grok 3 першими, а деякі додаткові функції будуть доступні лише в новому плані SuperGrok. За інформацією з витоків, SuperGrok коштує $30 на місяць або $300 на рік, і дає доступ до додаткових запитів на розмірковування, DeepSearch, а також безлімітної генерації зображень.

Майбутнє Grok 3: голосові функції та API для підприємств

У майбутньому, вже за тиждень, додаток Grok отримає «голосовий режим», що дозволить Grok озвучувати свої відповіді синтезованим голосом. Через кілька тижнів після цього моделі Grok 3 стануть доступними через API для підприємств xAI, включаючи можливості DeepSearch.

xAI планує відкрити вихідний код для Grok 2 найближчими місяцями. Маск заявив, що компанія планує відкритий доступ до останньої версії Grok, коли буде готова наступна. "Коли Grok 3 стане стабільним, ми відкриємо Grok 2", — додав він.

Чи змінилася політична нейтральність Grok?

Коли Маск анонсував Grok два роки тому, він описав модель як «ризиковану», без фільтрів і антиполіткоректну — готову відповідати на спірні запитання, на які інші ШІ відмовляються відповідати. Частково це вдалося. Наприклад, Grok і Grok 2 без вагань використовували грубі вирази, на відміну від ChatGPT.

Але попередні версії Grok були обережними щодо політичних тем і не переходили певні межі. Дослідження показали, що Grok схилявся до лівих поглядів щодо таких тем, як права трансгендерів, програми різноманітності та нерівність.

Маск пояснив таку поведінку даними для навчання — публічними веб-сторінками — і пообіцяв зробити Grok більш політично нейтральним. Однак, чи вдалося досягти цієї мети і до яких наслідків це призведе, поки що не зрозуміло.

Авторка: Дар’я Бровченко

Український клуб штучного інтелекту

середа, 19 лютого 2025 р.

xAI Ілона Маска представляє нову флагманську модель, Grok 3

Немає коментарів:

Дописати коментар

середа, 19 лютого 2025 р.

xAI Ілона Маска представляє нову флагманську модель, Grok 3

Немає коментарів:

Дописати коментар

середа, 19 лютого 2025 р.