пʼятниця, 28 лютого 2025 р.

OpenAI представила GPT-4.5 "Orion" – найбільшу модель ШІ в історії компанії


OpenAI оголосила про запуск GPT-4.5, довгоочікуваної моделі ШІ з кодовою назвою Orion. GPT-4.5 стала найбільшою моделлю, яку коли-небудь створювала компанія, використовуючи для її навчання більше обчислювальних ресурсів і даних, ніж для попередніх версій. Попри свій масштаб, OpenAI у технічному документі зазначає, що не вважає GPT-4.5 "передовою" моделлю.

Користувачі підписки ChatGPT Pro ($200 на місяць) отримають доступ до GPT-4.5 у ChatGPT з четверга в рамках дослідницького прев'ю. Розробники, які користуються платною версією API OpenAI, також зможуть працювати з новою моделлю. Інші користувачі, які мають підписку ChatGPT Plus і ChatGPT Team, отримають доступ до GPT-4.5 наступного тижня, повідомив представник OpenAI для TechCrunch.

Що змінює GPT-4.5?

Індустрія штучного інтелекту з нетерпінням чекала на Orion, розглядаючи його як важливий тест для традиційних методів навчання моделей. GPT-4.5 було розроблено за тією ж технологією, що й попередні версії GPT – шляхом значного збільшення обчислювальної потужності та обсягів даних на етапі "попереднього навчання" (unsupervised learning).Раніше масштабування GPT-моделей давало величезний приріст продуктивності в таких сферах, як математика, написання текстів і програмування.

OpenAI стверджує, що збільшений розмір GPT-4.5 забезпечує "глибше розуміння світу" та "вищий рівень емоційного інтелекту". Водночас деякі аналітики вказують на те, що приріст від масштабування поступово зменшується. Зокрема, на деяких тестах GPT-4.5 поступається новітнім моделям з "логічним мисленням" від китайської DeepSeek, Anthropic і самої OpenAI.

Ціна та доступність

OpenAI визнає, що запуск GPT-4.5 є дорогим. Компанія оцінює можливість обмеженого доступу до моделі через API, оскільки її обчислювальна вартість є надзвичайно високою. Для доступу до API GPT-4.5 OpenAI встановила ціну $75 за мільйон вхідних токенів (близько 750 000 слів) та $150 за мільйон вихідних токенів. Для порівняння, GPT-4o коштує лише $2.50 за мільйон вхідних токенів і $10 за мільйон вихідних.

Продуктивність: плюси та мінуси

OpenAI підкреслює, що GPT-4.5 не призначена для заміни GPT-4o – основної моделі компанії, яка використовується в API та ChatGPT. Хоча GPT-4.5 підтримує завантаження файлів і зображень, а також функцію canvas у ChatGPT, вона поки що не має двостороннього голосового режиму, який є у GPT-4o.

Проте, за низкою параметрів GPT-4.5 демонструє кращу продуктивність:

  • На тесті SimpleQA, що перевіряє здатність ШІ відповідати на прості фактичні запитання, GPT-4.5 перевершує GPT-4o та моделі OpenAI o1 та o3-mini.

  • GPT-4.5 рідше генерує недостовірну інформацію, що робить його більш надійним для отримання фактологічних відповідей.

На інших тестах результати змішані:

  • У розв’язанні програмних задач GPT-4.5 поступається передовим логічним моделям Anthropic Claude 3.7 Sonnet та OpenAI deep research.

  • На академічних тестах, таких як AIME та GPQA, GPT-4.5 не перевершує провідні логічні моделі (наприклад, DeepSeek’s R1 і Claude 3.7 Sonnet), але перевершує більшість моделей без логічного мислення.

OpenAI також стверджує, що GPT-4.5 має кращу якість роботи в завданнях, які важко оцінити стандартними тестами. Наприклад, модель здатна генерувати більш природні та емоційно інтелектуальні відповіді. В одному з експериментів GPT-4.5 єдиний зміг правильно створити SVG-зображення єдинорога, тоді як його конкуренти не впоралися із завданням.

Виклики масштабування ШІ

OpenAI визнає, що GPT-4.5 знаходиться на межі можливостей традиційного навчання. Один із засновників компанії Ілля Суцкевер ще у грудні заявив, що "ми досягли піку обсягів даних" і що "попереднє навчання, яким ми його знаємо, добігає кінця". Це підтверджує побоювання багатьох дослідників, що просте масштабування більше не буде приносити суттєві покращення.

Через ці обмеження OpenAI та інші компанії зараз активно працюють над логічними моделями, які використовують більше часу та обчислювальної потужності для вирішення завдань, але натомість показують вищу стабільність. OpenAI планує об'єднати серію GPT-моделей із серією "o" (логічні моделі) у GPT-5, який має з'явитися пізніше цього року.

Попри високі витрати та неоднозначні результати тестів, GPT-4.5 все ж є важливим кроком до створення ще потужнішої моделі. OpenAI розглядає її як трамплін до GPT-5, який може стати справжнім проривом у розвитку штучного інтелекту.

Авторка: Дар’я Бровченко

Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.