Нова система штучного інтелекту (ШІ) досягла результатів, схожих на людську інтелігентність, у тесті, який вимірює загальну інтелігентність.20 грудня система o3 від OpenAI набрала 85% за тест ARC-AGI, що значно перевищує попередній рекорд ШІ — 55% і дорівнює середньому людському результату. Вона також показала хороші результати на дуже складному математичному тесті. Створення штучного загального інтелекту (AGI) — це мета багатьох лабораторій, що займаються ШІ. На перший погляд, OpenAI зробила важливий крок до цієї мети. Хоча є певний скептицизм, багато дослідників ШІ відчувають, що щось змінилося. Тепер ідея створення AGI здається більш реальною і набагато ближчою, ніж раніше. Чи мають вони рацію?
Адаптація ШІ
Щоб зрозуміти, що означає результат o3, потрібно знати, що таке тест ARC-AGI. Це тест, який вимірює, як добре ШІ може адаптуватися до нових ситуацій, бачивши лише кілька прикладів.Система ШІ, як-от ChatGPT (GPT-4), не дуже добре справляється з таким завданням. Вона була навчена на величезній кількості текстів, але погано справляється з рідкісними завданнями, оскільки має мало даних про них. Щоб ШІ став корисним у багатьох різних ситуаціях, йому потрібно вміти вчитися на малих кількостях прикладів. Це і є здатність до узагальнення — важливий аспект інтелігентності.
Як працює тест ARC-AGI
Тест ARC-AGI складається з простих задач, де ШІ потрібно знайти патерн або правило, що перетворює одну сітку в іншу. Для кожного завдання є три приклади, з яких ШІ має зрозуміти правило для наступного прикладу. Це нагадує IQ-тести, які ми робили в школі.
Як o3 знаходить рішення
Неясно, як саме OpenAI досягла таких результатів, але здається, що система o3 може швидко адаптуватися, знаходячи прості рішення для нових ситуацій. Щоб знайти правильне рішення, не потрібно робити зайвих припущень або бути надто точним. Якщо знайти найпростіші рішення, це дозволяє легше адаптуватися до нових завдань.
Пошук ланцюгів думокЯк саме працює o3, поки не зовсім зрозуміло. Але, ймовірно, вона шукає різні шляхи для вирішення завдань і вибирає найкращий варіант, схожий на те, як працювала система AlphaGo від Google в грі Go.
Що ми ще не знаємоОсновне питання: чи це справді крок до AGI? Якщо система o3 працює так, як ми думаємо, то, можливо, її модель не набагато краща за попередні. Зараз майже все про o3 невідомо. OpenAI показала лише частину результатів і дозволила тестувати систему кількома дослідникам. Щоб зрозуміти, на що здатна o3, потрібно провести більше тестів і аналізів. Коли систему випустять для загального користування, ми зможемо точно сказати, чи вона адаптована так само добре, як людина. Якщо так, o3 може мати величезний вплив на економіку і змінити способи, яким ми працюємо. Нам доведеться створити нові стандарти для AGI та розглянути, як регулювати таку технологію. Якщо ні, то це все одно буде великий досягненням, але повсякденне життя, ймовірно, не значно зміниться.
Автор: Дар'я Бровченко
Немає коментарів:
Дописати коментар
Примітка: лише член цього блогу може опублікувати коментар.