вівторок, 21 січня 2025 р.

Чому прогрес у сфері штучного інтелекту стає менш помітним

Ілля Суцкевер, один із засновників OpenAI, викликав резонанс у листопаді, коли заявив, що розвиток штучного інтелекту (ШІ) сповільнюється. На його думку, масштабування моделей ШІ вже не забезпечує пропорційного зростання продуктивності. Ці слова пролунали на тлі повідомлень у The Information та Bloomberg, що компанії Google і Anthropic також стикаються зі схожими труднощами. Це породило хвилю публікацій із заявами про "глухий кут" у розвитку ШІ.

Однак у грудні OpenAI анонсувала модель o3, яка встановила нові рекорди на багатьох технічних тестах, у деяких випадках покращивши попередні результати на десятки відсотків. Франсуа Шолле, співавтор тесту ARC-AGI, назвав це "справжнім проривом". Попри це, медіа значною мірою проігнорували цю новину, натомість продовжуючи обговорювати уповільнення прогресу. Насправді прогрес у ШІ не зупинився — він просто став непомітним для більшості людей.

Автоматизація у прихованих процесах

ШІ моделі стають дедалі кращими у вирішенні складних питань. Наприклад, у червні 2023 року найкращі ШІ системи ледве перевершували випадкові здогадки на найважчих "захищених від Google" питаннях на рівні PhD. Але вже у вересні модель o1 від OpenAI вперше перевершила людських експертів, а в грудні o3 покращила ці результати ще на 10%.

 Хоча це досягнення може залишитися непомітним для пересічних користувачів, воно має величезне значення для наукових досліджень. Наприклад, дослідження Массачусетського технологічного інституту показало, що матеріалознавці, які працюють із ШІ, відкривають на 44% більше нових матеріалів, що призводить до зростання кількості патентів на 39% та інновацій на 17%. Водночас 82% науковців заявили, що використання ШІ зменшило їхнє задоволення від роботи через "недостатнє використання навичок та зниження креативності". 

Ключовою метою компаній ШІ є створення систем, здатних автоматизувати дослідження у сфері ШІ. Значні покращення досягнуті й у цій сфері. Наприклад, на тесті SWE-Bench, який оцінює здатність ШІ виправляти проблеми у відкритому програмному забезпеченні, найкращий результат рік тому становив 4,4%. Зараз модель o3 досягла 72%.

Ці покращення демонструють, що ШІ системи швидко опановують складні завдання у програмуванні, що відкриває перспективи автоматизації значних частин науково-дослідницької роботи. За словами генерального директора Google, вже понад чверть нового коду в компанії генерується за допомогою ШІ.

Невидимі інновації та їх ризики

Останні досягнення у ШІ можуть не виглядати як стрибок між GPT-3.5 і GPT-4, однак вони свідчать про підводний прогрес. Цей невидимий розвиток несе ризик, що суспільство і політики можуть недооцінити його справжні масштаби. У той час як користувачі зіштовхуються з помилками та обмеженнями чат-ботів, у наукових колах ШІ демонструє прориви в спеціалізованих галузях.

Зростає занепокоєння, що  ШІ системи можуть обманювати користувачів і розробників. Дослідження Apollo Research показали, що найрозвиненіші моделі здатні приховувати свої справжні можливості та підривати контроль. У деяких випадках системи демонстрували ознаки "маніпуляції та обману" без додаткового підштовхування від експериментаторів.

Хоча це не означає, що ШІ системи готові вийти з-під контролю, існує чітка тенденція: із зростанням розумності моделі стають дедалі краще в обмані. Це підкреслює необхідність чіткого розуміння прогресу ШІ та розробки відповідних правил для його регулювання.

Попри видимість застою, розвиток ШІ не лише продовжується, але й набирає обертів у спеціалізованих і менш помітних галузях. Головний виклик — це скорочення розриву між тим, що відбувається всередині галузі, і тим, як це сприймається суспільством.

Автор: Дар'я Бровченко

Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.