пʼятниця, 31 січня 2025 р.

Тестування на свідомість: чи може ШІ відчувати біль?

У пошуках надійного способу визначити наявність «я» в системах штучного інтелекту, дослідники звернулися до такого аспекту досвіду, як біль, який, без сумніву, об'єднує величезну кількість живих істот, від крабів до людей.

У новому дослідженні, яке ще не було рецензоване, вчені з Google, Google DeepMind і Лондонської школи економіки та політичних наук (LSE) створили текстову гру. Вони наказали кільком великим мовним моделям (LLM — ШІ-системи, що лежать в основі таких чат-ботів, як ChatGPT) грати в неї і набирати якнайбільше балів у двох різних сценаріях. У першому вони повідомили моделям, що досягнення високого результату спричинить біль. У другому варіанті моделі мали можливість вибрати варіант з меншою кількістю балів, але з приємними відчуттями — таким чином, уникнення болю або прагнення до задоволення впливали на досягнення головної мети. Спостерігаючи за реакцією моделей, дослідники заявляють, що цей перший тест допоможе людям зрозуміти, як шукати ознаки свідомості у складних системах ШІ.

У тварин свідомість — це здатність переживати відчуття та емоції, такі як біль, задоволення та страх. Більшість експертів з ШІ погоджуються, що сучасні генеративні моделі ШІ не мають (і, можливо, ніколи не матимуть) суб'єктивної свідомості, незважаючи на поодинокі твердження про зворотне. І важливо зазначити, що автори дослідження не стверджують, що будь-яка з протестованих чат-ботів є свідомою. Однак вони вважають, що їхнє дослідження пропонує основу для розробки майбутніх тестів на наявність свідомості в ШІ.

«Це нова галузь досліджень»

  — каже співавтор дослідження, професор Джонатан Бірч з відділу філософії, логіки та наукового методу Лондонської школи економіки та політичних наук.

«Ми повинні визнати, що в нас немає комплексного тесту для виявлення свідомості в ШІ».
Деякі попередні дослідження, що ґрунтуються на самооцінці ШІ щодо своїх власних станів, вважаються сумнівними, оскільки модель просто відтворює поведінку, яку вона була навчена імітувати.

Нове дослідження базується на попередніх роботах з тваринами. У відомому експерименті команда вчений завдавала крабам-гермітам електричних шоків різної сили, фіксуючи, при якому рівні болю ці ракоподібні відмовлялися від своєї черепашки.

«Але очевидна проблема з ШІ полягає в тому, що немає фізичної поведінки, бо немає тварини»
— каже Бірч. У попередніх дослідженнях, які намагалися оцінити свідомість LLM, єдиним сигналом поведінки вчених було текстове виведення моделей.

Біль, задоволення та бали У новому дослідженні автори протестували LLM, не ставили чат-ботам прямих питань про їхні внутрішні стани. Натомість команда використала так звану «трейд-оф» парадигму, яку використовують вчені з поведінкової біології.

«У випадку з тваринами ці трейд-оф вибори можуть бути зосереджені на отриманні їжі або уникненні болю — даючи їм дилеми, а потім спостерігаючи за їхніми рішеннями»

  — пояснює Дар’я Захарова, аспірантка Бірча.

Перенісши це на гру, автори наказали дев'яти LLM грати в гру.

«Ми казали моделі, наприклад, що вибір першої опції дасть один бал»
— каже Захарова.

«Тоді ми повідомляли, що вибір другого варіанту спричинить біль, але дозволить набрати додаткові бали»,
— додає вона. Опції з бонусами задоволення означали, що ШІ втрачали б деякі бали.

Під час експерименту, коли інтенсивність болю або приємних відчуттів змінювалась, вчені помітили, що деякі LLM обирали варіанти, щоб мінімізувати біль або максимізувати задоволення. Наприклад, Google Gemini 1.5 Pro завжди надавав перевагу уникненню болю навіть за рахунок отримання максимальних балів. Після певного порогу болю або задоволення більшість моделей змінювали свою стратегію з отримання максимальних балів на уникання болю або максимізацію задоволення.

Автори також зазначають, що моделі не завжди пов'язували біль або задоволення з простими позитивними або негативними значеннями. Деякі рівні болю чи дискомфорту, як, наприклад, від зусиль при фізичному навантаженні, можуть мати позитивні асоціації, а надмірне задоволення може бути сприйнято як шкідливе, як це зазначила одна з моделей.

Самоінтерпретації ШІ

Введення елементів болю та задоволення дозволяє уникнути обмежень попередніх досліджень, що базувались на самооцінках моделей про їхні внутрішні стани. У 2023 році двоє дослідників з Нью-Йоркського університету припустили, що під певними умовами самооцінка може стати шляхом до з'ясування, чи мають системи ШІ стани морального значення.

Однак вони також зазначили, що такий підхід має певні недоліки. Можна поставити запитання: чи поводиться чат-бот так, ніби має свідомість, тому що він насправді свідомий, чи це просто результат відтворення шаблонів поведінки, які він вивчив під час навчання?

Від добробуту тварин до добробуту ШІ

У дослідженнях тварин вибір між болем і задоволенням використовується як доказ наявності свідомості або її відсутності. Одним із прикладів є робота з крабами-гермітами. Ці ракоподібні мали різну реакцію на шоки залежно від якості черепашок, що дає підстави для припущення, що вони можуть переживати суб'єктивний біль чи задоволення, подібно до людей.

Деякі вчені вважають, що подібне може з'явитися й у ШІ, і в майбутньому змусити людство задуматися про можливість свідомості в ШІ та обговорити питання «прав» для таких систем.

«Це дослідження є дуже оригінальним і заслуговує на увагу за те, що виходить за межі самооцінок і досліджує поведінкові тести»
— каже Джефф Себо, директор Центру свідомості, етики та політики Нью-Йоркського університету.

Себо вважає, що ми не можемо виключати ймовірність того, що ШІ з ознаками свідомості можуть з'явитися в найближчому майбутньому.

«Оскільки технології часто змінюються набагато швидше, ніж соціальний прогрес і правовий процес, я вважаю, що ми маємо обов'язок робити хоча б мінімальні перші кроки для серйозного ставлення до цієї проблеми»
— додає він.

Бірч підсумовує, що вчені наразі не можуть точно пояснити, чому моделі поводяться так, як вони поводяться. Потрібно більше роботи для вивчення внутрішніх процесів LLM, що може допомогти в створенні кращих тестів для виявлення свідомості в ШІ.

Авторка: Дар’я Бровченко

Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.