пʼятниця, 7 березня 2025 р.

Песимістичний сценарій: прогнози щодо розвитку ШІ

Цей прогноз не є точним "тімлайном", оскільки конкретні терміни невідомі. Однак це оптимістичний огляд напрямку розвитку, в якому відбуваються основні зміни. Хоча неможливо точно передбачити майбутнє, очікується, що в найближчому році з'являться нові агенти та розширення. На даний момент моделі, такі як Deep Research, Claude 3.7, Claude Code, Grok 3 та GPT-4.5, переважно відповідають тим очікуванням, які були зроблені раніше.

Не очікується, що хоч один з відомих шляхів розвитку штучного інтелекту призведе до створення штучного загального інтелекту (AGI) у найближчому майбутньому.

Хоча процес навчання моделей не можна вважати повністю зупиненим, прогнозується подальший розвиток, але він буде відбуватися в нових напрямках. Цей прогрес, однак, не буде пов'язаний із стандартним метром "загального інтелекту" і зіткнеться з серйозними обмеженнями.

Моделі Grok 3 і GPT-4.5 в основному відповідають очікуванням: Grok 3 отримав позитивні відгуки, зокрема за те, що "доволі добре справляється, навіть перевершуючи Claude Sonnet 3.5.1 у деяких випадках". Однак це більше похвала за те, що модель зберегла рівень попередніх версій, без суттєвих проривів.

GPT-4.5 є покращенням порівняно з GPT-4, зокрема в написанні текстів і емоційному інтелекті, але ці покращення є незначними. Як і очікувалося, ця модель не відповідає великим сподіванням OpenAI, і її випуск затримали через відсутність значних проривів.

GPT-5, ймовірно, буде лише незначним покращенням порівняно з GPT-4.5, і схожа ситуація чекає і на GPT-5.5 та GPT-6, які тренуватимуть до 2029 року (якщо буде достатнє фінансування). Очікується, що ці моделі принесуть лише дрібні покращення, але не змінять загальну парадигму розвитку.

Щодо часового оброблення і Reinforcement Learning (RL) на моделях LLM, наразі немає очікувань, що ці підходи дозволять значно вийти за межі існуючих можливостей. Можливо, такі стратегії, як RLAIF або довші ланцюги міркувань (CoT), можуть дати певні переваги, але вони не призведуть до значного прориву. Тому покращення в цих напрямках навряд чи призведе до значного стрибка в розумових здібностях чи здатності вирішувати складні задачі.

Збільшення обсягу контексту до мільйонів токенів не матиме великого впливу в реальному житті. Одна з проблем, яка може бути вирішена до кінця 2025 року, — це FrontierMath, але є сумніви щодо цього.

Що стосується поширених вражень, що "моделі стали розумнішими", це часто викликано тим, що на моделях з'являються більш приємні особистісні характеристики. Тобто враження про їхню "розумність" часто залежить від того, як сприймаються результати їхньої роботи, а не від справжніх покращень самих моделей.

Моделі LLM досягли успіхів у виконанні завдань, які пов'язані з інтерпретацією або з використанням даних, знайомих із навчальної вибірки. Коли можна налаштувати інтерпретацію їхніх відповідей, вони виглядають дуже розумними. Однак, якщо модель залишити без направлення, вона не зможе вибрати правильне рішення, як це робить людина.

Прогноз для реального світу: малоймовірно, що "бульбашка" LLM лусне у 2025 або 2026 році. Компанії все ще мають достатньо фінансів, щоб підтримувати інтерес до цих технологій, оскільки це важливо для залучення інвестицій. Вони, ймовірно, продовжуватимуть підтримувати хайп, поки це буде працювати.

Незабаром LLM стануть корисними інструментами, особливо в біотехнологічних галузях, але навряд чи вони стануть автономними агентами або приведуть до створення штучного загального інтелекту.

Підсумовуючи, хоч багато людей хоче, щоб LLM стали набагато потужнішими, ніж вони є насправді, це лише спроби знайти нові способи виправлення їхніх обмежень. Однак насправді ці моделі не мають глибокого інтелекту чи автономії.

Авторка: Дар’я Бровченко



Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.