понеділок, 17 березня 2025 р.

Андрій Карпаті передбачає, що 99,9% контенту в майбутньому буде оптимізовано для ШІ, а не для людей

Експерт з ШІ Андрій Карпаті передбачає, що в майбутньому 99,9% контенту буде оптимізовано для ШІ, а не для людей. Андрій Карпаті, колишній дослідник OpenAI, вважає, що великі мовні моделі (LLM) стануть основним інтерфейсом для контенту.

У нещодавньому дописі на платформі X він вказує, що хоча більшість контенту й надалі буде створюватися для людей, 99,9% зусиль із оптимізації буде спрямовано на те, щоб зробити контент зрозумілим саме для LLM, а не для людських читачів. Це може кардинально змінити спосіб структуризації документації та іншого контенту.

Карпаті зазначає, що сучасні практики створення документації є прикладом цього процесу: "99% бібліотек досі мають документи, які насправді рендеряться у вигляді статичних .html-сторінок, припускаючи, що людина їх переглядатиме."

До 2025 року, на його думку, документація має бути зібрана в єдиний файл проекту, оптимізований для контекстного вікна LLM. Карпаті підкреслює, що, хоча об'єднання кодових баз у єдині файли технічно є простим, справжня проблема полягає у форматах, що зберігають контент для людей, таких як вебсайти, PDF, зображення, відео та аудіофайли. Ці формати "перед-LLM ери" ускладнюють оптимізацію для ШІ.

За словами Карпаті, індустрія потребує нових стандартів, які б працювали однаково добре для споживання як людьми, так і машинами. Один із нових стандартів для вебу, запропонований як llms.txt, відповідає баченням Карпаті щодо структури контенту, оптимізованої для ШІ. Розроблений Джеремі Говардом, цей стандарт працює подібно до index.html, але для ШІ-систем. В той час як index.html направляє користувачів до HTML-версії сторінки, llms.txt буде вказувати ШІ-системам на машинно-зчитувану версію Markdown (.md).

Цей подвійний підхід дозволяє вебсайтам підтримувати як версії, що читаються людьми, так і оптимізовані для ШІ. Компанії, такі як Anthropic, вже реалізували цей стандарт. Ці зміни мають значно ширші наслідки, ніж лише технічні.

Сучасна цифрова економіка контенту працює на увазі людей — через рекламу та підписки. Тепер індустрія стикається з викликом повного переосмислення своїх ланцюгів створення вартості та моделей доходів, оскільки контент переміщується до споживання через ШІ. Компанії ШІ вже почали ліцензувати потоки новин в реальному часі, що також піднімає серйозні питання. Коли компанії, такі як OpenAI, вирішують, який контент бачать їх ШІ-системи, вони фактично стають потужними воротарями інформації.

Це зміщення загрожує кардинально змінити спосіб, у який люди знаходять і споживають онлайн-контент, піднімаючи серйозні питання про те, хто контролює наш доступ до інформації. Ставки ще вищі, враховуючи, що LLM все ще часто роблять помилки при обробці та відтворенні інформації. Андрій Карпаті передбачає, що в майбутньому контент буде переважно створюватися для ШІ-систем, а не для людських читачів. Карпаті вказує, що поточні формати контенту, такі як вебсайти, PDF та відео, не підходять для ШІ. Для цього можуть бути розроблені нові стандарти та формати, щоб зробити контент більш дружнім до ШІ. Це також вимагає розробки нових моделей компенсації та ліцензування, оскільки існуючі бізнес-моделі залежать від безпосереднього споживання контенту людьми.

Авторка: Дар’я Бровченко

Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.