Google формує нову команду для роботи над ШІ-моделями, здатними імітувати фізичний світ.
Тім Брукс — один з керівників проекту відеогенератора OpenAI, Sora, який приєднався до дослідницької лабораторії Google DeepMind у жовтні, оголосив, що він очолить нову команду. Про це він повідомив у пості на платформі X. Команда буде частиною Google DeepMind.
«DeepMind має амбітні плани створювати масштабні генеративні моделі, що імітують реальний світ», — написав Брукс вранці в понеділок. «Я набираю команду для виконання цієї місії».
Згідно з оголошеннями про набір на роботу, на які Брукс посилається в своєму пості, нова команда з моделювання працюватиме у співпраці з командами Gemini, Veo та Genie Google для вирішення «нових критичних завдань» та масштабування моделей до «найвищих рівнів обчислювальних потужностей». Gemini — це серія флагманських моделей ШІ від Google для таких завдань, як аналіз зображень та генерація тексту, в той час як Veo є моделлю для генерації відео від Google.
Що стосується Genie, то це підхід Google до створення світових моделей — ШІ, який може в реальному часі імітувати ігри та 3D-середовища. Остання модель Genie, представлена в грудні, здатна генерувати величезну кількість ігрових 3D-світів.
«Ми віримо, що масштабування [навчання ШІ] на відео та мультимодальних даних є критичним шляхом до штучного загального інтелекту», — йдеться в одному з описів вакансій. Штучний загальний інтелект (ШЗІ) зазвичай означає ШІ, здатний виконувати будь-які завдання, які може виконати людина. «Світові моделі будуть використовуватися в багатьох сферах, таких як візуальне міркування та симуляції, планування для втілених агентів та інтерактивні розваги в реальному часі».
Чому світові моделі важливі для майбутнього медіа та розваг
Безліч стартапів і великих технологічних компаній активно працюють над створенням світових моделей, серед яких дослідницька ініціатива Fei-Fei Lee «World Labs», ізраїльський стартап Decart та Odyssey. Вони вірять, що світові моделі можуть в майбутньому стати основою для створення інтерактивних медіа, таких як відеоігри та фільми, а також для запуску реалістичних симуляцій, наприклад, навчальних середовищ для роботів.
Однак думки творчих професіоналів щодо цієї технології розділилися.
Нещодавнє розслідування Wired виявило, що ігрові студії, такі як Activision Blizzard, які скоротили чисельність працівників, використовують ШІ для спрощення робочих процесів, підвищення продуктивності та компенсації за втрати кадрів. А дослідження 2024 року, проведене за замовленням Animation Guild, профспілки голлівудських аніматорів і карикатуристів, оцінює, що до 2026 року більше 100 000 робочих місць у галузі кіно, телебачення та анімації в США можуть бути під загрозою через ШІ.
Деякі стартапи у галузі світових моделей, такі як Odyssey, обіцяють співпрацювати з творчими професіоналами, а не замінювати їх. Чи піде Google цим шляхом — стане відомо з часом.
Питання авторських прав і майбутнє моделювання
Існує також не вирішене питання авторських прав. Деякі світові моделі, ймовірно, навчаються на уривках з відеоігрових прохідних матеріалів, що може зробити компанії, що розробляють ці моделі, мішенню для позовів у разі, якщо відео не були ліцензовані.
Google, який є власником YouTube, стверджує, що має дозвіл на використання відео з YouTube для навчання своїх моделей згідно з умовами користування платформою. Однак компанія не розкриває, які саме відео використовуються для навчання.
Автор: Дар'я Бровченко
Немає коментарів:
Дописати коментар
Примітка: лише член цього блогу може опублікувати коментар.