четвер, 17 квітня 2025 р.

Нові інструменти Google: штучний інтелект перетворює текст і зображення на відео

Починаючи з 15 квітня 2025 року, користувачі розширеної версії Gemini отримали можливість створювати та поширювати відео за допомогою новітньої моделі генеративного відео Veo 2. Тепер у додатку Gemini можна перетворити текстовий запит у динамічний відеокліп. Крім того, Google Labs впроваджує Veo 2 і в інструмент Whisk — це експериментальна розробка, яка дозволяє створювати нові зображення за допомогою текстових або візуальних запитів, а відтепер — ще й анімувати їх у відеоформат.

Як працює генерація відео в Gemini

Veo 2 — це суттєвий крок уперед у сфері відеогенерації. Модель здатна створювати відео високої якості з реалістичним кінематографічним виглядом. Вона краще розуміє фізику навколишнього світу, рухи людини, забезпечуючи плавність рухів, живі сцени та деталізацію, яка охоплює широкий спектр сюжетів і стилів.

Для створення відео в Gemini достатньо обрати модель Veo 2 у відповідному меню. Кожен запит генерує 8-секундне відео у форматі 720p (MP4, горизонтальна орієнтація 16:9). Користувачам доступна обмежена кількість відео щомісяця, і сервіс повідомляє, коли ліміт наближається.

Сам процес дуже простий: потрібно лише описати сцену, яку хочеться побачити. Це може бути коротка історія, ідея, візуальний задум чи окрема сцена. Чим точнішим буде опис, тим більш контрольованим вийде результат. Такий підхід відкриває великі творчі можливості — можна уявити фантастичні сюжети, поєднувати стилі від реалізму до казкових візій, або швидко візуалізувати короткі ідеї.

Поділитися результатом — також просто. На мобільних пристроях є кнопка "поділитися", яка дозволяє миттєво завантажити відео у TikTok або YouTube Shorts.

Приклади запитів, що вже були використані:

  • Анімована сцена маленької миші з великими окулярами, яка читає книгу при світлі світлячка в затишному лісовому барлозі.

  • Аерозйомка скелястого узбережжя: хвилі розбиваються об берег, поруч піднімається морська скеля, усе залите теплим золотим світлом заходу або сходу сонця. Камера фіксує спокійну красу Тихоокеанського узбережжя.

  • Таймлапс розтопленняморозива під чистим синім небом. Рожеві, сірі та білі кульки поступово втрачають форму, стікаючи вниз по жовтому ріжку, який тримає велика рука в синьому рукаві. Основна увага — на текстурі та зміні форми, яка створює яскраву піксельну картину на фоні насиченого неба.

Функція генерації відео поступово стає доступною користувачам Gemini Advanced у всьому світі — як у вебверсії, так і на мобільних пристроях. Вона підтримується для всіх мов, якими користується Gemini, і доступна лише для передплатників Google One AI Premium.

Спробувати можливості можна вже зараз на сайті gemini.google.com.

Whisk Animate: «оживлення» зображень

Whisk — це експериментальний інструмент Google Labs, який з'явився у грудні минулого року. Він дозволяє швидко створювати нові ідеї з допомогою текстових і візуальних підказок. Тепер до нього додали функцію Whisk Animate — вона перетворює створені зображення на яскраві 8-секундні відео, використовуючи модель Veo 2.

Функція вже доступна для користувачів Google One AI Premium у понад 60 країнах світу. Спробувати її можна на labs.google/whisk.

Про безпеку

Google повідомляє, що приділила значну увагу безпеці. Перед запуском функції проводились масштабні перевірки (так зване "red teaming") з метою недопущення створення контенту, що порушує політики компанії. Усі відео, згенеровані за допомогою Veo 2, мають вбудований цифровий водяний знак SynthID — маркер, який вказує, що відео створене ШІ.

Компанія наголошує, що результати генерації залежать від вхідних запитів, і в деяких випадках контент може бути сприйнятий неоднозначно. Google обіцяє дослухатися до зворотного зв’язку та вдосконалювати інструмент.



Авторка: Дар’я Бровченко


Джерело

Немає коментарів:

Дописати коментар

Примітка: лише член цього блогу може опублікувати коментар.