Google Gemini навчився редагувати зображення за допомогою голосу
Google розгортає у своєму застосунку та на сайті Gemini інструмент штучного інтелекту, що дозволяє змінювати будь-яке зображення за допомогою звичайних текстових підказок. Функція, яка раніше була доступна лише в Google AI Studio, тепер стане частиною Gemini для всіх користувачів і вже підтримує 45 мов. Достатньо звернутися до чатбота, щоб миттєво відкоригувати знімок чи створену ШІ-картинку.
Про це пише Lifehacker.
Як працює новий інструмент та які виклики він несе
Найпривабливішою особливістю новинки є зниження порогу входу у світ редагування фото. Користувач може завести діалог із чатботом Gemini: попросити його створити зображення з нуля або завантажити власний кадр і дати команду, наприклад, "змініть тло" чи "додайте капелюх собаці". За принципом це нагадує функцію Reimagine на смартфонах Pixel, де об'єкти можна "домалювати" на реальних фото.
За допомогою Gemini можна переміщувати та замінювати предмети, редагувати задній план чи додавати нові елементи з нуля. У блозі, присвяченому запуску, Google наводить приклад: достатньо підвантажити власне селфі та попросити ШІ "перефарбувати волосся", щоб побачити, який вигляд ви матимете після експерименту з кольором. Сервіс пам'ятає попередні запити, тож змінювати одне й те саме зображення можна в кілька етапів, ведучи звичайну розмову. Крім того, користувачі зможуть вигадувати історії та одразу створювати ілюстрації до них у тому ж чаті.
Водночас інструмент порушує знайомі етичні питання, адже підроблені зображення можуть завдати шкоди репутації людей або бізнесу. Щоб мінімізувати ризики, Google вбудує у всі ШІ‑згенеровані картинки невидимий водяний знак і вже тестує додавання ще й видимого маркування, яке полегшить ідентифікацію відредагованих знімків у мережі.
Нагадаємо, Google представила три експериментальні функції на базі Gemini. Вони мають на меті зробити вивчення іноземних мов більш динамічним та адаптованим до потреб користувачів.
Також ми писали, що Google зробила можливості спільного доступу до екрана й камери смартфона в Gemini Live безплатними. Кожен власник Android-пристрою може в реальному часі показувати чатботу все, що відбувається на дисплеї або перед об'єктивом камери.
Читайте Новини.LIVE!