Google Gemini научился редактировать изображения с помощью голоса

Редактирование голосом — Google Gemini научился изменять изображения
Приложения Google Gemini на экране смартфона. Фото: Unsplash

Google разворачивает в своем приложении и на сайте Gemini инструмент искусственного интеллекта, позволяющий изменять любое изображение с помощью обычных текстовых подсказок. Функция, которая ранее была доступна только в Google AI Studio, теперь станет частью Gemini для всех пользователей и уже поддерживает 45 языков. Достаточно обратиться к чат-боту, чтобы мгновенно откорректировать снимок или созданную ИИ-картинку.

Об этом пишет Lifehacker.

Реклама
Читайте также:

Как работает новый инструмент и какие вызовы он несет

Самой привлекательной особенностью новинки является снижение порога входа в мир редактирования фото. Пользователь может завести диалог с чат-ботом Gemini: попросить его создать изображение с нуля или загрузить собственный кадр и дать команду, например, "измените фон" или "добавьте шляпу собаке". По принципу это напоминает функцию Reimagine на смартфонах Pixel, где объекты можно "дорисовать" на реальных фото.

С помощью Gemini можно перемещать и заменять предметы, редактировать задний план или добавлять новые элементы с нуля. В блоге, посвященном запуску, Google приводит пример: достаточно подгрузить собственное селфи и попросить ИИ "перекрасить волосы", чтобы увидеть, как вы будете выглядеть после эксперимента с цветом. Сервис помнит предыдущие запросы, поэтому менять одно и то же изображение можно в несколько этапов, ведя обычный разговор. Кроме того, пользователи смогут придумывать истории и сразу создавать иллюстрации к ним в том же чате.

В то же время инструмент поднимает знакомые этические вопросы, ведь поддельные изображения могут нанести ущерб репутации людей или бизнеса. Чтобы минимизировать риски, Google встроит во все ИИ-сгенерированные картинки невидимый водяной знак и уже тестирует добавление еще и видимой маркировки, которая облегчит идентификацию отредактированных снимков в сети.

Напомним, Google представила три экспериментальные функции на базе Gemini. Их цель — сделать изучение иностранных языков более динамичным и адаптированным к потребностям пользователей.

Также мы писали, что Google сделала возможности совместного доступа к экрану и камере смартфона в Gemini Live бесплатными. Каждый владелец Android-устройства может в реальном времени показывать чат-боту все, что происходит на дисплее или перед объективом камеры.

Google искусственный интеллект чат-бот функции Google Gemini
Реклама
Реклама
Реклама
Реклама