Новый ИИ для роботов — Google представил Gemini Robotics
Команда разработчиков Google DeepMind постоянно развивает отрасль искусственного интеллекта, обновляя модели Gemini, Imagen, Veo, Gemma и AlphaFold. На этой неделе компания также вышла на рынок робототехники, представив Gemini Robotics.
Об этом пишет Neowin.
Что известно о модели Gemini Robotics от Google
Gemini Robotics является усовершенствованной моделью "зрение-речь-действие" (Voice-Language-Action) и базируется на искусственном интеллекте Gemini 2.0, что позволяет управлять роботами, совершая физические действия. В Google утверждают, что модель может понимать ситуации, с которыми она ранее не сталкивалась во время обучения.
Новая модель вдвое лучше выполняет комплексный тест на обобщение по сравнению с другими самыми современными моделями на рынке. Учитывая то, что Gemini Robotics имеет возможности понимания естественной речи на разных языках, роботы могут понимать команды людей гораздо лучше.
В Google говорят, что новая модель может выполнять сложные и многоэтапные задачи, требующие точных манипуляций. Например, она может сложить оригами или положить закуску в пакет с замком зип-лок.
Также Google представила модель Gemini Robotics-ER, которая фокусируется на пространственном мышлении и позволяет экспертам по робототехнике подключать ее к существующим низкоуровневым контроллерам. Благодаря этой модели управлять роботом можно прямо из коробки.
Для создания гуманоидных роботов Google сотрудничает с Apptronik.
Напомним, искусственный интеллект Gemini доступен всем пользователям современных устройств. Чат-бот имеет мощные функции, которые могут улучшить жизнь.
Также мы писали, что пользователи iPhone получили возможность общаться с Google Gemini с экрана блокировки. Google добавила виджет Gemini Live с новым обновлением чат-бота для iOS.
Читайте Новини.LIVE!