OpenAI выпустила ИИ-агента, который сможет заказывать еду за вас
В четверг, 23 января, OpenAI анонсировала выпуск нового инструмента Operator — агента, который способен выполнять задачи в интернете вместо пользователя. Этот агент может самостоятельно открывать браузер, взаимодействовать с веб-страницами, нажимать кнопки, заполнять формы, прокручивать страницы и даже создавать мемы. Сейчас он доступен в США для пользователей с подпиской Pro в виде предварительного исследования.
Об этом говорится на сайте OpenAI.
Как работает Operator
Operator использует новую модель Computer-Using Agent (CUA), сочетающую возможности GPT-4o в распознавании изображений и высокоуровневое логическое мышление. Благодаря этому инструмент может "видеть" веб-страницы через скриншоты и "взаимодействовать" с ними, используя возможности клавиатуры и мыши.
Если агент наталкивается на трудности, он способен анализировать свои действия и исправлять ошибки. В случае сложных задач, например авторизации или ввода платежных данных, Operator обращается за помощью к пользователю.
Operator может выполнять ряд рутинных задач:
- заполнение форм;
- заказ продуктов;
- персонализация запросов, например, настройка параметров авиаперелетов;
- выполнение нескольких задач одновременно — от бронирования кемпинга до заказа товаров на Etsy.
Пользователи могут задавать индивидуальные инструкции для выполнения определенных задач или сохранять повторяющиеся запросы для быстрого доступа.
Operator призван упростить взаимодействие с цифровыми сервисами для обычных пользователей и компаний. Уже сейчас команда разработчиков сотрудничает с такими компаниями, как:
- DoorDash;
- Instacart;
- OpenTable;
- Priceline;
- Uber и другими.
Цель — повысить удобство и эффективность сервисов для пользователей и бизнеса.
Кроме коммерческого применения, Operator открывает новые возможности для публичного сектора. Например, в сотрудничестве с городской администрацией Стоктона команда работает над облегчением процесса регистрации в муниципальных программах.
Как исследовательский инструмент, Operator пока имеет ряд ограничений. Разработчики планируют постепенно совершенствовать его функционал, основываясь на отзывах пользователей. В будущем инструмент станет доступным для подписчиков Plus, Team и Enterprise, а его функции будут интегрированы в ChatGPT.
Напомним, компания OpenAI запустила собственный номер телефона для ChatGPT. С чат-ботом можно пообщаться, если набрать этот номер или написать текстовое сообщение в WhatsApp.
Также мы писали, что OpenAI официально запустила генеративный искусственный интеллект Sora. Он может превращать текст в реалистичные видео.
Читайте Новини.LIVE!