OpenAI выпустила ИИ-агента, который сможет заказывать еду за вас

Мужчина пользуется инструментом Operator от OpenAI. Фото: OpenAI

В четверг, 23 января, OpenAI анонсировала выпуск нового инструмента Operator — агента, который способен выполнять задачи в интернете вместо пользователя. Этот агент может самостоятельно открывать браузер, взаимодействовать с веб-страницами, нажимать кнопки, заполнять формы, прокручивать страницы и даже создавать мемы. Сейчас он доступен в США для пользователей с подпиской Pro в виде предварительного исследования.

Об этом говорится на сайте OpenAI.

Как работает Operator

Operator использует новую модель Computer-Using Agent (CUA), сочетающую возможности GPT-4o в распознавании изображений и высокоуровневое логическое мышление. Благодаря этому инструмент может "видеть" веб-страницы через скриншоты и "взаимодействовать" с ними, используя возможности клавиатуры и мыши.

Взаимодействие с интерфейсом инструмента Operator. Фото: OpenAI

Если агент наталкивается на трудности, он способен анализировать свои действия и исправлять ошибки. В случае сложных задач, например авторизации или ввода платежных данных, Operator обращается за помощью к пользователю.

Operator может выполнять ряд рутинных задач:

  • заполнение форм;
  • заказ продуктов;
  • персонализация запросов, например, настройка параметров авиаперелетов;
  • выполнение нескольких задач одновременно — от бронирования кемпинга до заказа товаров на Etsy.

Пользователи могут задавать индивидуальные инструкции для выполнения определенных задач или сохранять повторяющиеся запросы для быстрого доступа.

Operator призван упростить взаимодействие с цифровыми сервисами для обычных пользователей и компаний. Уже сейчас команда разработчиков сотрудничает с такими компаниями, как:

  • DoorDash;
  • Instacart;
  • OpenTable;
  • Priceline;
  • Uber и другими.

Цель — повысить удобство и эффективность сервисов для пользователей и бизнеса.

Кроме коммерческого применения, Operator открывает новые возможности для публичного сектора. Например, в сотрудничестве с городской администрацией Стоктона команда работает над облегчением процесса регистрации в муниципальных программах.

Как исследовательский инструмент, Operator пока имеет ряд ограничений. Разработчики планируют постепенно совершенствовать его функционал, основываясь на отзывах пользователей. В будущем инструмент станет доступным для подписчиков Plus, Team и Enterprise, а его функции будут интегрированы в ChatGPT.

Напомним, компания OpenAI запустила собственный номер телефона для ChatGPT. С чат-ботом можно пообщаться, если набрать этот номер или написать текстовое сообщение в WhatsApp.

Также мы писали, что OpenAI официально запустила генеративный искусственный интеллект Sora. Он может превращать текст в реалистичные видео.