OpenAI випустила ШІ-агента, який зможе замовляти їжу за вас
У четвер, 23 січня, OpenAI анонсувала випуск нового інструменту Operator — агента, який здатен виконувати завдання в інтернеті замість користувача. Цей агент може самостійно відкривати браузер, взаємодіяти із вебсторінками, натискати кнопки, заповнювати форми, прокручувати сторінки та навіть створювати меми. Наразі він доступний у США для користувачів з підпискою Pro у вигляді попереднього дослідження.
Про це йдеться на сайті OpenAI.
Як працює Operator
Operator використовує нову модель Computer-Using Agent (CUA), що поєднує можливості GPT-4o у розпізнаванні зображень і високорівневе логічне мислення. Завдяки цьому інструмент може "бачити" вебсторінки через скриншоти та "взаємодіяти" з ними, використовуючи можливості клавіатури й миші.
Якщо агент натрапляє на труднощі, він здатен аналізувати свої дії й виправляти помилки. У разі складних завдань, наприклад авторизації або введення платіжних даних, Operator звертається за допомогою до користувача.
Operator може виконувати низку рутинних завдань:
- заповнення форм;
- замовлення продуктів;
- персоналізація запитів, наприклад, налаштування параметрів авіаперельотів;
- виконання кількох задач одночасно — від бронювання кемпінгу до замовлення товарів на Etsy.
Користувачі можуть задавати індивідуальні інструкції для виконання певних завдань або зберігати повторювані запити для швидкого доступу.
Operator покликаний спростити взаємодію з цифровими сервісами для звичайних користувачів і компаній. Уже зараз команда розробників співпрацює з такими компаніями, як:
- DoorDash;
- Instacart;
- OpenTable;
- Priceline;
- Uber та іншими.
Мета — підвищити зручність та ефективність сервісів для користувачів і бізнесу.
Крім комерційного застосування, Operator відкриває нові можливості для публічного сектору. Наприклад, у співпраці з міською адміністрацією Стоктона команда працює над полегшенням процесу реєстрації у муніципальних програмах.
Як досліджувальний інструмент, Operator наразі має низку обмежень. Розробники планують поступово вдосконалювати його функціонал, базуючись на відгуках користувачів. У майбутньому інструмент стане доступним для підписників Plus, Team і Enterprise, а його функції будуть інтегровані в ChatGPT.
Нагадаємо, компанія OpenAI запустила власний номер телефону для ChatGPT. З чатботом можна поспілкуватися, якщо набрати цей номер або написати текстове повідомлення у WhatsApp.
Також ми писали, що OpenAI офіційно запустила генеративний штучний інтелект Sora. Він може перетворювати текст на реалістичні відео.
Читайте Новини.LIVE!