
Стартап OpenAI запустил нового универсального ИИ-агента в ChatGPT, который способен выполнять широкий спектр компьютерных задач от имени пользователя.
Компания утверждает, что он может автоматически управлять календарем пользователя, создавать редактируемые презентации и слайды, а также запускать код.
ChatGPT agent объединяет в себе несколько функций предыдущих агентных решений. В их числе способность Operator выполнять клики по сайтам и возможность Deep Research собирать информацию с десятков сайтов и предоставлять сжатый аналитический отчет.
Взаимодействовать с инструментом можно на естественном языке в ходе диалога с чат-ботом.
Первоначально ИИ-агент доступен для подписчиков Pro, Plus и Team. Для его активации необходимо выбрать «режим агента» (agent mode) в выпадающем меню инструментов ChatGPT.
OpenAI утверждает, что новый ChatGPT agent значительно превосходит другие решения. Он способен задействовать ChatGPT connectors — подключать приложения вроде Gmail и GitHub для поиска необходимой информации и ответа на запросы. Также у него есть доступ к терминалу и возможность использовать API.
Умения цифрового помощника включают планирование и покупку ингредиентов для японского завтрака на четверых, анализ трех конкурентов с последующей подготовкой презентации.
ТестыЛежащая в основе инструмента модель демонстрирует передовые результаты в ряде бенчмарков, отметили в OpenAI. В Humanity’s Last Exam — сложнейшем тесте, включающем тысячи вопросов по более чем сотне предметов, — ChatGPT agent показывает результат 41,6%. Это примерно в два раза выше показателей o3 и o4-mini.
На одном из самых сложных математических анализов FrontierMath нейросеть набрала 27,4%. Предыдущий рекорд принадлежал o4-mini — 6,3%.
БезопасностьСтартап отметил, что при разработке ChatGPT agent особое внимание уделялось вопросам безопасности, поскольку новый продукт обладает расширенными возможностями, которые могут нанести вред в случае попадания в руки злоумышленников.
В Для просмотра ссылки Войди
- модуль онлайн-мониторинга — все пользовательские запросы проходят через классификатор, который определяет, связано ли обращение с биологической тематикой. Если да — ответ дополнительно проверяется вторым механизмом на предмет потенциальной угрозы;
- отключение функции памяти — это сделано для предотвращения утечек данных через атаки с внедрением вредоносных промптов.
Ранее ChatGPT Для просмотра ссылки Войди
- Источник новости
- forklog.com