Криптовалюты

ChatGPT научился выполнять задачи вместо человека

18 июля 2025, 07:31 Источник Источник: forklog
ChatGPT научился выполнять задачи вместо человека

Стартап OpenAI запустил нового универсального ИИ-агента в ChatGPT, который способен выполнять широкий спектр компьютерных задач от имени пользователя. 



ChatGPT can now do work for you using its own computer.Introducing ChatGPT agent—a unified agentic system combining Operator’s action-taking remote browser, deep research’s web synthesis, and ChatGPT’s conversational strengths. pic.twitter.com/7uN2Nc6nBQ— OpenAI (@OpenAI) July 17, 2025




Компания утверждает, что он может автоматически управлять календарем пользователя, создавать редактируемые презентации и слайды, а также запускать код.



ChatGPT agent объединяет в себе несколько функций предыдущих агентных решений. В их числе способность Operator выполнять клики по сайтам и возможность Deep Research собирать информацию с десятков сайтов и предоставлять сжатый аналитический отчет.



Взаимодействовать с инструментом можно на естественном языке в ходе диалога с чат-ботом.



Первоначально ИИ-агент доступен для подписчиков Pro, Plus и Team. Для его активации необходимо выбрать «режим агента» (agent mode) в выпадающем меню инструментов ChatGPT.



OpenAI утверждает, что новый ChatGPT agent значительно превосходит другие решения. Он способен задействовать ChatGPT connectors — подключать приложения вроде Gmail и GitHub для поиска необходимой информации и ответа на запросы. Также у него есть доступ к терминалу и возможность использовать API.



Умения цифрового помощника включают планирование и покупку ингредиентов для японского завтрака на четверых, анализ трех конкурентов с последующей подготовкой презентации.



Тесты



Лежащая в основе инструмента модель демонстрирует передовые результаты в ряде бенчмарков, отметили в OpenAI. В Humanity’s Last Exam — сложнейшем тесте, включающем тысячи вопросов по более чем сотне предметов, — ChatGPT agent показывает результат 41,6%. Это примерно в два раза выше показателей o3 и o4-mini.



Сравнение разных моделей в Humanity’s Last Exam. Источник: OpenAI.



На одном из самых сложных математических анализов FrontierMath нейросеть набрала 27,4%. Предыдущий рекорд принадлежал o4-mini — 6,3%.



Безопасность



Стартап отметил, что при разработке ChatGPT agent особое внимание уделялось вопросам безопасности, поскольку новый продукт обладает расширенными возможностями, которые могут нанести вред в случае попадания в руки злоумышленников.



В отчете модель отнесена к категории «высокая способность» в области биологического и химического оружия. Это означает, что она может усилить уже существующие пути нанесения серьезного вреда. При этом OpenAI подчеркивает, что не имеет прямых доказательств такой угрозы, но применяет превентивный подход и вводит дополнительные меры защиты. Они включают:




модуль онлайн-мониторинга — все пользовательские запросы проходят через классификатор, который определяет, связано ли обращение с биологической тематикой. Если да — ответ дополнительно проверяется вторым механизмом на предмет потенциальной угрозы;



отключение функции памяти — это сделано для предотвращения утечек данных через атаки с внедрением вредоносных промптов.




Напомним, в июле стало известно, что OpenAI пересмотрела свою систему безопасности для защиты интеллектуальной собственности от корпоративного шпионажа на фоне опасений касательно кражи со стороны китайских конкурентов.



Ранее ChatGPT обучили подключаться к большему количеству внутренних источников и получать контекстную информацию в реальном времени.

Полную версию статьи можно прочитать на сайте источника:


Другие новости

"Нужны огромные ресурсы": эксперт заявил о необходимости усиления ПВО Украины

"Нужны огромные ресурсы": эксперт заявил о необходимости усиления ПВО Украины

My Favorite Adjustable Dumbbell Workout Only Takes 15 Minutes

My Favorite Adjustable Dumbbell Workout Only Takes 15 Minutes

Five Ways I Use ChatGPT as a Full-Time Creator to Get More Done

Five Ways I Use ChatGPT as a Full-Time Creator to Get More Done