Компания OpenAI выпустила GPT-5.4 и GPT-5.4 Pro спустя два дня после релиза версии 5.3 Instant.  GPT-5.4 Thinking and GPT-5.4 Pro are rolling out now in Cha Компания OpenAI выпустила GPT-5.4 и GPT-5.4 Pro спустя два дня после релиза версии 5.3 Instant.  GPT-5.4 Thinking and GPT-5.4 Pro are rolling out now in Cha

OpenAI представила GPT‑5.4 с компьютерным зрением

2026/03/06 19:38
3м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу [email protected]

OpenAI представила GPT‑5.4 с компьютерным зрением 

Компания OpenAI выпустила GPT-5.4 и GPT-5.4 Pro спустя два дня после релиза версии 5.3 Instant. 

Стандартная версия GPT-5.4 доступна в веб-интерфейсе ChatGPT, через API и в инструменте Codex. Версию GPT-5.4 Thinking открыли для подписчиков Plus, Team и Pro. 

Для пользователей тарифа Pro и корпоративных клиентов Enterprise предназначена GPT-5.4 Pro, которая также доступна через API. 

Базовая стоимость использования составляет $2,5 за 1 млн входных токенов и $15 за 1 млн выходных. Расценки для версии Pro заметно выше: $30 и $180 за 1 млн токенов соответственно.

Производительность в рабочих задачах

GPT-5.4 выдает более стабильные и качественные результаты в реальных сценариях применения. В бенчмарке GDPval, оценивающем выполнение задач по 44 профессиям, версия достигла показателя в 83%. Это означает, что модель работает на уровне профильных специалистов или превосходит их. Для сравнения, результат GPT-5.2 составлял 70,9%.

Источник: OpenAI. 

Особое внимание разработчики уделили работе с таблицами, презентациями и документами. В задачах уровня младшего аналитика инвестбанка GPT‑5.4 набрала 87,3% против 68,4% у GPT‑5.2. 

Презентации от новой модели оценщики предпочитали в 68% случаев — за лучшую эстетику, разнообразие и эффективное использование генерации изображений.

Источник: OpenAI. 

GPT‑5.4 также стала самой точной моделью OpenAI с точки зрения работы с фактами. При тестировании на промптах с заранее известными ошибками:

  • отдельные утверждения оказывались ложными на 33% реже;
  • полные ответы содержали ошибки на 18% реже по сравнению с GPT‑5.2.

Компьютерное зрение 

Версия первой получила встроенные возможности компьютерного зрения и управления ПК. Модель способна использовать мышь и клавиатуру, ориентируясь на скриншоты, а также писать код для автоматизации через Playwright. 

Поведение настраивается под конкретные сценарии с учетом допустимого уровня риска.

В бенчмарке OSWorld-Verified (управление рабочим столом) GPT‑5.4 успешно выполнила 75% заданий, обойдя предыдущую версию (47,3%) и человека (72,4%). Прогресс связан с улучшенным визуальным восприятием:

  • в тесте MMMU-Pro (понимание и логика) результат составил 81,2% против 79,5% у GPT-5.2;
  • в OmniDocBench (анализ документов) средний показатель ошибок снизился с 0,140 до 0,109.

Программирование 

В кодинге модель сравнялась со специализированной GPT‑5.3‑Codex, но работает быстрее. 

В Codex появился режим /fast, ускоряющий генерацию в полтора раза без потери качества. По результатам внутренних тестов GPT‑5.4 показала высокие результаты в сложных задачах фронтенд-разработки. 

Также представлен экспериментальный навык Playwright (Interactive). Он позволяет модели визуально отлаживать веб- и Electron-приложения, тестируя собственный код прямо в процессе написания.

Инструменты 

В GPT‑5.4 появилась функция поиска инструментов (Tool Search). Раньше системе приходилось заранее загружать в контекст описания всех доступных плагинов. Это добавляло тысячи лишних токенов к каждому запросу и увеличивало стоимость.

Теперь модель получает лишь базовый список и при необходимости самостоятельно находит и подгружает нужные параметры. В тестах на базе MCP Atlas такой подход снизил потребление токенов на 47% без потери точности.

Веб-поиск также стал производительнее: в бенчмарке BrowseComp показатели выросли на 17%, а версия Pro достигла рекордных 89,3%. GPT‑5.4 Thinking эффективнее собирает информацию из множества источников, лучше прорабатывает сложные запросы и выдает более структурированные ответы.

Управляемость и контекст

При работе со сложными запросами GPT‑5.4 Thinking в ChatGPT сначала демонстрирует пользователю план действий. Это позволяет на ходу скорректировать направление, не перезапуская генерацию и не делая лишних уточнений. Функция уже доступна на сайте и в Android-приложении, скоро появится на iOS.

Модель также лучше удерживает контекст в длинных диалогах и дольше обдумывает сложные задачи. Это помогает сохранять связность и релевантность ответов даже при работе с большими объемами информации.

Напомним, в начале марта пользователи бойкотировали ChatGPT на фоне сделки OpenAI с Пентагоном. 

Подписывайтесь на ForkLog в социальных сетях

Telegram (основной канал) Facebook X
Нашли ошибку в тексте? Выделите ее и нажмите CTRL+ENTER

Рассылки ForkLog: держите руку на пульсе биткоин-индустрии!

Возможности рынка
Логотип 4
4 Курс (4)
$0.008154
$0.008154$0.008154
-0.37%
USD
График цены 4 (4) в реальном времени
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу [email protected] для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.