SkyRL представляет обучение с подкреплением на основе визуального языка, обеспечивая масштабируемое обучение для мультимодальных задач. Узнайте, как это влияет на развитие ИИ. (Читать далее)SkyRL представляет обучение с подкреплением на основе визуального языка, обеспечивая масштабируемое обучение для мультимодальных задач. Узнайте, как это влияет на развитие ИИ. (Читать далее)

SkyRL добавляет поддержку Vision-Language RL для мультимодальных моделей

2026/04/25 00:33
3м. чтение
Для обратной связи или замечаний по поводу данного контента, свяжитесь с нами по адресу [email protected]

SkyRL добавляет поддержку визуально-языкового RL для мультимодальных моделей

Joerg Hiller 24 апр. 2026 16:33

SkyRL представляет визуально-языковое обучение с подкреплением, обеспечивая масштабируемое обучение для мультимодальных задач. Узнайте, как это влияет на развитие ИИ.

SkyRL Adds Vision-Language RL Support for Multimodal Models

SkyRL — библиотека обучения с подкреплением (RL), разработанная Sky Computing Lab Калифорнийского университета в Беркли совместно с Anyscale, — объявила о поддержке дообучения визуально-языковых моделей (VLM). Это обновление позволяет командам обучать мультимодальные модели с использованием рабочих процессов контролируемой тонкой настройки (SFT) и RL, отвечая на растущий спрос на модели, способные одновременно обрабатывать визуальные и текстовые данные.

Мультимодальные рабочие нагрузки, такие как задачи компьютерного зрения, робототехника и агентное рассуждение, требуют от моделей обработки визуальных входных данных, выполнения действий и адаптации на основе обратной связи. Новая функциональность SkyRL делает VLM полноценным участником стека обучения, предоставляя инструменты для масштабирования обучения на локальных GPU или многоузловых кластерах. Это основывается на существующей инфраструктуре SkyRL, которая уже поддерживает сложные агентные задачи, такие как бенчмарки по разработке программного обеспечения и генерация Text-to-SQL.

Ключевые особенности обновления

Одной из основных проблем RL для визуально-языковых задач является поддержание согласованности между обучением и инференсом. SkyRL решает проблему дрейфа логарифмической вероятности — распространённую при обработке визуальных входных данных — путём введения дезагрегированного конвейера. Используя стек инференса vLLM в качестве источника истины, платформа обеспечивает согласованность токенизации и подготовки входных данных во всех рабочих процессах.

Этот подход не только стабилизирует обучение, но и позволяет независимо масштабировать CPU-воркеры для обработки входных данных, гарантируя, что пропускная способность GPU не становится узким местом. Обновление также поддерживает готовые рецепты для задач, таких как навигация Maze2D и Geometry-3k — набор данных, требующий визуального геометрического рассуждения. Ранние результаты показали улучшенную стабильность обучения даже при больших размерах моделей, таких как Qwen3-VL 8B Instruct.

Значение для разработки ИИ

SkyRL позиционирует себя как ключевую платформу для масштабируемого RL и SFT при обучении мультимодальных моделей. Благодаря интеграции с такими инструментами, как Tinker API, пользователи могут развёртывать рабочие процессы RL на собственной инфраструктуре, снижая зависимость от внешних провайдеров. Это особенно актуально с учётом растущих вычислительных требований при обучении крупных моделей.

Эти достижения приходятся на время, когда мультимодальные системы ИИ пользуются высоким спросом для реальных приложений. Задачи, требующие последовательного принятия решений, визуального рассуждения и адаптивности — такие как автономная навигация и динамическое взаимодействие с инструментами — получат значительные преимущества. Модульная конструкция SkyRL также поддерживает быстрое прототипирование, позволяя исследователям и разработчикам экспериментировать с новыми алгоритмами и парадигмами обучения.

Взгляд в будущее

Дорожная карта SkyRL включает такие функции, как упаковка последовательностей, поддержка бэкенда Megatron и обучение на длинном контексте с параллелизмом контекста. Ожидается, что эти обновления дополнительно расширят возможности платформы для работы со сложными агентными нагрузками. Для разработчиков, желающих приступить к обучению VLM, SkyRL предлагает обучающие материалы и документацию.

По мере того как индустрия ИИ всё активнее внедряет мультимодальные системы в практические сценарии использования, способность эффективно обучать и тонко настраивать такие модели станет ключевым конкурентным преимуществом. Последнее обновление SkyRL отражает её приверженность сохранению лидерства в этой эволюции, предоставляя масштабируемую и модульную платформу для передовых исследований и развёртывания RL.

Источник изображения: Shutterstock
  • skyrl
  • обучение с подкреплением
  • визуально-языковые модели
  • обучение ИИ
Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу [email protected] для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно

NC Blockchain предупреждает об утечке капитала за рубеж в письме о Законе о ясности сенатору Тому Тиллису

NC Blockchain предупреждает об утечке капитала за рубеж в письме о Законе о ясности сенатору Тому Тиллису

Отраслевая группа NC Blockchain призывает сенатора Тома Тиллиса продвигать Закон о ясности вперёд, предупреждая, что запрет на доходность стаблкоинов может привести к оттоку капитала за рубеж.
Поделиться
Cryptopolitan2026/04/25 15:42
Анализ цены XRP (XRP): Киты обеспечивают 94% оттока с бирж на фоне институционального накопления

Анализ цены XRP (XRP): Киты обеспечивают 94% оттока с бирж на фоне институционального накопления

XRP торгуется по $1,43, вывод средств китами достигает 94,4%, спотовый CVD растёт на $310 млн, а институты увеличивают позиции в ETF. Аналитики следят за возможным прорывом до $1,58. The post
Поделиться
Blockonomi2026/04/25 15:08
Трамп подтверждает трёхнедельное продление перемирия между Израилем и Ливаном

Трамп подтверждает трёхнедельное продление перемирия между Израилем и Ливаном

Публикация «Трамп подтверждает трёхнедельное продление перемирия между Израилем и Ливаном» появилась на BitcoinEthereumNews.com. Президент Трамп подтвердил трёхнедельное продление
Поделиться
BitcoinEthereumNews2026/04/25 15:33

Бросайте кости, выигрыш до 1 BTC

Бросайте кости, выигрыш до 1 BTCБросайте кости, выигрыш до 1 BTC

Приглашайте друзей и разделите 500 000 USDT!