Корпоративная ИИ-компания Cohere объявила о выпуске Command A+ — языковой модели с открытым исходным кодом на основе архитектуры mixture-of-experts, разработанной для агентных задач корпоративного уровня при относительно низких вычислительных требованиях.
Компания сообщила, что модель создана на основе годовой работы внутри North — корпоративного рабочего пространства Cohere для разработки и развёртывания агентных ИИ-систем, — и объединяет возможности всего семейства Command в единую модель, предназначенную для масштабируемого использования в среде экспериментов, развёртывания и производственных окружениях.
Command A+ теперь доступна по лицензии Apache 2.0, предоставляя разработчикам широкий доступ к модели, которую Cohere позиционирует как инструмент для поддержки суверенного развёртывания ИИ, в том числе в средах, где организации хотят напрямую контролировать инфраструктуру и поведение модели. Релиз включает загружаемые веса на Hugging Face, а также инструкции по реализации и варианты развёртывания через Model Vault от Cohere.
Согласно опубликованным техническим характеристикам компании, модель использует разреженную архитектуру MoE, имеет 218 миллиардов общих параметров при 25 миллиардах активных параметров, поддерживает входной контекст в 128 000 токенов и может генерировать до 64 000 токенов. Она предназначена для работы с текстовыми, графическими входными данными и инструментами, а также может производить текстовые, логические и инструментальные выходные данные на 48 языках.
Cohere сообщила, что Command A+ оптимизирован для логического вывода, генерации с расширенным поиском, многоязычных задач, мультимодальной обработки документов и агентных рабочих процессов. Компания также подчеркнула аппаратную эффективность модели, отметив, что она доступна в нескольких форматах квантования, включая BF16, FP8 и W4A4, и может работать на небольшом количестве высококлассных GPU. Модель также представлена как самый быстрый релиз Cohere на сегодняшний день: компания указывает на улучшения скорости вывода, снижение задержки и повышение эффективности токенов по сравнению с предыдущими моделями Command. Cohere сообщила, что спекулятивное декодирование было адаптировано для архитектуры модели с целью дополнительного увеличения скорости инференса без ущерба для качества вывода.
Компания охарактеризовала Command A+ как консолидированного преемника более ранних вариантов Command A, заявив, что он превосходит предыдущие поколения в корпоративных задачах, таких как логический вывод на длинном контексте, мультимодальное понимание, поиск и генерация кода. Cohere также выделила прирост в бенчмарках по сравнению с Command A Reasoning, включая более высокие результаты в агентной оценке в области телекоммуникаций, задачах кодирования в терминале и внутренних метриках, используемых в North. Также сообщается, что модель улучшила производительность в анализе электронных таблиц, агентном ответе на вопросы и рабочих процессах на основе памяти.
Многоязычность является ещё одной ключевой частью релиза. Cohere сообщила, что Command A+ расширяет поддержку с 23 до 48 языков, одновременно улучшая производительность перевода и многоязычного логического вывода. Компания также отчиталась о достижениях в неевропейских языках, включая улучшения эффективности токенизации для арабского, корейского и японского языков. В мультимодальных бенчмарках модель продемонстрировала более высокие результаты в задачах логического вывода по документам и изображениям, включая оценки, связанные с MathVista, MMMU и CharXiv.
Интерес отрасли к релизу отразился в комментариях Fujitsu, которая заявила, что архитектура модели и агентная производительность соответствуют её собственной стратегии суверенного ИИ. Cohere представила запуск как часть более широких усилий по одновременному решению трёх приоритетов в корпоративном ИИ: возможности, безопасности и стоимости. Компания сообщила, что дальнейшая разработка будет продолжать фокусироваться на логическом выводе, мультимодальной производительности и кодировании, сохраняя при этом модели пригодными для развёртывания в средах, контролируемых клиентами.
Command A+ доступен через Hugging Face, Model Vault, API Cohere и бесплатное онлайн-демонстрационное пространство. Cohere сообщила, что документация и материалы по развёртыванию также доступны для организаций, желающих протестировать или интегрировать модель в корпоративные рабочие процессы.
Запись Cohere представляет Command A+, продвигая суверенное и эффективное развёртывание корпоративного ИИ впервые появилась на Metaverse Post.


