Производительность вывода ИИ с NVIDIA NVLink и Fusion Drive

Rongchai Wang
05:13, 22 августа 2025

Технологии NVIDIA NVLink и NVLink Fusion переопределяют производительность ИИ-инференса с улучшенной масштабируемостью и гибкостью для удовлетворения экспоненциального роста сложности моделей ИИ.

Быстрое развитие сложности моделей искусственного интеллекта (ИИ) значительно увеличило количество параметров с миллионов до триллионов, что требует беспрецедентных вычислительных ресурсов. Эта эволюция требует кластеров GPU для управления нагрузкой, как подчеркнул Джо ДеЛаере в недавнем блоге NVIDIA.

Эволюция и влияние NVLink

NVIDIA представила NVLink в 2016 году, чтобы преодолеть ограничения PCIe в высокопроизводительных вычислениях и рабочих нагрузках ИИ, обеспечивая более быструю связь между GPU и единое пространство памяти. Технология NVLink значительно эволюционировала: с введением NVLink Switch в 2018 году была достигнута пропускная способность 300 ГБ/с для всех соединений в топологии с 8 GPU, что проложило путь для масштабируемых вычислительных структур.

Пятое поколение NVLink, выпущенное в 2024 году, поддерживает 72 GPU с коммуникацией между всеми устройствами на скорости 1 800 ГБ/с, предлагая совокупную пропускную способность 130 ТБ/с — в 800 раз больше, чем у первого поколения. Это постоянное совершенствование соответствует растущей сложности моделей ИИ и их вычислительным требованиям.

NVLink Fusion: настройка и гибкость

NVLink Fusion разработан для предоставления гиперскейлерам доступа к масштабируемым технологиям NVLink, позволяя интегрировать пользовательский кремний с архитектурой NVIDIA для развертывания полузаказной инфраструктуры ИИ. Технология включает NVLink SERDES, чиплеты, коммутаторы и архитектуру масштаба стойки, предлагая модульное решение Open Compute Project (OCP) MGX для гибкости интеграции.

NVLink Fusion поддерживает пользовательские конфигурации CPU и XPU с использованием IP и интерфейса Universal Chiplet Interconnect Express (UCIe), предоставляя клиентам гибкость для их потребностей интеграции XPU на разных платформах. Для пользовательских настроек CPU рекомендуется интеграция NVIDIA NVLink-C2C IP для оптимального подключения GPU и производительности.

Максимизация доходов ИИ-фабрики

Масштабируемая структура NVLink значительно повышает производительность ИИ-фабрики, оптимизируя баланс между пропускной способностью на ватт и задержкой. Архитектура стойки NVIDIA с 72 GPU играет решающую роль в удовлетворении потребностей в вычислениях ИИ, обеспечивая оптимальную производительность инференса для различных сценариев использования. Способность технологии масштабировать конфигурации максимизирует доход и производительность, даже когда скорость NVLink остается постоянной.

Надежная партнерская экосистема

NVLink Fusion выигрывает от обширной кремниевой экосистемы, включая партнеров по пользовательскому кремнию, CPU и IP-технологиям, обеспечивая широкую поддержку и возможности быстрого проектирования. Сеть системных партнеров и поставщиков компонентов инфраструктуры центров обработки данных уже создает системы NVIDIA GB200 NVL72 и GB300 NVL72, ускоряя выход на рынок для пользователей.

Достижения в области рассуждений ИИ

NVLink представляет собой значительный скачок в решении проблемы вычислительных потребностей в эпоху рассуждений ИИ. Используя десятилетний опыт в технологиях NVLink и открытые стандарты архитектуры стойки OCP MGX, NVLink Fusion предоставляет гиперскейлерам исключительную производительность и возможности настройки.

Источник изображения: Shutterstock

Источник: https://blockchain.news/news/nvidia-nvlink-fusion-ai-inference-performance

Производительность вывода ИИ с NVIDIA NVLink и Fusion Drive

Эволюция и влияние NVLink

NVLink Fusion: настройка и гибкость

Максимизация доходов ИИ-фабрики

Надежная партнерская экосистема

Достижения в области рассуждений ИИ

Вам также может быть интересно

Какая лучшая криптовалютная предпродажа предлагает наилучший пассивный доход на 2026 год?

YouTube теперь платит авторам в криптовалюте, предлагая путь в 100B долларов для окончательного выхода из банков

SEC одобряет DTCC пилотный проект по токенизированным акциям, облигациям и казначейским облигациям США

Популярные новости

Какая лучшая криптовалютная предпродажа предлагает наилучший пассивный доход на 2026 год?

YouTube теперь платит авторам в криптовалюте, предлагая путь в 100B долларов для окончательного выхода из банков

SEC одобряет DTCC пилотный проект по токенизированным акциям, облигациям и казначейским облигациям США

Interactive Brokers открывает финансирование счетов через стейблкоины

Давний бык Том Ли выпускает предупреждение, говорит, что 2026 год может "выглядеть как медвежий рынок" – вот его новый прогноз

Цены на криптовалюту