Rongchai Wang
05:13, 22 августа 2025
Технологии NVIDIA NVLink и NVLink Fusion переопределяют производительность ИИ-инференса с улучшенной масштабируемостью и гибкостью для удовлетворения экспоненциального роста сложности моделей ИИ.
Быстрое развитие сложности моделей искусственного интеллекта (ИИ) значительно увеличило количество параметров с миллионов до триллионов, что требует беспрецедентных вычислительных ресурсов. Эта эволюция требует кластеров GPU для управления нагрузкой, как подчеркнул Джо ДеЛаере в недавнем блоге NVIDIA.
Эволюция и влияние NVLink
NVIDIA представила NVLink в 2016 году, чтобы преодолеть ограничения PCIe в высокопроизводительных вычислениях и рабочих нагрузках ИИ, обеспечивая более быструю связь между GPU и единое пространство памяти. Технология NVLink значительно эволюционировала: с введением NVLink Switch в 2018 году была достигнута пропускная способность 300 ГБ/с для всех соединений в топологии с 8 GPU, что проложило путь для масштабируемых вычислительных структур.
Пятое поколение NVLink, выпущенное в 2024 году, поддерживает 72 GPU с коммуникацией между всеми устройствами на скорости 1 800 ГБ/с, предлагая совокупную пропускную способность 130 ТБ/с — в 800 раз больше, чем у первого поколения. Это постоянное совершенствование соответствует растущей сложности моделей ИИ и их вычислительным требованиям.
NVLink Fusion: настройка и гибкость
NVLink Fusion разработан для предоставления гиперскейлерам доступа к масштабируемым технологиям NVLink, позволяя интегрировать пользовательский кремний с архитектурой NVIDIA для развертывания полузаказной инфраструктуры ИИ. Технология включает NVLink SERDES, чиплеты, коммутаторы и архитектуру масштаба стойки, предлагая модульное решение Open Compute Project (OCP) MGX для гибкости интеграции.
NVLink Fusion поддерживает пользовательские конфигурации CPU и XPU с использованием IP и интерфейса Universal Chiplet Interconnect Express (UCIe), предоставляя клиентам гибкость для их потребностей интеграции XPU на разных платформах. Для пользовательских настроек CPU рекомендуется интеграция NVIDIA NVLink-C2C IP для оптимального подключения GPU и производительности.
Максимизация доходов ИИ-фабрики
Масштабируемая структура NVLink значительно повышает производительность ИИ-фабрики, оптимизируя баланс между пропускной способностью на ватт и задержкой. Архитектура стойки NVIDIA с 72 GPU играет решающую роль в удовлетворении потребностей в вычислениях ИИ, обеспечивая оптимальную производительность инференса для различных сценариев использования. Способность технологии масштабировать конфигурации максимизирует доход и производительность, даже когда скорость NVLink остается постоянной.
Надежная партнерская экосистема
NVLink Fusion выигрывает от обширной кремниевой экосистемы, включая партнеров по пользовательскому кремнию, CPU и IP-технологиям, обеспечивая широкую поддержку и возможности быстрого проектирования. Сеть системных партнеров и поставщиков компонентов инфраструктуры центров обработки данных уже создает системы NVIDIA GB200 NVL72 и GB300 NVL72, ускоряя выход на рынок для пользователей.
Достижения в области рассуждений ИИ
NVLink представляет собой значительный скачок в решении проблемы вычислительных потребностей в эпоху рассуждений ИИ. Используя десятилетний опыт в технологиях NVLink и открытые стандарты архитектуры стойки OCP MGX, NVLink Fusion предоставляет гиперскейлерам исключительную производительность и возможности настройки.
Источник изображения: Shutterstock
Источник: https://blockchain.news/news/nvidia-nvlink-fusion-ai-inference-performance



