Пост NVIDIA NVLink и Fusion Drive повышают производительность ИИ-инференса появился на BitcoinEthereumNews.com. Rongchai Wang 22 авг 2025 05:13 Технологии NVIDIA NVLink и NVLink Fusion переопределяют производительность ИИ-инференса с улучшенной масштабируемостью и гибкостью для удовлетворения экспоненциального роста сложности ИИ-моделей. Быстрое развитие сложности моделей искусственного интеллекта (ИИ) значительно увеличило количество параметров с миллионов до триллионов, что требует беспрецедентных вычислительных ресурсов. Эта эволюция требует кластеров GPU для управления нагрузкой, как подчеркнул Joe DeLaere в недавнем блог-посте NVIDIA. Эволюция и влияние NVLink NVIDIA представила NVLink в 2016 году, чтобы преодолеть ограничения PCIe в высокопроизводительных вычислениях и рабочих нагрузках ИИ, обеспечивая более быструю коммуникацию между GPU и единое пространство памяти. Технология NVLink значительно эволюционировала: с введением NVLink Switch в 2018 году была достигнута пропускная способность 300 ГБ/с для всех соединений в топологии с 8 GPU, что проложило путь для масштабируемых вычислительных структур. Пятое поколение NVLink, выпущенное в 2024 году, поддерживает 72 GPU с коммуникацией между всеми узлами на скорости 1 800 ГБ/с, предлагая совокупную пропускную способность 130 ТБ/с — в 800 раз больше, чем у первого поколения. Это постоянное развитие соответствует растущей сложности ИИ-моделей и их вычислительным требованиям. NVLink Fusion: настройка и гибкость NVLink Fusion разработан для предоставления гиперскейлерам доступа к масштабируемым технологиям NVLink, позволяя интегрировать пользовательский кремний с архитектурой NVIDIA для развертывания полузаказной ИИ-инфраструктуры. Технология включает NVLink SERDES, чиплеты, коммутаторы и архитектуру масштаба стойки, предлагая модульное решение Open Compute Project (OCP) MGX для гибкости интеграции. NVLink Fusion поддерживает пользовательские конфигурации CPU и XPU с использованием Universal Chiplet Interconnect Express (UCIe) IP и интерфейса, предоставляя клиентам гибкость для их потребностей интеграции XPU на разных платформах. Для пользовательских настроек CPU рекомендуется интеграция NVIDIA NVLink-C2C IP для оптимального подключения GPU и производительности. Максимизация доходов ИИ-фабрики Масштабируемая структура NVLink значительно повышает производительность ИИ-фабрики путем оптимизации баланса между пропускной способностью...Пост NVIDIA NVLink и Fusion Drive повышают производительность ИИ-инференса появился на BitcoinEthereumNews.com. Rongchai Wang 22 авг 2025 05:13 Технологии NVIDIA NVLink и NVLink Fusion переопределяют производительность ИИ-инференса с улучшенной масштабируемостью и гибкостью для удовлетворения экспоненциального роста сложности ИИ-моделей. Быстрое развитие сложности моделей искусственного интеллекта (ИИ) значительно увеличило количество параметров с миллионов до триллионов, что требует беспрецедентных вычислительных ресурсов. Эта эволюция требует кластеров GPU для управления нагрузкой, как подчеркнул Joe DeLaere в недавнем блог-посте NVIDIA. Эволюция и влияние NVLink NVIDIA представила NVLink в 2016 году, чтобы преодолеть ограничения PCIe в высокопроизводительных вычислениях и рабочих нагрузках ИИ, обеспечивая более быструю коммуникацию между GPU и единое пространство памяти. Технология NVLink значительно эволюционировала: с введением NVLink Switch в 2018 году была достигнута пропускная способность 300 ГБ/с для всех соединений в топологии с 8 GPU, что проложило путь для масштабируемых вычислительных структур. Пятое поколение NVLink, выпущенное в 2024 году, поддерживает 72 GPU с коммуникацией между всеми узлами на скорости 1 800 ГБ/с, предлагая совокупную пропускную способность 130 ТБ/с — в 800 раз больше, чем у первого поколения. Это постоянное развитие соответствует растущей сложности ИИ-моделей и их вычислительным требованиям. NVLink Fusion: настройка и гибкость NVLink Fusion разработан для предоставления гиперскейлерам доступа к масштабируемым технологиям NVLink, позволяя интегрировать пользовательский кремний с архитектурой NVIDIA для развертывания полузаказной ИИ-инфраструктуры. Технология включает NVLink SERDES, чиплеты, коммутаторы и архитектуру масштаба стойки, предлагая модульное решение Open Compute Project (OCP) MGX для гибкости интеграции. NVLink Fusion поддерживает пользовательские конфигурации CPU и XPU с использованием Universal Chiplet Interconnect Express (UCIe) IP и интерфейса, предоставляя клиентам гибкость для их потребностей интеграции XPU на разных платформах. Для пользовательских настроек CPU рекомендуется интеграция NVIDIA NVLink-C2C IP для оптимального подключения GPU и производительности. Максимизация доходов ИИ-фабрики Масштабируемая структура NVLink значительно повышает производительность ИИ-фабрики путем оптимизации баланса между пропускной способностью...

Производительность вывода ИИ с NVIDIA NVLink и Fusion Drive

2025/08/22 17:30


Rongchai Wang
05:13, 22 августа 2025

Технологии NVIDIA NVLink и NVLink Fusion переопределяют производительность ИИ-инференса с улучшенной масштабируемостью и гибкостью для удовлетворения экспоненциального роста сложности моделей ИИ.





Быстрое развитие сложности моделей искусственного интеллекта (ИИ) значительно увеличило количество параметров с миллионов до триллионов, что требует беспрецедентных вычислительных ресурсов. Эта эволюция требует кластеров GPU для управления нагрузкой, как подчеркнул Джо ДеЛаере в недавнем блоге NVIDIA.

Эволюция и влияние NVLink

NVIDIA представила NVLink в 2016 году, чтобы преодолеть ограничения PCIe в высокопроизводительных вычислениях и рабочих нагрузках ИИ, обеспечивая более быструю связь между GPU и единое пространство памяти. Технология NVLink значительно эволюционировала: с введением NVLink Switch в 2018 году была достигнута пропускная способность 300 ГБ/с для всех соединений в топологии с 8 GPU, что проложило путь для масштабируемых вычислительных структур.

Пятое поколение NVLink, выпущенное в 2024 году, поддерживает 72 GPU с коммуникацией между всеми устройствами на скорости 1 800 ГБ/с, предлагая совокупную пропускную способность 130 ТБ/с — в 800 раз больше, чем у первого поколения. Это постоянное совершенствование соответствует растущей сложности моделей ИИ и их вычислительным требованиям.

NVLink Fusion: настройка и гибкость

NVLink Fusion разработан для предоставления гиперскейлерам доступа к масштабируемым технологиям NVLink, позволяя интегрировать пользовательский кремний с архитектурой NVIDIA для развертывания полузаказной инфраструктуры ИИ. Технология включает NVLink SERDES, чиплеты, коммутаторы и архитектуру масштаба стойки, предлагая модульное решение Open Compute Project (OCP) MGX для гибкости интеграции.

NVLink Fusion поддерживает пользовательские конфигурации CPU и XPU с использованием IP и интерфейса Universal Chiplet Interconnect Express (UCIe), предоставляя клиентам гибкость для их потребностей интеграции XPU на разных платформах. Для пользовательских настроек CPU рекомендуется интеграция NVIDIA NVLink-C2C IP для оптимального подключения GPU и производительности.

Максимизация доходов ИИ-фабрики

Масштабируемая структура NVLink значительно повышает производительность ИИ-фабрики, оптимизируя баланс между пропускной способностью на ватт и задержкой. Архитектура стойки NVIDIA с 72 GPU играет решающую роль в удовлетворении потребностей в вычислениях ИИ, обеспечивая оптимальную производительность инференса для различных сценариев использования. Способность технологии масштабировать конфигурации максимизирует доход и производительность, даже когда скорость NVLink остается постоянной.

Надежная партнерская экосистема

NVLink Fusion выигрывает от обширной кремниевой экосистемы, включая партнеров по пользовательскому кремнию, CPU и IP-технологиям, обеспечивая широкую поддержку и возможности быстрого проектирования. Сеть системных партнеров и поставщиков компонентов инфраструктуры центров обработки данных уже создает системы NVIDIA GB200 NVL72 и GB300 NVL72, ускоряя выход на рынок для пользователей.

Достижения в области рассуждений ИИ

NVLink представляет собой значительный скачок в решении проблемы вычислительных потребностей в эпоху рассуждений ИИ. Используя десятилетний опыт в технологиях NVLink и открытые стандарты архитектуры стойки OCP MGX, NVLink Fusion предоставляет гиперскейлерам исключительную производительность и возможности настройки.

Источник изображения: Shutterstock


Источник: https://blockchain.news/news/nvidia-nvlink-fusion-ai-inference-performance

Отказ от ответственности: Статьи, размещенные на этом веб-сайте, взяты из общедоступных источников и предоставляются исключительно в информационных целях. Они не обязательно отражают точку зрения MEXC. Все права принадлежат первоисточникам. Если вы считаете, что какой-либо контент нарушает права третьих лиц, пожалуйста, обратитесь по адресу [email protected] для его удаления. MEXC не дает никаких гарантий в отношении точности, полноты или своевременности контента и не несет ответственности за любые действия, предпринятые на основе предоставленной информации. Контент не является финансовой, юридической или иной профессиональной консультацией и не должен рассматриваться как рекомендация или одобрение со стороны MEXC.

Вам также может быть интересно