Rongchai Wang
22 серпня 2025 05:13
Технології NVLink та NVLink Fusion від NVIDIA переосмислюють продуктивність ШІ-інференсу з покращеним масштабуванням та гнучкістю для задоволення експоненціального зростання складності моделей ШІ.
Швидкий розвиток складності моделей штучного інтелекту (ШІ) значно збільшив кількість параметрів від мільйонів до трильйонів, що вимагає безпрецедентних обчислювальних ресурсів. Ця еволюція потребує кластерів GPU для управління навантаженням, як підкреслив Джо ДеЛаере в нещодавньому блозі NVIDIA.
Еволюція та вплив NVLink
NVIDIA представила NVLink у 2016 році, щоб подолати обмеження PCIe у високопродуктивних обчисленнях та робочих навантаженнях ШІ, забезпечуючи швидшу комунікацію між GPU та уніфікований простір пам'яті. Технологія NVLink значно еволюціонувала, з впровадженням NVLink Switch у 2018 році, досягнувши пропускної здатності 300 ГБ/с між усіма вузлами в топології з 8 GPU, прокладаючи шлях для масштабованих обчислювальних структур.
П'яте покоління NVLink, випущене у 2024 році, підтримує 72 GPU з комунікацією між усіма вузлами на швидкості 1 800 ГБ/с, пропонуючи сукупну пропускну здатність 130 ТБ/с — у 800 разів більше, ніж перше покоління. Це постійне вдосконалення відповідає зростаючій складності моделей ШІ та їхнім обчислювальним потребам.
NVLink Fusion: налаштування та гнучкість
NVLink Fusion розроблено для надання гіперскейлерам доступу до технологій масштабування NVLink, дозволяючи інтеграцію користувацького кремнію з архітектурою NVIDIA для розгортання напівкастомізованої інфраструктури ШІ. Технологія включає NVLink SERDES, чіплети, комутатори та архітектуру рівня стійки, пропонуючи модульне рішення стійки Open Compute Project (OCP) MGX для гнучкості інтеграції.
NVLink Fusion підтримує користувацькі конфігурації CPU та XPU, використовуючи IP та інтерфейс Universal Chiplet Interconnect Express (UCIe), надаючи клієнтам гнучкість для їхніх потреб інтеграції XPU на різних платформах. Для користувацьких налаштувань CPU рекомендується інтеграція IP NVIDIA NVLink-C2C для оптимального підключення та продуктивності GPU.
Максимізація доходу ШІ-фабрики
Масштабована структура NVLink значно підвищує продуктивність ШІ-фабрики, оптимізуючи баланс між пропускною здатністю на ват і затримкою. Архітектура стійки NVIDIA з 72 GPU відіграє вирішальну роль у задоволенні потреб обчислень ШІ, забезпечуючи оптимальну продуктивність інференсу для різних випадків використання. Здатність технології масштабувати конфігурації максимізує дохід і продуктивність, навіть коли швидкість NVLink залишається постійною.
Надійна партнерська екосистема
NVLink Fusion отримує переваги від розширеної кремнієвої екосистеми, включаючи партнерів для користувацького кремнію, CPU та IP-технологій, забезпечуючи широку підтримку та швидкі можливості проектування. Мережа системних партнерів та постачальників компонентів інфраструктури дата-центрів вже будує системи NVIDIA GB200 NVL72 та GB300 NVL72, прискорюючи вихід на ринок для користувачів.
Досягнення в ШІ-міркуванні
NVLink представляє значний стрибок у вирішенні потреб обчислень в епоху ШІ-міркування. Використовуючи десятиліття досвіду в технологіях NVLink та відкриті стандарти архітектури стійки OCP MGX, NVLink Fusion надає гіперскейлерам виняткову продуктивність та можливості налаштування.
Джерело зображення: Shutterstock
Джерело: https://blockchain.news/news/nvidia-nvlink-fusion-ai-inference-performance



