Допис NVIDIA NVLink та Fusion Drive підвищують продуктивність ШІ-інференсу з'явився на BitcoinEthereumNews.com. Rongchai Wang 22 серпня 2025 05:13 Технології NVIDIA NVLink та NVLink Fusion переосмислюють продуктивність ШІ-інференсу з покращеним масштабуванням та гнучкістю для задоволення експоненціального зростання складності ШІ-моделей. Швидкий розвиток складності моделей штучного інтелекту (ШІ) значно збільшив кількість параметрів з мільйонів до трильйонів, що вимагає безпрецедентних обчислювальних ресурсів. Ця еволюція потребує кластерів GPU для управління навантаженням, як підкреслив Джо ДеЛаере в нещодавньому блозі NVIDIA. Еволюція та вплив NVLink NVIDIA представила NVLink у 2016 році, щоб подолати обмеження PCIe у високопродуктивних обчисленнях та ШІ-навантаженнях, забезпечуючи швидшу комунікацію між GPU та уніфікований простір пам'яті. Технологія NVLink значно еволюціонувала, з впровадженням NVLink Switch у 2018 році, досягнувши пропускної здатності 300 ГБ/с між усіма вузлами в топології з 8 GPU, прокладаючи шлях для масштабованих обчислювальних структур. П'яте покоління NVLink, випущене у 2024 році, підтримує 72 GPU з комунікацією між усіма вузлами на швидкості 1 800 ГБ/с, пропонуючи сукупну пропускну здатність 130 ТБ/с — у 800 разів більше, ніж перше покоління. Цей постійний прогрес відповідає зростаючій складності ШІ-моделей та їхнім обчислювальним потребам. NVLink Fusion: налаштування та гнучкість NVLink Fusion розроблений для надання гіперскейлерам доступу до масштабованих технологій NVLink, дозволяючи інтеграцію користувацького кремнію з архітектурою NVIDIA для розгортання напівкастомізованої ШІ-інфраструктури. Технологія включає NVLink SERDES, чіплети, комутатори та архітектуру масштабу стійки, пропонуючи модульне рішення стійки Open Compute Project (OCP) MGX для гнучкості інтеграції. NVLink Fusion підтримує користувацькі конфігурації CPU та XPU, використовуючи Universal Chiplet Interconnect Express (UCIe) IP та інтерфейс, надаючи клієнтам гнучкість для їхніх потреб інтеграції XPU на різних платформах. Для користувацьких налаштувань CPU рекомендується інтеграція NVIDIA NVLink-C2C IP для оптимального підключення GPU та продуктивності. Максимізація доходу ШІ-фабрики Масштабована структура NVLink значно підвищує продуктивність ШІ-фабрики, оптимізуючи баланс між пропускною здатністю...Допис NVIDIA NVLink та Fusion Drive підвищують продуктивність ШІ-інференсу з'явився на BitcoinEthereumNews.com. Rongchai Wang 22 серпня 2025 05:13 Технології NVIDIA NVLink та NVLink Fusion переосмислюють продуктивність ШІ-інференсу з покращеним масштабуванням та гнучкістю для задоволення експоненціального зростання складності ШІ-моделей. Швидкий розвиток складності моделей штучного інтелекту (ШІ) значно збільшив кількість параметрів з мільйонів до трильйонів, що вимагає безпрецедентних обчислювальних ресурсів. Ця еволюція потребує кластерів GPU для управління навантаженням, як підкреслив Джо ДеЛаере в нещодавньому блозі NVIDIA. Еволюція та вплив NVLink NVIDIA представила NVLink у 2016 році, щоб подолати обмеження PCIe у високопродуктивних обчисленнях та ШІ-навантаженнях, забезпечуючи швидшу комунікацію між GPU та уніфікований простір пам'яті. Технологія NVLink значно еволюціонувала, з впровадженням NVLink Switch у 2018 році, досягнувши пропускної здатності 300 ГБ/с між усіма вузлами в топології з 8 GPU, прокладаючи шлях для масштабованих обчислювальних структур. П'яте покоління NVLink, випущене у 2024 році, підтримує 72 GPU з комунікацією між усіма вузлами на швидкості 1 800 ГБ/с, пропонуючи сукупну пропускну здатність 130 ТБ/с — у 800 разів більше, ніж перше покоління. Цей постійний прогрес відповідає зростаючій складності ШІ-моделей та їхнім обчислювальним потребам. NVLink Fusion: налаштування та гнучкість NVLink Fusion розроблений для надання гіперскейлерам доступу до масштабованих технологій NVLink, дозволяючи інтеграцію користувацького кремнію з архітектурою NVIDIA для розгортання напівкастомізованої ШІ-інфраструктури. Технологія включає NVLink SERDES, чіплети, комутатори та архітектуру масштабу стійки, пропонуючи модульне рішення стійки Open Compute Project (OCP) MGX для гнучкості інтеграції. NVLink Fusion підтримує користувацькі конфігурації CPU та XPU, використовуючи Universal Chiplet Interconnect Express (UCIe) IP та інтерфейс, надаючи клієнтам гнучкість для їхніх потреб інтеграції XPU на різних платформах. Для користувацьких налаштувань CPU рекомендується інтеграція NVIDIA NVLink-C2C IP для оптимального підключення GPU та продуктивності. Максимізація доходу ШІ-фабрики Масштабована структура NVLink значно підвищує продуктивність ШІ-фабрики, оптимізуючи баланс між пропускною здатністю...

Продуктивність виведення ШІ за допомогою NVIDIA NVLink та Fusion Drive

2025/08/22 17:30


Rongchai Wang
22 серпня 2025 05:13

Технології NVLink та NVLink Fusion від NVIDIA переосмислюють продуктивність ШІ-інференсу з покращеним масштабуванням та гнучкістю для задоволення експоненціального зростання складності моделей ШІ.





Швидкий розвиток складності моделей штучного інтелекту (ШІ) значно збільшив кількість параметрів від мільйонів до трильйонів, що вимагає безпрецедентних обчислювальних ресурсів. Ця еволюція потребує кластерів GPU для управління навантаженням, як підкреслив Джо ДеЛаере в нещодавньому блозі NVIDIA.

Еволюція та вплив NVLink

NVIDIA представила NVLink у 2016 році, щоб подолати обмеження PCIe у високопродуктивних обчисленнях та робочих навантаженнях ШІ, забезпечуючи швидшу комунікацію між GPU та уніфікований простір пам'яті. Технологія NVLink значно еволюціонувала, з впровадженням NVLink Switch у 2018 році, досягнувши пропускної здатності 300 ГБ/с між усіма вузлами в топології з 8 GPU, прокладаючи шлях для масштабованих обчислювальних структур.

П'яте покоління NVLink, випущене у 2024 році, підтримує 72 GPU з комунікацією між усіма вузлами на швидкості 1 800 ГБ/с, пропонуючи сукупну пропускну здатність 130 ТБ/с — у 800 разів більше, ніж перше покоління. Це постійне вдосконалення відповідає зростаючій складності моделей ШІ та їхнім обчислювальним потребам.

NVLink Fusion: налаштування та гнучкість

NVLink Fusion розроблено для надання гіперскейлерам доступу до технологій масштабування NVLink, дозволяючи інтеграцію користувацького кремнію з архітектурою NVIDIA для розгортання напівкастомізованої інфраструктури ШІ. Технологія включає NVLink SERDES, чіплети, комутатори та архітектуру рівня стійки, пропонуючи модульне рішення стійки Open Compute Project (OCP) MGX для гнучкості інтеграції.

NVLink Fusion підтримує користувацькі конфігурації CPU та XPU, використовуючи IP та інтерфейс Universal Chiplet Interconnect Express (UCIe), надаючи клієнтам гнучкість для їхніх потреб інтеграції XPU на різних платформах. Для користувацьких налаштувань CPU рекомендується інтеграція IP NVIDIA NVLink-C2C для оптимального підключення та продуктивності GPU.

Максимізація доходу ШІ-фабрики

Масштабована структура NVLink значно підвищує продуктивність ШІ-фабрики, оптимізуючи баланс між пропускною здатністю на ват і затримкою. Архітектура стійки NVIDIA з 72 GPU відіграє вирішальну роль у задоволенні потреб обчислень ШІ, забезпечуючи оптимальну продуктивність інференсу для різних випадків використання. Здатність технології масштабувати конфігурації максимізує дохід і продуктивність, навіть коли швидкість NVLink залишається постійною.

Надійна партнерська екосистема

NVLink Fusion отримує переваги від розширеної кремнієвої екосистеми, включаючи партнерів для користувацького кремнію, CPU та IP-технологій, забезпечуючи широку підтримку та швидкі можливості проектування. Мережа системних партнерів та постачальників компонентів інфраструктури дата-центрів вже будує системи NVIDIA GB200 NVL72 та GB300 NVL72, прискорюючи вихід на ринок для користувачів.

Досягнення в ШІ-міркуванні

NVLink представляє значний стрибок у вирішенні потреб обчислень в епоху ШІ-міркування. Використовуючи десятиліття досвіду в технологіях NVLink та відкриті стандарти архітектури стійки OCP MGX, NVLink Fusion надає гіперскейлерам виняткову продуктивність та можливості налаштування.

Джерело зображення: Shutterstock


Джерело: https://blockchain.news/news/nvidia-nvlink-fusion-ai-inference-performance

Відмова від відповідальності: статті, опубліковані на цьому сайті, взяті з відкритих джерел і надаються виключно для інформаційних цілей. Вони не обов'язково відображають погляди MEXC. Всі права залишаються за авторами оригінальних статей. Якщо ви вважаєте, що будь-який контент порушує права третіх осіб, будь ласка, зверніться за адресою [email protected] для його видалення. MEXC не дає жодних гарантій щодо точності, повноти або своєчасності вмісту і не несе відповідальності за будь-які дії, вчинені на основі наданої інформації. Вміст не є фінансовою, юридичною або іншою професійною порадою і не повинен розглядатися як рекомендація або схвалення з боку MEXC.

Вам також може сподобатися