Performa Inferensi AI NVIDIA NVLink dan Fusion Drive

Rongchai Wang
22 Agu 2025 05:13

Teknologi NVLink dan NVLink Fusion dari NVIDIA mendefinisikan ulang performa inferensi AI dengan skalabilitas dan fleksibilitas yang ditingkatkan untuk memenuhi pertumbuhan eksponensial dalam kompleksitas model AI.

Kemajuan pesat dalam kompleksitas model kecerdasan buatan (AI) telah secara signifikan meningkatkan jumlah parameter dari jutaan menjadi triliunan, memerlukan sumber daya komputasi yang belum pernah terjadi sebelumnya. Evolusi ini membutuhkan kluster GPU untuk mengelola beban, seperti yang disoroti oleh Joe DeLaere dalam postingan blog NVIDIA baru-baru ini.

Evolusi dan Dampak NVLink

NVIDIA memperkenalkan NVLink pada 2016 untuk melampaui keterbatasan PCIe dalam komputasi kinerja tinggi dan beban kerja AI, memfasilitasi komunikasi GPU-ke-GPU yang lebih cepat dan ruang memori terpadu. Teknologi NVLink telah berkembang secara signifikan, dengan pengenalan NVLink Switch pada 2018 yang mencapai bandwidth all-to-all 300 GB/s dalam topologi 8-GPU, membuka jalan bagi fabrik komputasi skala-atas.

NVLink generasi kelima, yang dirilis pada 2024, mendukung 72 GPU dengan komunikasi all-to-all pada 1.800 GB/s, menawarkan bandwidth agregat 130 TB/s—800 kali lebih banyak dari generasi pertama. Kemajuan berkelanjutan ini sejalan dengan kompleksitas model AI yang terus berkembang dan tuntutan komputasinya.

NVLink Fusion: Kustomisasi dan Fleksibilitas

NVLink Fusion dirancang untuk memberikan hyperscaler akses ke teknologi skala-atas NVLink, memungkinkan integrasi silikon kustom dengan arsitektur NVIDIA untuk penerapan infrastruktur AI semi-kustom. Teknologi ini mencakup NVLink SERDES, chiplet, switch, dan arsitektur skala-rack, menawarkan solusi rack Open Compute Project (OCP) MGX modular untuk fleksibilitas integrasi.

NVLink Fusion mendukung konfigurasi CPU dan XPU kustom menggunakan IP dan antarmuka Universal Chiplet Interconnect Express (UCIe), memberikan pelanggan fleksibilitas untuk kebutuhan integrasi XPU mereka di berbagai platform. Untuk pengaturan CPU kustom, integrasi IP NVIDIA NVLink-C2C direkomendasikan untuk konektivitas dan performa GPU yang optimal.

Memaksimalkan Pendapatan Pabrik AI

Fabrik skala-atas NVLink secara signifikan meningkatkan produktivitas pabrik AI dengan mengoptimalkan keseimbangan antara throughput per watt dan latensi. Arsitektur rack 72-GPU NVIDIA memainkan peran penting dalam memenuhi kebutuhan komputasi AI, memungkinkan performa inferensi optimal di berbagai kasus penggunaan. Kemampuan teknologi untuk meningkatkan konfigurasi memaksimalkan pendapatan dan performa, bahkan ketika kecepatan NVLink konstan.

Ekosistem Mitra yang Kuat

NVLink Fusion mendapat manfaat dari ekosistem silikon yang luas, termasuk mitra untuk silikon kustom, CPU, dan teknologi IP, memastikan dukungan luas dan kemampuan design-in yang cepat. Jaringan mitra sistem dan penyedia komponen infrastruktur pusat data sudah membangun sistem NVIDIA GB200 NVL72 dan GB300 NVL72, mempercepat waktu adopter untuk memasuki pasar.

Kemajuan dalam Penalaran AI

NVLink mewakili lompatan signifikan dalam mengatasi permintaan komputasi di era penalaran AI. Dengan memanfaatkan satu dekade keahlian dalam teknologi NVLink dan standar terbuka arsitektur rack OCP MGX, NVLink Fusion memberdayakan hyperscaler dengan performa dan opsi kustomisasi yang luar biasa.

Sumber gambar: Shutterstock

Sumber: https://blockchain.news/news/nvidia-nvlink-fusion-ai-inference-performance

Performa Inferensi AI NVIDIA NVLink dan Fusion Drive

Evolusi dan Dampak NVLink

NVLink Fusion: Kustomisasi dan Fleksibilitas

Memaksimalkan Pendapatan Pabrik AI

Ekosistem Mitra yang Kuat

Kemajuan dalam Penalaran AI

Anda Mungkin Juga Menyukai

Bukan celah hukum: Kontrol ekspor AI Singapura memungkinkan Tiongkok mengakses AI AS secara legal

Futures Perpetual Bitcoin: Rasio Long/Short di Bursa Teratas

Ekosistem Token LAB: Panduan Platform Perdagangan Multi-Rantai & Imbalan

Berita yang Sedang Tren

Pembaruan Pagi NordFX — 10 Juli 2026

Neraca Perdagangan Jerman Melonjak ke €19,1 Miliar pada Mei, Secara Nyaman Melampaui Prakiraan

Arbitrum Mengumumkan Sepuluh Tim Inovatif — Dan Mengapa Ini Bukan Sekadar Hype

ARK Invest milik Cathie Wood Membeli Saham Circle Senilai $13,7 Juta Sambil Menjual Saham Robinhood

Wajah perawatan lansia yang berubah di Malaysia — Sayed Mohammad Reza Yamani Sayed Umar

Berita Live 24/7

Bacaan Cepat

Efek Minggu Pertama MiCA Setelah Implementasi Penuh Membentuk Kembali Pasar Crypto Eropa

AMD Q2 2026 Pratinjau Pendapatan AI Chips dan Harapan Bisnis PC

Proyek Rantai Robinhood Terbaik untuk Ditonton di 2026 Dari Arcus ke CASHCAT

Perampokan Tidak Membangun Rantai Lain Ini Membangun Kembali Pialang

Perdamaian AS Iran Runtuh saat Serangan Tanker Meningkatkan Risiko Harga Minyak

Harga Kripto