Postingan NVIDIA NVLink dan Fusion Drive Performa Inferensi AI muncul di BitcoinEthereumNews.com. Rongchai Wang 22 Agu 2025 05:13 Teknologi NVLink dan NVLink Fusion dari NVIDIA mendefinisikan ulang performa inferensi AI dengan skalabilitas dan fleksibilitas yang ditingkatkan untuk memenuhi pertumbuhan eksponensial dalam kompleksitas model AI. Kemajuan pesat dalam kompleksitas model kecerdasan buatan (AI) telah secara signifikan meningkatkan jumlah parameter dari jutaan hingga triliunan, memerlukan sumber daya komputasi yang belum pernah ada sebelumnya. Evolusi ini membutuhkan kluster GPU untuk mengelola beban, seperti yang disoroti oleh Joe DeLaere dalam postingan blog NVIDIA baru-baru ini. Evolusi dan Dampak NVLink NVIDIA memperkenalkan NVLink pada 2016 untuk melampaui keterbatasan PCIe dalam komputasi kinerja tinggi dan beban kerja AI, memfasilitasi komunikasi GPU-ke-GPU yang lebih cepat dan ruang memori terpadu. Teknologi NVLink telah berkembang secara signifikan, dengan pengenalan NVLink Switch pada 2018 mencapai bandwidth all-to-all 300 GB/s dalam topologi 8-GPU, membuka jalan bagi fabric komputasi skala-up. NVLink generasi kelima, dirilis pada 2024, mendukung 72 GPU dengan komunikasi all-to-all pada 1.800 GB/s, menawarkan bandwidth agregat 130 TB/s—800 kali lebih banyak dari generasi pertama. Kemajuan berkelanjutan ini selaras dengan kompleksitas model AI yang terus berkembang dan tuntutan komputasinya. NVLink Fusion: Kustomisasi dan Fleksibilitas NVLink Fusion dirancang untuk memberikan hyperscaler akses ke teknologi skala-up NVLink, memungkinkan integrasi silikon kustom dengan arsitektur NVIDIA untuk penerapan infrastruktur AI semi-kustom. Teknologi ini mencakup NVLink SERDES, chiplet, switch, dan arsitektur skala-rack, menawarkan solusi rack Open Compute Project (OCP) MGX modular untuk fleksibilitas integrasi. NVLink Fusion mendukung konfigurasi CPU dan XPU kustom menggunakan IP dan antarmuka Universal Chiplet Interconnect Express (UCIe), memberikan pelanggan fleksibilitas untuk kebutuhan integrasi XPU mereka di berbagai platform. Untuk pengaturan CPU kustom, integrasi IP NVIDIA NVLink-C2C direkomendasikan untuk konektivitas dan performa GPU yang optimal. Memaksimalkan Pendapatan Pabrik AI Fabric skala-up NVLink secara signifikan meningkatkan produktivitas pabrik AI dengan mengoptimalkan keseimbangan antara throughput...Postingan NVIDIA NVLink dan Fusion Drive Performa Inferensi AI muncul di BitcoinEthereumNews.com. Rongchai Wang 22 Agu 2025 05:13 Teknologi NVLink dan NVLink Fusion dari NVIDIA mendefinisikan ulang performa inferensi AI dengan skalabilitas dan fleksibilitas yang ditingkatkan untuk memenuhi pertumbuhan eksponensial dalam kompleksitas model AI. Kemajuan pesat dalam kompleksitas model kecerdasan buatan (AI) telah secara signifikan meningkatkan jumlah parameter dari jutaan hingga triliunan, memerlukan sumber daya komputasi yang belum pernah ada sebelumnya. Evolusi ini membutuhkan kluster GPU untuk mengelola beban, seperti yang disoroti oleh Joe DeLaere dalam postingan blog NVIDIA baru-baru ini. Evolusi dan Dampak NVLink NVIDIA memperkenalkan NVLink pada 2016 untuk melampaui keterbatasan PCIe dalam komputasi kinerja tinggi dan beban kerja AI, memfasilitasi komunikasi GPU-ke-GPU yang lebih cepat dan ruang memori terpadu. Teknologi NVLink telah berkembang secara signifikan, dengan pengenalan NVLink Switch pada 2018 mencapai bandwidth all-to-all 300 GB/s dalam topologi 8-GPU, membuka jalan bagi fabric komputasi skala-up. NVLink generasi kelima, dirilis pada 2024, mendukung 72 GPU dengan komunikasi all-to-all pada 1.800 GB/s, menawarkan bandwidth agregat 130 TB/s—800 kali lebih banyak dari generasi pertama. Kemajuan berkelanjutan ini selaras dengan kompleksitas model AI yang terus berkembang dan tuntutan komputasinya. NVLink Fusion: Kustomisasi dan Fleksibilitas NVLink Fusion dirancang untuk memberikan hyperscaler akses ke teknologi skala-up NVLink, memungkinkan integrasi silikon kustom dengan arsitektur NVIDIA untuk penerapan infrastruktur AI semi-kustom. Teknologi ini mencakup NVLink SERDES, chiplet, switch, dan arsitektur skala-rack, menawarkan solusi rack Open Compute Project (OCP) MGX modular untuk fleksibilitas integrasi. NVLink Fusion mendukung konfigurasi CPU dan XPU kustom menggunakan IP dan antarmuka Universal Chiplet Interconnect Express (UCIe), memberikan pelanggan fleksibilitas untuk kebutuhan integrasi XPU mereka di berbagai platform. Untuk pengaturan CPU kustom, integrasi IP NVIDIA NVLink-C2C direkomendasikan untuk konektivitas dan performa GPU yang optimal. Memaksimalkan Pendapatan Pabrik AI Fabric skala-up NVLink secara signifikan meningkatkan produktivitas pabrik AI dengan mengoptimalkan keseimbangan antara throughput...

Performa Inferensi AI NVIDIA NVLink dan Fusion Drive

2025/08/22 17:30


Rongchai Wang
22 Agu 2025 05:13

Teknologi NVLink dan NVLink Fusion dari NVIDIA mendefinisikan ulang performa inferensi AI dengan skalabilitas dan fleksibilitas yang ditingkatkan untuk memenuhi pertumbuhan eksponensial dalam kompleksitas model AI.





Kemajuan pesat dalam kompleksitas model kecerdasan buatan (AI) telah secara signifikan meningkatkan jumlah parameter dari jutaan menjadi triliunan, memerlukan sumber daya komputasi yang belum pernah terjadi sebelumnya. Evolusi ini membutuhkan kluster GPU untuk mengelola beban, seperti yang disoroti oleh Joe DeLaere dalam postingan blog NVIDIA baru-baru ini.

Evolusi dan Dampak NVLink

NVIDIA memperkenalkan NVLink pada 2016 untuk melampaui keterbatasan PCIe dalam komputasi kinerja tinggi dan beban kerja AI, memfasilitasi komunikasi GPU-ke-GPU yang lebih cepat dan ruang memori terpadu. Teknologi NVLink telah berkembang secara signifikan, dengan pengenalan NVLink Switch pada 2018 yang mencapai bandwidth all-to-all 300 GB/s dalam topologi 8-GPU, membuka jalan bagi fabrik komputasi skala-atas.

NVLink generasi kelima, yang dirilis pada 2024, mendukung 72 GPU dengan komunikasi all-to-all pada 1.800 GB/s, menawarkan bandwidth agregat 130 TB/s—800 kali lebih banyak dari generasi pertama. Kemajuan berkelanjutan ini sejalan dengan kompleksitas model AI yang terus berkembang dan tuntutan komputasinya.

NVLink Fusion: Kustomisasi dan Fleksibilitas

NVLink Fusion dirancang untuk memberikan hyperscaler akses ke teknologi skala-atas NVLink, memungkinkan integrasi silikon kustom dengan arsitektur NVIDIA untuk penerapan infrastruktur AI semi-kustom. Teknologi ini mencakup NVLink SERDES, chiplet, switch, dan arsitektur skala-rack, menawarkan solusi rack Open Compute Project (OCP) MGX modular untuk fleksibilitas integrasi.

NVLink Fusion mendukung konfigurasi CPU dan XPU kustom menggunakan IP dan antarmuka Universal Chiplet Interconnect Express (UCIe), memberikan pelanggan fleksibilitas untuk kebutuhan integrasi XPU mereka di berbagai platform. Untuk pengaturan CPU kustom, integrasi IP NVIDIA NVLink-C2C direkomendasikan untuk konektivitas dan performa GPU yang optimal.

Memaksimalkan Pendapatan Pabrik AI

Fabrik skala-atas NVLink secara signifikan meningkatkan produktivitas pabrik AI dengan mengoptimalkan keseimbangan antara throughput per watt dan latensi. Arsitektur rack 72-GPU NVIDIA memainkan peran penting dalam memenuhi kebutuhan komputasi AI, memungkinkan performa inferensi optimal di berbagai kasus penggunaan. Kemampuan teknologi untuk meningkatkan konfigurasi memaksimalkan pendapatan dan performa, bahkan ketika kecepatan NVLink konstan.

Ekosistem Mitra yang Kuat

NVLink Fusion mendapat manfaat dari ekosistem silikon yang luas, termasuk mitra untuk silikon kustom, CPU, dan teknologi IP, memastikan dukungan luas dan kemampuan design-in yang cepat. Jaringan mitra sistem dan penyedia komponen infrastruktur pusat data sudah membangun sistem NVIDIA GB200 NVL72 dan GB300 NVL72, mempercepat waktu adopter untuk memasuki pasar.

Kemajuan dalam Penalaran AI

NVLink mewakili lompatan signifikan dalam mengatasi permintaan komputasi di era penalaran AI. Dengan memanfaatkan satu dekade keahlian dalam teknologi NVLink dan standar terbuka arsitektur rack OCP MGX, NVLink Fusion memberdayakan hyperscaler dengan performa dan opsi kustomisasi yang luar biasa.

Sumber gambar: Shutterstock


Sumber: https://blockchain.news/news/nvidia-nvlink-fusion-ai-inference-performance

Penafian: Artikel yang diterbitkan ulang di situs web ini bersumber dari platform publik dan disediakan hanya sebagai informasi. Artikel tersebut belum tentu mencerminkan pandangan MEXC. Seluruh hak cipta tetap dimiliki oleh penulis aslinya. Jika Anda meyakini bahwa ada konten yang melanggar hak pihak ketiga, silakan hubungi [email protected] agar konten tersebut dihapus. MEXC tidak menjamin keakuratan, kelengkapan, atau keaktualan konten dan tidak bertanggung jawab atas tindakan apa pun yang dilakukan berdasarkan informasi yang diberikan. Konten tersebut bukan merupakan saran keuangan, hukum, atau profesional lainnya, juga tidak boleh dianggap sebagai rekomendasi atau dukungan oleh MEXC.