BitcoinWorld
Google AI Chips Dilepaskan: Peluncuran TPU 8t dan 8i untuk Menantang Dominasi Nvidia
Dalam langkah strategis untuk merebut lebih banyak pasar kecerdasan buatan yang sedang booming, Google Cloud mengumumkan peluncuran chip AI kustom generasi kedelapannya pada Rabu, 30 April, di San Francisco, CA. Perusahaan ini mengungkapkan pendekatan bifurkasi dengan memperkenalkan dua chip khusus: TPU 8t untuk pelatihan model AI dan TPU 8i untuk beban kerja inferensi. Perkembangan ini menandai dorongan paling signifikan Google sejauh ini untuk menawarkan alternatif yang powerful dan hemat biaya bagi GPU standar industri Nvidia kepada para enterprise, meskipun raksasa mesin pencari ini menegaskan bahwa kemitraannya dengan pemimpin chip tersebut semakin kuat.
Keputusan Google untuk membagi Tensor Processing Unit (TPU) generasi kedelapannya menjadi dua model yang berbeda merupakan evolusi besar dalam strategi perangkat kerasnya. Secara historis, TPU menangani pelatihan dan inferensi, namun permintaan yang meledak untuk komputasi AI khusus telah mendorong pergeseran arsitektur ini. TPU 8t dirancang khusus untuk proses pelatihan model bahasa besar dan sistem AI lainnya yang sangat intensif secara komputasi. Sebaliknya, TPU 8i dioptimalkan untuk inferensi, yaitu proses yang sedang berjalan untuk menjalankan model yang telah dilatih guna menghasilkan respons terhadap prompt pengguna.
Menurut tolok ukur kinerja Google, chip-chip baru ini memberikan peningkatan substansial dibandingkan pendahulunya. Perusahaan mengklaim TPU 8t menawarkan pelatihan model AI hingga 3x lebih cepat dan performa per dolar 80% lebih baik. Selain itu, rekayasa Google kini memungkinkan lebih dari satu juta TPU bekerja bersama dalam satu kluster besar. Skala ini memungkinkan pelatihan model frontier generasi berikutnya yang sebelumnya tidak layak dilakukan. Manfaat bagi pelanggan cloud adalah daya komputasi yang jauh lebih besar dengan konsumsi energi dan biaya yang lebih rendah.
Pengumuman Google menempatkannya secara tegas dalam tren yang lebih luas dari penyedia cloud besar yang mengembangkan silicon kustom. Amazon Web Services (AWS) memiliki chip Graviton dan Trainium-nya, sementara Microsoft Azure sedang mengembangkan akselerator Maia-nya. Gerakan ini, yang sering disebut "perlombaan chip hyperscaler," didorong oleh keinginan untuk kontrol yang lebih besar atas rantai pasokan, optimasi kinerja untuk stack perangkat lunak tertentu, dan peningkatan margin biaya. Namun, para analis memperingatkan bahwa ini bukan permainan zero-sum melawan Nvidia.
"Narasi 'hyperscaler vs. Nvidia' seringkali dilebih-lebihkan," jelas Patrick Moore, seorang analis pasar chip terkemuka. "Perusahaan-perusahaan ini sedang membangun kapasitas tambahan dan mengoptimalkan untuk ekosistem mereka sendiri. Mereka tidak bertujuan untuk sepenuhnya menggantikan Nvidia, terutama dalam jangka pendek." Moore terkenal karena memprediksi pada tahun 2016 bahwa TPU pertama Google dapat mengancam Nvidia dan Intel, sebuah ramalan yang terbukti prematur karena kapitalisasi pasar Nvidia sejak itu melonjak mendekati $5 triliun. Realitas saat ini lebih bersifat simbiosis. Google, misalnya, telah mengkonfirmasi bahwa pihaknya akan menawarkan chip Vera Rubin Nvidia yang akan datang di cloudnya akhir tahun ini.
Faktanya, Google menekankan kolaborasi berkelanjutannya dengan Nvidia. Dua raksasa teknologi ini secara bersama-sama merancang solusi jaringan komputer untuk membuat sistem berbasis Nvidia berjalan lebih efisien di infrastruktur Google Cloud. Proyek utama melibatkan peningkatan Falcon, teknologi jaringan berbasis perangkat lunak yang dibuat Google dan di-open-source pada tahun 2023. Kolaborasi ini menggarisbawahi wawasan industri yang kritis: pertumbuhan layanan cloud AI memperluas total pasar yang dapat dialamatkan untuk semua silicon berperforma tinggi, baik itu bermerek Nvidia maupun merek penyedia cloud.
Logika finansialnya jelas. Seiring dengan semakin banyaknya enterprise yang memigrasikan beban kerja AI mereka ke cloud, permintaan komputasi meledak. Penyedia cloud kemudian dapat mengarahkan beban kerja tertentu yang dioptimalkan ke chip kustom mereka sambil menawarkan kompatibilitas luas GPU Nvidia untuk yang lainnya. Model hybrid ini memungkinkan mereka meningkatkan profitabilitas pada beberapa beban kerja sambil mempertahankan pilihan pelanggan yang penuh. Bagi Nvidia, setiap aplikasi AI baru yang dihosting di Google Cloud merupakan potensi pelanggan untuk peralatan jaringan, lisensi perangkat lunak, dan dalam banyak kasus, GPU-nya.
Spesifikasi teknis TPU baru Google menunjukkan kesenjangan kinerja yang semakin menyempit dengan GPU kelas terbaik. Fokus pada kinerja per dolar dan efisiensi energi mengatasi dua titik nyeri utama bagi enterprise yang melakukan skalabilitas AI: biaya yang melonjak dan dampak lingkungan. Kemampuan Google untuk menghubungkan lebih dari satu juta TPU juga secara langsung menantang salah satu keunggulan kunci Nvidia—teknologi NVLink terdepan di pasar untuk menghubungkan sejumlah besar GPU.
Keunggulan Utama TPU Baru Google:
Meski demikian, ekosistem Nvidia, khususnya platform perangkat lunak CUDA-nya, tetap menjadi parit yang tangguh. Jutaan pengembang AI dilatih menggunakan CUDA, dan banyak aplikasi dibangun di atasnya. Meskipun chip Google menjalankan framework yang populer, kebutuhan untuk berpotensi mem-port aplikasi menciptakan gesekan. Pertempuran jangka panjang mungkin bukan tentang kecepatan transistor mentah, melainkan tentang platform mana yang menawarkan solusi total paling menarik bagi pengembang dan enterprise.
Peluncuran TPU 8t dan TPU 8i oleh Google menandai momen penting dalam evolusi infrastruktur AI. Ini menunjukkan komitmen serius perusahaan untuk bersaing di arena perangkat keras AI yang penuh risiko tinggi, menawarkan chip AI Google baru yang powerful untuk tugas-tugas khusus kepada para enterprise. Namun, pengumuman ini juga memperkuat sifat industri semikonduktor modern yang kompleks dan kolaboratif. Alih-alih serangan penuh, Google menjalankan strategi dua jalur yang canggih: memajukan silicon miliknya sendiri sambil memperdalam kemitraannya dengan Nvidia. Pendekatan ini memastikan Google Cloud dapat melayani berbagai beban kerja AI seluas mungkin, mulai dari yang dioptimalkan untuk TPU kustomnya hingga yang memerlukan standar universal GPU Nvidia. Para pemenang utama kemungkinan besar adalah para enterprise, yang akan mendapat manfaat dari peningkatan persaingan, lebih banyak pilihan, dan inovasi berkelanjutan dalam kinerja dan biaya.
Q1: Apa perbedaan antara chip TPU 8t dan TPU 8i Google?
TPU 8t dirancang khusus untuk pelatihan model AI—proses pengajaran model menggunakan kumpulan data yang sangat besar. TPU 8i dioptimalkan untuk inferensi, yaitu proses menggunakan model yang telah dilatih untuk membuat prediksi atau menghasilkan respons secara real-time.
Q2: Apakah Google Cloud akan berhenti menawarkan GPU Nvidia?
Tidak. Google telah secara eksplisit menyatakan bahwa pihaknya tidak menggantikan Nvidia. Perusahaan mengkonfirmasi akan menawarkan GPU Vera Rubin generasi berikutnya dari Nvidia di cloudnya akhir tahun ini dan secara aktif berkolaborasi dengan Nvidia dalam teknologi jaringan.
Q3: Bagaimana chip AI baru Google dibandingkan dengan versi TPU sebelumnya?
Google mengklaim TPU generasi kedelapan yang baru menawarkan kecepatan pelatihan hingga 3x lebih cepat dan peningkatan kinerja per dolar sebesar 80% dibandingkan generasi sebelumnya. Chip-chip ini juga mendukung kluster lebih dari satu juta chip, memungkinkan pelatihan model dalam skala yang lebih besar.
Q4: Mengapa penyedia cloud seperti Google membangun chip AI mereka sendiri?
Penyedia cloud mengembangkan silicon kustom untuk mengoptimalkan kinerja perangkat lunak dan layanan spesifik mereka, mendapatkan kontrol lebih besar atas rantai pasokan, meningkatkan efisiensi biaya, dan membedakan penawaran mereka di pasar yang kompetitif.
Q5: Apa artinya ini bagi masa depan Nvidia?
Meskipun chip kustom dari hyperscaler merepresentasikan persaingan, pertumbuhan keseluruhan pasar AI memperluas permintaan untuk semua komputasi berperforma tinggi. Ekosistem perangkat lunak Nvidia yang kuat (CUDA) dan inovasi yang terus berlanjut berarti perusahaan ini kemungkinan akan tetap menjadi kekuatan dominan, bahkan saat berkolaborasi dengan perusahaan yang membangun silicon alternatif.
Postingan ini Google AI Chips Dilepaskan: Peluncuran TPU 8t dan 8i untuk Menantang Dominasi Nvidia pertama kali muncul di BitcoinWorld.


