Alibaba Group Holding Limited ditutup pada $167,05, menandai kenaikan 1,19%, setelah terobosan besar dalam infrastruktur AI.
Alibaba Group Holding Limited, BABA
Perusahaan ini memperkenalkan solusi penggabungan komputasi yang memangkas penggunaan GPU Nvidia sebesar 82% dalam operasi penyajian model. Kemajuan ini memposisikan Alibaba Cloud di depan dalam perlombaan untuk mengoptimalkan penerapan AI dalam skala besar.
Alibaba Cloud, divisi komputasi awan dari perusahaan berbasis Hangzhou ini, menerapkan sistem baru bernama Aegaeon untuk meningkatkan efisiensi AI. Solusi ini memungkinkan satu GPU Nvidia H20 untuk melayani hingga tujuh model bahasa besar secara bersamaan. Perubahan ini mengurangi penggunaan GPU dari 1.192 menjadi hanya 213 unit selama pengujian internal.
Aegaeon bekerja dengan melakukan penskalaan otomatis di tingkat token selama inferensi model di berbagai beban kerja AI yang berjalan bersamaan. Strategi ini memungkinkan alokasi ulang sumber daya secara dinamis, memungkinkan GPU yang sama untuk beralih antar model di tengah pemrosesan. Ini juga mengurangi latensi dalam tugas pergantian model sebesar 97%.
Solusi ini telah diuji beta selama lebih dari tiga bulan di pasar Bailian Alibaba Cloud. Sistem ini menangani puluhan model dengan parameter hingga 72 miliar tanpa penurunan layanan. Aegaeon kini telah secara resmi diterapkan di pasar model Alibaba, yang melayani model Qwen miliknya.
Alibaba Cloud menemukan bahwa hanya sejumlah kecil model yang sering digunakan dalam tugas AI dunia nyata. Meskipun demikian, banyak GPU dialokasikan untuk model yang jarang dipanggil, mengakibatkan pemanfaatan sumber daya yang rendah. Data menunjukkan bahwa 17,7% GPU hanya melayani 1,35% dari total permintaan inferensi.
Dengan Aegaeon, perusahaan mengatasi ketidakseimbangan ini melalui strategi penggabungan dan penskalaan cerdas. Sistem ini memastikan penggunaan GPU yang konsisten dan mencegah pemrosesan idle di model yang jarang digunakan. Alibaba mencapai throughput yang lebih tinggi dan meningkatkan efisiensi perangkat keras untuk penerapan perusahaan.
Peneliti dari Universitas Peking dan Alibaba Cloud bersama-sama menulis makalah teknis yang merinci inovasi ini, dipresentasikan di SOSP 2025 di Korea Selatan. Studi tersebut menekankan bahwa melayani beban kerja bersamaan dengan metode GPU tradisional menimbulkan biaya yang tidak perlu. Terobosan ini secara langsung mendukung tujuan China untuk modernisasi infrastruktur AI di bawah kendala sumber daya.
Nvidia mengembangkan GPU H20 khusus untuk inferensi AI di China, mematuhi pembatasan ekspor A.S. Namun, regulator China baru-baru ini meluncurkan penyelidikan terhadap kemungkinan kerentanan keamanan backdoor dalam chip tersebut. Pengawasan ini telah mempengaruhi posisi pasar chip dan adopsinya di China.
Perusahaan China seperti Huawei dan Cambricon mempercepat pengembangan GPU domestik untuk mengurangi ketergantungan asing. CEO Nvidia menyatakan bahwa pangsa pasar perusahaan untuk chip AI canggih di China telah turun menjadi nol. Tren ini mendorong pemain lokal untuk berinovasi dan melokalisasi rantai pasokan perangkat keras AI.
Pendekatan baru Alibaba memperkuat posisi pasarnya sambil menyelaraskan dengan strategi nasional untuk kemandirian teknologi. Dengan mengurangi ketergantungan pada chip A.S., Alibaba mendapatkan pijakan yang lebih kuat dalam ekosistem AI China yang berkembang. Kenaikan saham mencerminkan kepercayaan pada penghematan biaya dan skalabilitas yang dipimpin teknologi.
Postingan Alibaba Group Holding Limited (BABA) saham melonjak karena teknologi penggabungan AI baru memangkas penggunaan GPU Nvidia sebesar 82% pertama kali muncul di CoinCentral.

