TLDR Alibaba memangkas penggunaan GPU sebesar 82% dengan Aegaeon, mendorong AI dalam skala besar. Aegaeon mengurangi latensi pergantian model AI sebesar 97%, meningkatkan kinerja. Satu GPU Nvidia H20 kini menjalankan 7 LLM sekaligus dalam peningkatan AI Alibaba. Alibaba Cloud meningkatkan efisiensi GPU dengan penskalaan otomatis tingkat token. Aegaeon mendukung tujuan AI China sambil mengurangi ketergantungan pada chip Nvidia. [...] Postingan Saham Alibaba Group Holding Limited (BABA) melonjak karena teknologi pooling AI baru memangkas penggunaan GPU Nvidia sebesar 82% pertama kali muncul di CoinCentral.TLDR Alibaba memangkas penggunaan GPU sebesar 82% dengan Aegaeon, mendorong AI dalam skala besar. Aegaeon mengurangi latensi pergantian model AI sebesar 97%, meningkatkan kinerja. Satu GPU Nvidia H20 kini menjalankan 7 LLM sekaligus dalam peningkatan AI Alibaba. Alibaba Cloud meningkatkan efisiensi GPU dengan penskalaan otomatis tingkat token. Aegaeon mendukung tujuan AI China sambil mengurangi ketergantungan pada chip Nvidia. [...] Postingan Saham Alibaba Group Holding Limited (BABA) melonjak karena teknologi pooling AI baru memangkas penggunaan GPU Nvidia sebesar 82% pertama kali muncul di CoinCentral.

Saham Alibaba Group Holding Limited (BABA) melonjak saat teknologi pooling AI baru mengurangi penggunaan GPU Nvidia sebesar 82%

TLDR

  • Alibaba memangkas penggunaan GPU sebesar 82% dengan Aegaeon, mendorong AI pada skala besar.
  • Aegaeon mengurangi latensi pergantian model AI sebesar 97%, meningkatkan kinerja.
  • Satu GPU Nvidia H20 kini menjalankan 7 LLM sekaligus dalam peningkatan AI Alibaba.
  • Alibaba Cloud meningkatkan efisiensi GPU dengan penskalaan otomatis tingkat token.
  • Aegaeon mendukung tujuan AI China sambil mengurangi ketergantungan pada chip Nvidia.

Alibaba Group Holding Limited ditutup pada $167,05, menandai kenaikan 1,19%, setelah terobosan besar dalam infrastruktur AI.

BABA Stock Card

Alibaba Group Holding Limited, BABA

Perusahaan ini memperkenalkan solusi penggabungan komputasi yang memangkas penggunaan GPU Nvidia sebesar 82% dalam operasi penyajian model. Kemajuan ini memposisikan Alibaba Cloud di depan dalam perlombaan untuk mengoptimalkan penerapan AI dalam skala besar.

Aegaeon meningkatkan efisiensi, mengurangi ketergantungan GPU

Alibaba Cloud, divisi komputasi awan dari perusahaan berbasis Hangzhou ini, menerapkan sistem baru bernama Aegaeon untuk meningkatkan efisiensi AI. Solusi ini memungkinkan satu GPU Nvidia H20 untuk melayani hingga tujuh model bahasa besar secara bersamaan. Perubahan ini mengurangi penggunaan GPU dari 1.192 menjadi hanya 213 unit selama pengujian internal.

Aegaeon bekerja dengan melakukan penskalaan otomatis di tingkat token selama inferensi model di berbagai beban kerja AI yang berjalan bersamaan. Strategi ini memungkinkan alokasi ulang sumber daya secara dinamis, memungkinkan GPU yang sama untuk beralih antar model di tengah pemrosesan. Ini juga mengurangi latensi dalam tugas pergantian model sebesar 97%.

Solusi ini telah diuji beta selama lebih dari tiga bulan di pasar Bailian Alibaba Cloud. Sistem ini menangani puluhan model dengan parameter hingga 72 miliar tanpa penurunan layanan. Aegaeon kini telah secara resmi diterapkan di pasar model Alibaba, yang melayani model Qwen miliknya.

Wawasan pasar model dan optimasi kinerja

Alibaba Cloud menemukan bahwa hanya sejumlah kecil model yang sering digunakan dalam tugas AI dunia nyata. Meskipun demikian, banyak GPU dialokasikan untuk model yang jarang dipanggil, mengakibatkan pemanfaatan sumber daya yang rendah. Data menunjukkan bahwa 17,7% GPU hanya melayani 1,35% dari total permintaan inferensi.

Dengan Aegaeon, perusahaan mengatasi ketidakseimbangan ini melalui strategi penggabungan dan penskalaan cerdas. Sistem ini memastikan penggunaan GPU yang konsisten dan mencegah pemrosesan idle di model yang jarang digunakan. Alibaba mencapai throughput yang lebih tinggi dan meningkatkan efisiensi perangkat keras untuk penerapan perusahaan.

Peneliti dari Universitas Peking dan Alibaba Cloud bersama-sama menulis makalah teknis yang merinci inovasi ini, dipresentasikan di SOSP 2025 di Korea Selatan. Studi tersebut menekankan bahwa melayani beban kerja bersamaan dengan metode GPU tradisional menimbulkan biaya yang tidak perlu. Terobosan ini secara langsung mendukung tujuan China untuk modernisasi infrastruktur AI di bawah kendala sumber daya.

Peran Nvidia dan pergeseran strategi chip China

Nvidia mengembangkan GPU H20 khusus untuk inferensi AI di China, mematuhi pembatasan ekspor A.S. Namun, regulator China baru-baru ini meluncurkan penyelidikan terhadap kemungkinan kerentanan keamanan backdoor dalam chip tersebut. Pengawasan ini telah mempengaruhi posisi pasar chip dan adopsinya di China.

Perusahaan China seperti Huawei dan Cambricon mempercepat pengembangan GPU domestik untuk mengurangi ketergantungan asing. CEO Nvidia menyatakan bahwa pangsa pasar perusahaan untuk chip AI canggih di China telah turun menjadi nol. Tren ini mendorong pemain lokal untuk berinovasi dan melokalisasi rantai pasokan perangkat keras AI.

Pendekatan baru Alibaba memperkuat posisi pasarnya sambil menyelaraskan dengan strategi nasional untuk kemandirian teknologi. Dengan mengurangi ketergantungan pada chip A.S., Alibaba mendapatkan pijakan yang lebih kuat dalam ekosistem AI China yang berkembang. Kenaikan saham mencerminkan kepercayaan pada penghematan biaya dan skalabilitas yang dipimpin teknologi.

 

Postingan Alibaba Group Holding Limited (BABA) saham melonjak karena teknologi penggabungan AI baru memangkas penggunaan GPU Nvidia sebesar 82% pertama kali muncul di CoinCentral.

Peluang Pasar
Logo Sleepless AI
Harga Sleepless AI(AI)
$0.03493
$0.03493$0.03493
-3.72%
USD
Grafik Harga Live Sleepless AI (AI)
Penafian: Artikel yang diterbitkan ulang di situs web ini bersumber dari platform publik dan disediakan hanya sebagai informasi. Artikel tersebut belum tentu mencerminkan pandangan MEXC. Seluruh hak cipta tetap dimiliki oleh penulis aslinya. Jika Anda meyakini bahwa ada konten yang melanggar hak pihak ketiga, silakan hubungi [email protected] agar konten tersebut dihapus. MEXC tidak menjamin keakuratan, kelengkapan, atau keaktualan konten dan tidak bertanggung jawab atas tindakan apa pun yang dilakukan berdasarkan informasi yang diberikan. Konten tersebut bukan merupakan saran keuangan, hukum, atau profesional lainnya, juga tidak boleh dianggap sebagai rekomendasi atau dukungan oleh MEXC.