NVIDIA baru saja merilis sistem GB300 NVL72 terbarunya. Sistem ini dapat menangani pekerjaan 50 kali lebih banyak per megawatt listrik dibandingkan dengan platform Hopper yang lebih lama. Itu berarti biaya turun 35 kali lipat untuk setiap bagian informasi yang diproses.
Signal65 melakukan pengujian terpisah pada GB200 NVL72 dan menemukan bahwa sistem ini memproses informasi lebih dari 10 kali lipat per watt, memangkas biaya menjadi sepersepuluh dari sebelumnya.
Peningkatan terus berlanjut. Peningkatan library TensorRT-LLM NVIDIA saja memberikan peningkatan performa lima kali lipat pada GB200 hanya dalam empat bulan untuk tugas yang memerlukan respons instan. Tim yang mengerjakan alat Dynamo, Mooncake, dan SGLang mendorong efisiensi lebih tinggi lagi.
Alat AI ini akan rusak jika ada waktu tunda atau tidak dapat mengingat konteks yang cukup. Perusahaan membutuhkan alat-alat ini untuk benar-benar bekerja dalam situasi bisnis nyata, bukan hanya demo.
Alat kecerdasan buatan yang menulis kode dan bekerja sebagai pembantu digital kini menyumbang hampir setengah dari semua pencarian terkait AI, naik dari hanya 11% setahun yang lalu.
Angka-angka ini berasal dari laporan State of Inference OpenRouter dan menunjukkan seberapa cepat hal-hal berubah di ruang ini.
Lonjakan mendadak ini membuat perusahaan berebut membangun perangkat keras yang dapat mengimbangi. Asisten AI ini perlu merespons dengan segera dan mengingat konteks dari seluruh proyek perangkat lunak, yang memberikan tuntutan serius pada daya komputasi.
Ledakan pasar memicu pertarungan raksasa teknologi untuk dominasi
Uang yang terlibat sangat besar. Pasar agen AI bernilai 4,92 miliar dolar pada tahun 2024. Perkiraan menempatkannya di 6,016 miliar dolar untuk tahun 2025, kemudian membengkak menjadi 44,97 miliar dolar pada tahun 2035. Itu pertumbuhan 22,28% setiap tahun untuk dekade berikutnya. Bank, rumah sakit, toko, dan pabrik adalah pengadopsi awal.
Bisnis memasukkan agen-agen ini ke dalam sistem manajemen pelanggan, alat perencanaan, dan pengaturan keamanan untuk menghemat uang dan menyelesaikan lebih banyak pekerjaan. Apa yang dimulai sebagai teknologi opsional menjadi infrastruktur dasar.
Seperti dilaporkan oleh Cryptopolitan, Alibaba baru saja meluncurkan Qwen3.5 yang menargetkan pasar China, mengklaim biaya pemrosesan 60% lebih rendah dari sebelumnya. Model ini dapat melihat layar dan melakukan tugas di ponsel dan komputer. Ini berhadapan langsung dengan aplikasi Doubao ByteDance, dan ada pembaruan DeepSeek yang akan datang juga.
OpenAI mempekerjakan Peter Steinberger pada tanggal 15. Dia membangun OpenClaw, agen AI sumber terbuka. CEO Sam Altman mengatakan Steinberger akan memimpin pekerjaan pada agen pribadi generasi berikutnya dan menyebutnya sebagai jenius dengan ide-ide hebat tentang asisten pintar yang dapat menyelesaikan hal-hal yang berguna.
Krisis talenta yang tidak bisa dipecahkan siapa pun
94% pemimpin bisnis mengatakan mereka kekurangan keterampilan AI. Pada tahun 2028, 44% memperkirakan masih akan mengalami kekurangan 20 hingga 40%. Workera mengatakan kesenjangan ini dapat merugikan ekonomi global 5,5 triliun dolar pada tahun 2026 dari produk yang tertunda, masalah kualitas, dan penjualan yang hilang.
Saat ini permintaan untuk talenta AI mengalahkan pasokan 3,2 banding satu di seluruh dunia. Pekerjaan AI membayar 67% lebih banyak daripada posisi perangkat lunak biasa. Namun 85% pekerja kantoran mempelajari hal ini di waktu mereka sendiri, dan 83% mengatakan mereka sebagian besar mengajar diri sendiri alih-alih mendapatkan pelatihan formal.
Ketika perusahaan membeli alat AI dari vendor khusus, mereka berhasil 67% dari waktu. Pembangunan internal hanya bekerja sekitar sepertiga sesering itu.
Salesforce melihat pertumbuhan agen 119% di awal tahun 2025 dan melewati 500 juta dolar dalam pendapatan berulang untuk produk-produk ini. Mereka menambahkan 6.000 pelanggan perusahaan dalam tiga bulan.
Bisnis mungkin akan membeli solusi alih-alih membangunnya. Itu menunjukkan pasar terkonsentrasi di sekitar beberapa pemain besar yang dapat memberikan apa yang benar-benar berhasil.
Sumber: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/


