ElevenLabs Keluar dari Beta dengan Model Suara AI 28 Bahasa Setelah Valuasi $11 Miliar
Darius Baruo 06 Mar 2026 19:27
ElevenLabs meluncurkan Eleven Multilingual v2 yang mendukung 28 bahasa, secara resmi keluar dari fase beta beberapa minggu setelah mengamankan Series D $500 juta dengan valuasi $11 miliar.
ElevenLabs secara resmi telah keluar dari beta dan meluncurkan Eleven Multilingual v2, model ucapan AI dasar yang mendukung 28 bahasa. Peluncuran ini datang hanya beberapa minggu setelah perusahaan menutup putaran Series D $500 juta yang menilainya sebesar $11 miliar.
Model baru ini secara otomatis mengidentifikasi teks tertulis dalam hampir 30 bahasa dan menghasilkan apa yang perusahaan gambarkan sebagai ucapan yang "kaya emosi". Lebih penting lagi bagi pembuat konten, karakteristik suara—termasuk aksen asli—tetap konsisten di semua bahasa yang didukung. Satu suara kloning sekarang dapat menghasilkan konten dalam bahasa Tionghoa, Jepang, Arab, Korea, dan 24 bahasa lainnya tanpa kehilangan kualitas khasnya.
18 Bulan Penelitian Membuahkan Hasil
ElevenLabs menghabiskan satu setengah tahun membangun mekanisme baru untuk memahami konteks dan menyampaikan emosi dalam ucapan yang disintesis. Waktunya bukan kebetulan. Dengan pendapatan berulang tahunan $330 juta yang dilaporkan untuk tahun 2025 dan lebih dari 1 juta pengguna di platform, perusahaan membutuhkan infrastruktur yang dapat berkembang secara global.
Penskalaan tersebut mendapat dorongan bulan lalu ketika ElevenLabs memperluas kemitraan Google Cloud-nya, mendapatkan akses ke GPU NVIDIA Blackwell untuk menangani permintaan yang meningkat.
Daftar bahasa sekarang mencakup Tionghoa, Korea, Jepang, Turki, Indonesia, Filipina, Ukraina, Yunani, Ceko, Finlandia, Rumania, Denmark, Bulgaria, Melayu, Slovakia, Kroasia, Arab Klasik, dan Tamil. Ini bergabung dengan delapan bahasa asli: Inggris, Polandia, Jerman, Spanyol, Prancis, Italia, Hindi, dan Portugis.
Siapa yang Paling Diuntungkan
Pengembang dan penerbit game akan mendapatkan keuntungan signifikan. Studio indie sekarang dapat melokalisasi konten suara untuk audiens internasional tanpa mempekerjakan pengisi suara untuk setiap pasar. Embark Studios dan Paradox Interactive sudah menggunakan platform ini.
Institusi pendidikan mendapatkan pembuatan konten audio instan dalam bahasa target—berguna untuk program pembelajaran bahasa dan mengakomodasi siswa internasional. Penerbit buku audio seperti Storytel, yang sudah menjadi mitra ElevenLabs, dapat memperluas katalog mereka ke pasar baru lebih cepat.
Aspek aksesibilitas juga penting. Konten visual sekarang dapat dilengkapi dengan ucapan multibahasa untuk pengguna dengan gangguan penglihatan, tanpa biaya merekam trek audio terpisah untuk setiap bahasa.
Apa Selanjutnya
ElevenLabs berencana memperkenalkan mekanisme berbagi suara yang memungkinkan pengguna memonetisasi suara kloning mereka ketika orang lain menggunakannya untuk pembuatan konten. CEO Mati Staniszewski menyebutnya sebagai "kolaborasi manusia-AI"—meskipun detail berbagi pendapatan masih belum jelas.
Lintasan perusahaan dari valuasi $100 juta pada Juni 2023 menjadi $11 miliar pada Februari 2026 mencerminkan selera pasar yang lebih luas untuk teknologi suara AI. Dengan total pendanaan $781 juta di lima putaran, ElevenLabs memiliki landasan untuk mengejar tujuan yang dinyatakannya: membuat konten dapat diakses dalam bahasa apa pun, dengan suara apa pun.
Sumber gambar: Shutterstock- elevenlabs
- suara ai
- text-to-speech
- ai multibahasa
- series d


