Google bersama konsortium institusi penyelidikan Afrika telah melancarkan dataset WAXAL, satu usaha baharu yang penting untuk menangani salah satu cabaran utama kecerdasan buatan (AI) di benua tersebut: ketidakmampuan AI untuk mentafsir dan memahami kebanyakan bahasa Afrika.
Projek ini menyediakan sebuah dataset suara besar dan terbuka yang merangkumi 21 bahasa Afrika Sub-Sahara, sekali gus membawa teknologi suara kepada lebih daripada 100 juta orang yang selama ini terpinggir daripada ekonomi AI.
Dataset WAXAL merupakan hasil kerjasama tiga tahun yang dibiayai oleh Google dan diketuai oleh universiti-universiti tempatan serta kumpulan komuniti.
Dataset ini mengandungi 1,250 jam transkripsi suara sebenar dan lebih daripada 20 jam rakaman berkualiti studio yang bertujuan untuk membina suara sintetik berketepatan tinggi. Dataset ini memberi tumpuan kepada bahasa-bahasa seperti Hausa, Yoruba, Luganda, Igbo, dan Acholi—bahasa-bahasa yang digunakan oleh puluhan juta penduduk, namun masih kurang diperhatikan oleh sistem-sistem suara komersial.
Walaupun banyak perbincangan tentang AI global, teknologi suara masih sangat tertumpu pada bahasa Inggeris dan segelintir bahasa Eropah serta Asia sahaja. Afrika, yang menjadi rumah bagi lebih daripada 2,000 bahasa, sebaliknya sering terpinggir.
Kesenjangan ini bukan sekadar isu akademik; ia turut menentukan siapa yang boleh menggunakan perkhidmatan digital, siapa yang dapat mengakses alat pendidikan dan penjagaan kesihatan, serta siapa yang mampu membina syarikat berteraskan platform AI moden. Google melihat usaha ini sebagai langkah untuk mengurangkan jurang data lama yang menyebabkan banyak bahasa Afrika tidak tersenarai dalam senarai asisten suara dan alat-alat lain.
Selain menangani ketidakseimbangan ini secara langsung, projek ini juga penting dari segi data itu sendiri.
Tidak seperti inisiatif terdahulu yang mana data suara Afrika diambil dan dimiliki oleh pihak luar, WAXAL diketuai sepenuhnya oleh institusi-institusi Afrika. Universiti Makerere di Uganda, Universiti Ghana, dan Digital Umuganda di Rwanda mengurus pengumpulan data, penyertaan komuniti, serta pengurusan bahasa, dengan sokongan teknikal daripada Google Research Africa.
Paling penting, institusi-institusi tersebut kekal memiliki hak milik ke atas data tersebut. Ini merupakan satu perubahan yang signifikan dalam bidang yang sering dikritik kerana cenderung mengulangi dinamik ekstraktif di bawah semangat “keterbukaan”.
Menurut Aisha Walcott-Bryant, Ketua Google Research Africa, “Impak terakhir WAXAL ialah pemberdayaan rakyat Afrika. Dataset ini menyediakan landasan penting bagi pelajar, penyelidik, dan usahawan untuk membina teknologi mengikut istilah mereka sendiri, dalam bahasa mereka sendiri, sekali gus mencapai lebih daripada 100 juta orang.”
“Kami menantikan para inovator Afrika menggunakan data ini untuk mencipta pelbagai perkara, daripada alat pendidikan baharu hingga perkhidmatan berteraskan suara yang membuka peluang ekonomi yang nyata di seluruh benua,” tambah beliau.
Aisha Walcott-Bryant, Ketua Google Research Africa
Penyataan ini turut disokong oleh universiti-universiti yang terlibat. Joyce Nakatumba-Nabende, pensyarah kanan di Universiti Makerere, berkata:
“Agar AI dapat memberi impak sebenar di Afrika, ia harus berbicara dalam bahasa kami dan memahami konteks kami. Dataset WAXAL memberikan penyelidik kami data berkualiti tinggi yang diperlukan untuk membina teknologi suara yang mencerminkan komuniti kami yang unik. Di Uganda, dataset ini telah mengukuhkan kapasiti penyelidikan tempatan kami dan menyokong projek-projek baharu yang dipimpin oleh pelajar dan fakulti.”
Di Universiti Ghana, Profesor Madya Isaac Wiafe menekankan skala penyertaan awam:
“Bagi kami di Universiti Ghana, impak WAXAL bukan sekadar data itu sendiri. Dataset ini telah memberi kami keupayaan untuk membina sumber bahasa kami sendiri dan melatih generasi baharu penyelidik AI. Lebih daripada 7,000 sukarelawan menyertai kami kerana mereka ingin suara dan bahasa mereka turut terlibat dalam masa depan digital. Hari ini, usaha kolektif ini telah mencetuskan ekosistem inovasi dalam bidang seperti kesihatan, pendidikan, dan pertanian. Ini membuktikan bahawa apabila data wujud, peluang akan terbuka luas di mana-mana.”
Ada alasan untuk optimisme yang berhati-hati. Dataset suara terbuka dapat menurunkan halangan bagi startup dan penyelidik tempatan yang tidak mempunyai sumber untuk mengumpul data dalam skala besar. Selain itu, dataset ini juga dapat mengurangkan ketergantungan pada API luar negara yang jarang sekali menyokong bahasa Afrika dengan baik, jika tidak langsung tidak menyokong sama sekali.
Dataset WAXAL
Namun begitu, dataset tidak menjamin hasil; pembinaan sistem suara yang boleh dipercayai memerlukan pelaburan berterusan, pelaksanaan di peringkat tempatan, serta saluran komersial yang memastikan nilai tetap berada di dalam negara. Peranan Google sebagai pembiaya dan penganjur pasti akan menjadi tumpuan, terutama berkaitan cara data WAXAL digunakan oleh syarikat global pada masa hadapan.
Pada masa ini, pelancaran dataset WAXAL menandakan satu langkah konkret menuju ekosistem AI yang lebih inklusif dari segi bahasa. Dataset ini tidak menyelesaikan semua cabaran AI Afrika, tetapi ia menangani satu aspek asas. Suara sering kali merupakan antara antara muka paling semula jadi untuk berinteraksi dengan teknologi. Memastikan AI dapat mendengar Afrika berbicara, dalam segala kepelbagaiannya, sepatutnya sudah lama dilaksanakan.
Artikel Google akan melatih AI dalam 21 bahasa Afrika, termasuk Yoruba, Hausa, dan Igbo, pertama kali diterbitkan di Technext.


