Google en een consortium van Afrikaanse onderzoeksinstellingen hebben de WAXAL-dataset gelanceerd, een grote nieuwe inspanning om een van de belangrijkste uitdagingen van kunstmatige intelligentie (AI) op het continent aan te pakken: het onvermogen om de meeste Afrikaanse talen te interpreteren en te begrijpen.
Het project levert een grote, open spraakdataset die 21 Sub-Saharaanse Afrikaanse talen omvat en brengt spraaktechnologie naar meer dan 100 miljoen mensen die van de AI-economie zijn uitgesloten.
De WAXAL-dataset is het resultaat van een driejarige samenwerking, gefinancierd door Google en geleid door lokale universiteiten en gemeenschapsgroepen.
Het omvat 1.250 uur getranscribeerde, natuurlijke spraak en meer dan 20 uur studio-kwaliteit opnames gericht op het bouwen van hoogwaardige synthetische stemmen. Het richt zich op talen zoals Hausa, Yoruba, Luganda, Igbo en Acholi, waarvan velen door tientallen miljoenen worden gesproken maar grotendeels onzichtbaar blijven voor commerciële spraaksystemen.
Ondanks alle praatjes over wereldwijde AI, leunen spraaktechnologieën nog steeds zwaar op Engels en een beperkt aantal Europese en Aziatische talen. Afrika, de thuisbasis van meer dan 2.000 talen, is aan de zijlijn blijven staan.
Die kloof is niet academisch; het bepaalt wie digitale diensten kan gebruiken, wie toegang heeft tot onderwijs- en gezondheidszorginstrumenten, en wie bedrijven kan bouwen bovenop moderne AI-platforms. Google presenteerde het werk als een stap naar het verkleinen van een langdurige datakloof die veel Afrikaanse talen buiten spraakassistenten en andere tools heeft gehouden.
Naast het direct aanpakken van deze onbalans, is het project net zo belangrijk als de data zelf.
In tegenstelling tot eerdere initiatieven waarbij Afrikaanse spraakdata werd geëxtraheerd en elders eigendom was, werd WAXAL ter plaatse geleid door Afrikaanse instellingen. Makerere University in Oeganda, de Universiteit van Ghana en Digital Umuganda in Rwanda hielden toezicht op dataverzameling, gemeenschapsbetrokkenheid en taalbeheer, met technische ondersteuning van Google Research Africa.
Cruciaal is dat deze instellingen het eigendom van de data behouden. Dat is een opmerkelijke verschuiving in een vakgebied dat vaak wordt bekritiseerd voor het reproduceren van extractieve dynamieken onder de vlag van openheid.
Volgens Aisha Walcott-Bryant, hoofd van Google Research Africa, "De ultieme impact van WAXAL is de empowerment van mensen in Afrika. Deze dataset biedt de kritieke basis voor studenten, onderzoekers en ondernemers om technologie te bouwen op hun eigen voorwaarden, in hun eigen talen, en bereikt uiteindelijk meer dan 100 miljoen mensen."
"We kijken ernaar uit om Afrikaanse innovators deze data te zien gebruiken om alles te creëren, van nieuwe educatieve tools tot spraakgestuurde diensten die tastbare economische kansen creëren over het hele continent", voegde ze toe.
Aisha Walcott-Bryant, hoofd van Google Research Africa
Die framing wordt weerspiegeld door de betrokken universiteiten. Joyce Nakatumba-Nabende, een senior docent aan Makerere University, zei:
"Om een echte impact te hebben in Afrika, moet AI onze talen spreken en onze contexten begrijpen. De WAXAL-dataset geeft onze onderzoekers de hoogwaardige data die ze nodig hebben om spraaktechnologieën te bouwen die onze unieke gemeenschappen weerspiegelen. In Oeganda heeft het al onze lokale onderzoekscapaciteit versterkt en nieuwe door studenten en docenten geleide projecten ondersteund."
Bij de Universiteit van Ghana wees universitair hoofddocent Isaac Wiafe op de omvang van publieke betrokkenheid:
"Voor ons aan de Universiteit van Ghana gaat de impact van WAXAL verder dan de data zelf. Het heeft ons in staat gesteld om onze eigen taalbronnen te bouwen en een nieuwe generatie AI-onderzoekers op te leiden. Meer dan 7.000 vrijwilligers sloten zich bij ons aan omdat ze wilden dat hun stemmen en talen deel uitmaken van de digitale toekomst. Vandaag heeft die collectieve inspanning een ecosysteem van innovatie aangewakkerd op gebieden als gezondheid, onderwijs en landbouw. Dit bewijst dat wanneer de data bestaat, de mogelijkheden overal toenemen."
Er is reden voor voorzichtig optimisme. Open spraakdatasets kunnen barrières verlagen voor lokale startups en onderzoekers die de middelen missen om data op schaal te verzamelen. Ze kunnen ook de afhankelijkheid van buitenlandse API's verminderen die zelden Afrikaanse talen goed ondersteunen, als ze dat al doen.
De WAXAL-dataset
Toch garanderen datasets geen resultaten; het bouwen van betrouwbare spraaksystemen vereist aanhoudende investering, lokale implementatie en commerciële wegen die waarde in het land houden. Google's rol als financier en bijeenroeper zal tot onderzoek leiden, met name rond hoe WAXAL-data in de toekomst door mondiale bedrijven wordt gebruikt.
Voor nu markeert de release van de WAXAL-dataset een concrete stap naar een taalkundig inclusiever AI-ecosysteem. Het lost Afrika's AI-uitdagingen niet op, maar het pakt een fundamentele uitdaging aan. Spraak is vaak de meest natuurlijke interface met technologie. Ervoor zorgen dat AI Afrika kan horen spreken, in al zijn diversiteit, is lang geleden te laat.
De post Google to train AI in 21 African languages, including Yoruba, Hausa and Igbo verscheen eerst op Technext.


