A Google e um consórcio de instituições de investigação africanas lançaram o conjunto de dados WAXAL, um novo esforço importante para corrigir um dos principais desafios da inteligência artificial (IA) no continente: a sua incapacidade de interpretar e compreender a maioria das línguas africanas.
O projeto fornece um grande conjunto de dados de voz aberto que abrange 21 línguas da África Subsariana e traz tecnologia de voz a mais de 100 milhões de pessoas excluídas da economia de IA.
O conjunto de dados WAXAL é o produto de uma colaboração de três anos financiada pela Google e liderada por universidades locais e grupos comunitários.
Inclui 1.250 horas de discurso natural transcrito e mais de 20 horas de gravações de qualidade de estúdio destinadas a construir vozes sintéticas de alta fidelidade. Tem como alvo línguas como Hausa, Yoruba, Luganda, Igbo e Acholi, muitas das quais são faladas por dezenas de milhões, mas permanecem em grande parte invisíveis aos sistemas comerciais de voz.
Apesar de toda a conversa sobre IA global, as tecnologias de voz ainda se inclinam fortemente para o inglês e um punhado restrito de línguas europeias e asiáticas. África, lar de mais de 2.000 línguas, foi deixada à margem.
Essa lacuna não é académica; ela determina quem pode usar serviços digitais, quem pode aceder a ferramentas de educação e saúde, e quem consegue construir empresas em cima de plataformas de IA modernas. A Google enquadrou o trabalho como um passo para reduzir uma lacuna de dados de longa data que manteve muitas línguas africanas fora de assistentes de voz e outras ferramentas.
Além de abordar este desequilíbrio diretamente, o projeto importa tanto quanto os próprios dados.
Ao contrário de iniciativas anteriores onde os dados de voz africanos foram extraídos e detidos noutros locais, o WAXAL foi liderado no terreno por instituições africanas. A Universidade Makerere no Uganda, a Universidade do Gana e a Digital Umuganda no Ruanda supervisionaram a recolha de dados, o envolvimento comunitário e a gestão linguística, com apoio técnico da Google Research Africa.
Crucialmente, essas instituições mantêm a propriedade dos dados. Esta é uma mudança notável num campo frequentemente criticado por reproduzir dinâmicas extrativas sob a bandeira da abertura.
Segundo Aisha Walcott-Bryant, Chefe da Google Research Africa, "O impacto final do WAXAL é o empoderamento das pessoas em África. Este conjunto de dados fornece a base crítica para estudantes, investigadores e empreendedores construírem tecnologia nos seus próprios termos, nas suas próprias línguas, finalmente alcançando mais de 100 milhões de pessoas."
"Estamos ansiosos por ver os inovadores africanos usarem estes dados para criar tudo, desde novas ferramentas educacionais a serviços habilitados por voz que criem oportunidades económicas tangíveis em todo o continente", acrescentou.
Aisha Walcott-Bryant, Chefe da Google Research Africa
Esse enquadramento é ecoado pelas universidades envolvidas. Joyce Nakatumba-Nabende, professora sénior na Universidade Makerere, disse:
"Para que a IA tenha um impacto real em África, deve falar as nossas línguas e compreender os nossos contextos. O conjunto de dados WAXAL dá aos nossos investigadores os dados de alta qualidade de que precisam para construir tecnologias de voz que reflitam as nossas comunidades únicas. No Uganda, já fortaleceu a nossa capacidade de investigação local e apoiou novos projetos liderados por estudantes e docentes."
Na Universidade do Gana, o Professor Associado Isaac Wiafe apontou para a escala do envolvimento público:
"Para nós na Universidade do Gana, o impacto do WAXAL vai além dos próprios dados. Capacitou-nos a construir os nossos próprios recursos linguísticos e a treinar uma nova geração de investigadores de IA. Mais de 7.000 voluntários juntaram-se a nós porque queriam que as suas vozes e línguas pertencessem ao futuro digital. Hoje, esse esforço coletivo desencadeou um ecossistema de inovação em áreas como saúde, educação e agricultura. Isto prova que quando os dados existem, a possibilidade expande-se em todo o lado."
Há razão para otimismo cauteloso. Conjuntos de dados de voz abertos podem reduzir barreiras para startups locais e investigadores que carecem de recursos para recolher dados em escala. Também podem reduzir a dependência de APIs estrangeiras que raramente suportam bem as línguas africanas, se é que o fazem.
O conjunto de dados WAXAL
Ainda assim, os conjuntos de dados não garantem resultados; construir sistemas de voz confiáveis requer investimento sustentado, implementação local e caminhos comerciais que mantenham o valor no país. O papel da Google como financiadora e convocadora convidará ao escrutínio, particularmente em torno de como os dados WAXAL são usados por empresas globais no futuro.
Por agora, o lançamento do conjunto de dados WAXAL marca um passo concreto em direção a um ecossistema de IA mais inclusivo linguisticamente. Não resolve os desafios de IA de África, mas aborda um fundamental. A voz é frequentemente a interface mais natural com a tecnologia. Garantir que a IA pode ouvir África falar, em toda a sua diversidade, é há muito esperado.
A publicação Google vai treinar IA em 21 línguas africanas, incluindo Yoruba, Hausa e Igbo apareceu primeiro em Technext.


