Intron, une startup IA basée à Lagos, a officiellement lancé Sahara-v2, son modèle phare d'IA vocale de deuxième génération, augmentant effectivement le… The post Intron launchesIntron, une startup IA basée à Lagos, a officiellement lancé Sahara-v2, son modèle phare d'IA vocale de deuxième génération, augmentant effectivement le… The post Intron launches

Intron lance Sahara-v2, un modèle d'IA vocale prenant en charge 24 nouvelles langues africaines

2026/03/05 20:11
Temps de lecture : 6 min
Pour tout commentaire ou toute question concernant ce contenu, veuillez nous contacter à l'adresse suivante : [email protected]

Intron, une startup d'IA basée à Lagos, a officiellement lancé Sahara-v2, son modèle d'IA vocale de deuxième génération phare, rehaussant efficacement la barre de la reconnaissance vocale mondiale. Le modèle prend en charge 24 nouvelles langues africaines et maîtrise plus de 500 accents africains anglais distincts, portant la couverture linguistique totale de l'entreprise à un niveau sans précédent de 57. 

Pendant des années, interagir avec des assistants vocaux mondiaux comme Siri, Alexa ou des moteurs de synthèse vocale standard a donné l'impression de parler à un mur qui ne parle fondamentalement pas votre langue. Nous sommes tous passés par là, essayant d'utiliser une commande vocale pour voir une phrase localisée comme « No worry, e go better » transcrite en un insensé « No war eagle butter ». C'est drôle au début, mais quand « Wanjiru » est numérisé en « One zero » et que « Chukwuebuka » devient inexplicablement « Check wheelchair baker », la plaisanterie s'estompe rapidement.

Ces échecs répétés de transcription sont plus que de simples bévues techniques ; ils constituent une forme active d'exclusion numérique. Construits principalement sur des ensembles de données occidentales, les principaux modèles d'IA mondiaux manquent complètement la cible ici. Ils ne sont pas conçus pour la richesse tonale de notre discours, où un seul mot peut signifier six choses différentes selon la prononciation. Ils trébuchent sur notre alternance de codes rythmique naturelle et ne peuvent pas comprendre qu'un seul bureau pourrait employer du personnel avec dix accents entièrement différents. Lorsque les assistants vocaux comprennent mal les mots et noms de base, ils excluent des millions d'utilisateurs des raccourcis numériques qui facilitent la vie moderne.

Intron présente Sahara-v2, prenant en charge 24 nouvelles langues africaines pour établir une nouvelle norme mondiale pour l'IA vocale africaineIntron

Sahara-v2 comble cet écart critique car il n'a pas été construit sur des hypothèses ou formé dans un studio calme et stérile. Intron a construit ce modèle en allant dans les rues et en écoutant. L'ensemble de données est massif et hyper-localisé : plus de 14 millions de clips audio, totalisant plus de 50 000 heures de parole, provenant de plus de 40 000 locuteurs. Ces voix représentent 64 langues africaines et de la diaspora dans plus de 30 pays. Cruciale, elles ont été enregistrées là où l'IA doit réellement fonctionner, dans des cliniques bondées, des marchés bruyants, des centres d'appels animés et des salles d'audience.

Le Sahara-v2 d'Intron bat les leaders de l'industrie

Cette approche concrète et du monde réel a permis à Sahara-v2 de surpasser les plus grands noms de la technologie mondiale. Lorsqu'il est comparé aux poids lourds de l'industrie comme Gemini-3, GPT-4, Whisper, ElevenLabs, AWS et Azure, le modèle d'Intron offre des avances dominantes. 

Il affiche un taux de précision supérieur de 68,6 % sur les noms, organisations et lieux africains, et est 55,6 % plus précis dans la transcription des nombres, fractions et devises. De plus, il présente une résistance 36,5 % supérieure aux hallucinations d'IA causées par le bruit de fond et les locuteurs qui se chevauchent, ainsi qu'une amélioration des performances de 46,7 % dans des secteurs spécialisés comme la santé, le droit, les télécommunications et la finance.

Au-delà des repères impressionnants, Sahara-v2 est un véritable moteur de productivité conçu pour un déploiement d'entreprise dans le monde réel. Soutenue par des API robustes qui peuvent être déployées en aussi peu que cinq minutes, l'infrastructure alimente déjà activement la banque vocale, les processus de vérification d'identité (KYC) automatisés et les systèmes de remplissage automatique pour tout, des données de santé aux formulaires d'ouverture de compte. Les premiers utilisateurs d'entreprise rapportent que la technologie réduit les temps de traitement administratif jusqu'à 4,4 fois.

Pour répondre aux réalités linguistiques uniques du continent, Intron a déployé des fonctionnalités régionales hautement spécialisées. En collaboration avec Penda Health du Kenya, ils ont introduit le premier modèle de reconnaissance vocale automatique (ASR) bilingue swahili-anglais au monde, capturant parfaitement la façon dont les gens basculent naturellement entre les langues au milieu d'une phrase. 

Pour le marché ici, ils ont lancé un modèle natif de synthèse vocale (TTS) en haoussa, permettant des robots vocaux 24h/24 et 7j/7 à faible latence. Et pour les gouvernements et les entreprises confrontés aux préoccupations en matière de confidentialité des données, le déploiement de Sahara-v2 comprend une nouvelle prise en charge hors ligne, permettant aux données de rester sécurisées et locales pour la conformité de l'IA souveraine.

Intron présente Sahara-v2, prenant en charge 24 nouvelles langues africaines pour établir une nouvelle norme mondiale pour l'IA vocale africaineSahara-v2 d'Intron

Les entreprises et les clients gouvernementaux de six pays utilisent déjà le système. Ayo Oluleye, responsable des données et des informations chez ARM Investments, a noté : « En utilisant les modèles d'IA d'Intron, nous avons constaté une amélioration significative des transcriptions et des résumés par rapport aux modèles que nous avons explorés précédemment. Leurs systèmes capturent mieux le contexte et les nuances, conduisant à des résultats plus précis. » Sarah Morris, CPO chez Audere, a fait écho à cela, rapportant des taux de réussite API de plus de 99 % et une excellente précision sur les accents d'Afrique australe.

Parallèlement au lancement de Sahara-v2, Intron a également publié son rapport inaugural 2026 sur l'IA vocale africaine. La publication offre un aperçu complet et inédit de l'écosystème, détaillant les leçons tirées du déploiement de l'IA vocale dans des environnements complexes pour guider les startups, les investisseurs et les décideurs politiques.

Lire également : Google va former l'IA dans 21 langues africaines, dont le yoruba, le haoussa et l'igbo

Les nouvelles langues incluent le français africain, l'afrikaans, l'akan, l'amharique, l'arabe, le bemba, le peul, le ga, le haoussa, l'igbo, le kinyarwanda, le luganda, l'oromo, le pedi et le pidgin. Les autres sont le sesotho, le shona, le swahili, le tswana, le twi, le wolof, le xhosa, le yoruba et le zoulou. Avec ces ajouts, la porte du monde numérique s'ouvre enfin largement. 

Comme l'a dit le PDG d'Intron, Tobi Olatunji : « Sahara-v2 prouve que lorsque la technologie est construite avec une compréhension culturelle et linguistique profonde, des choses incroyables peuvent se produire, et nous ne faisons que commencer. »

L'article Intron lance Sahara-v2, un modèle d'IA vocale prenant en charge 24 nouvelles langues africaines est apparu en premier sur Technext.

Opportunité de marché
Logo de SaharaAI
Cours SaharaAI(SAHARA)
$0.02661
$0.02661$0.02661
-0.74%
USD
Graphique du prix de SaharaAI (SAHARA) en temps réel
Clause de non-responsabilité : les articles republiés sur ce site proviennent de plateformes publiques et sont fournis à titre informatif uniquement. Ils ne reflètent pas nécessairement les opinions de MEXC. Tous les droits restent la propriété des auteurs d'origine. Si vous estimez qu'un contenu porte atteinte aux droits d'un tiers, veuillez contacter [email protected] pour demander sa suppression. MEXC ne garantit ni l'exactitude, ni l'exhaustivité, ni l'actualité des contenus, et décline toute responsabilité quant aux actions entreprises sur la base des informations fournies. Ces contenus ne constituent pas des conseils financiers, juridiques ou professionnels, et ne doivent pas être interprétés comme une recommandation ou une approbation de la part de MEXC.