Intron, startup AI z siedzibą w Lagos, oficjalnie uruchomił Sahara-v2, swój flagowy model AI drugiej generacji do rozpoznawania głosu, skutecznie podnosząc… Post Intron launchesIntron, startup AI z siedzibą w Lagos, oficjalnie uruchomił Sahara-v2, swój flagowy model AI drugiej generacji do rozpoznawania głosu, skutecznie podnosząc… Post Intron launches

Intron uruchamia Sahara-v2, model głosowy AI obsługujący 24 nowe języki afrykańskie

2026/03/05 20:11
4 min. lektury
W przypadku uwag lub wątpliwości dotyczących niniejszej treści skontaktuj się z nami pod adresem [email protected]

Intron, startup AI z siedzibą w Lagos, oficjalnie uruchomił Sahara-v2, swój flagowy model AI drugiej generacji do rozpoznawania mowy, skutecznie podnosząc poprzeczkę dla globalnego rozpoznawania mowy. Model obsługuje 24 nowe języki afrykańskie i opanowuje ponad 500 różnych afrykańskich akcentów angielskich, zwiększając całkowite pokrycie językowe firmy do bezprecedensowych 57. 

Od lat interakcja z globalnymi asystentami głosowymi, takimi jak Siri, Alexa czy standardowymi silnikami zamiany tekstu na mowę, przypominała rozmowę ze ścianą, która fundamentalnie nie mówi w twoim języku. Wszyscy przez to przeszliśmy, próbując użyć komendy głosowej, tylko po to, by lokalne wyrażenie takie jak "No worry, e go better" zostało przepisane na bezsensowne "No war eagle butter". Na początku jest to zabawne, ale gdy "Wanjiru" zostaje zdigitalizowane jako "One zero", a "Chukwuebuka" w niewytłumaczalny sposób staje się "Check wheelchair baker", żart szybko się kończy.

Te powtarzające się błędy transkrypcji to coś więcej niż zwykłe techniczne wpadki; są aktywną formą cyfrowego wykluczenia. Zbudowane głównie na zachodnich zbiorach danych, wiodące globalne modele AI kompletnie chybiają tutaj celu. Nie są zaprojektowane do tonalnego bogactwa naszej mowy, gdzie jedno słowo może znaczyć sześć różnych rzeczy w zależności od wymowy. Potykają się o nasze naturalne rytmiczne przełączanie kodów i nie mogą pojąć, że jedno biuro może zatrudniać pracowników z dziesięcioma całkowicie różnymi akcentami. Kiedy asystenci głosowi źle rozumieją podstawowe słowa i nazwy, zamykają miliony użytkowników przed cyfrowymi skrótami, które ułatwiają współczesne życie.

Intron wprowadza Sahara-v2, obsługując 24 nowe języki afrykańskie, aby ustanowić nowy globalny standard dla afrykańskiego AI głosowegoIntron

Sahara-v2 wypełnia tę krytyczną lukę, ponieważ nie został zbudowany na założeniach ani wytrenowany w cichym, sterylnym studiu. Intron zbudował ten model, wychodząc na ulice i słuchając. Zbiór danych jest masywny i hiperlokalny: ponad 14 milionów klipów audio, łącznie ponad 50 000 godzin mowy, pochodzących od ponad 40 000 mówców. Te głosy reprezentują 64 języki afrykańskie i diaspory z ponad 30 krajów. Co kluczowe, zostały nagrane tam, gdzie AI faktycznie musi funkcjonować: w zatłoczonych klinikach, hałaśliwych targowiskach, ruchliwych centrach telefonicznych i salach sądowych.

Sahara-v2 Introna pokonuje liderów branży

To oddolne, realistyczne podejście pozwoliło Sahara-v2 okrążyć największe nazwiska w globalnej technologii. Gdy porównywano go z gigantami branży, takimi jak Gemini-3, GPT-4, Whisper, ElevenLabs, AWS i Azure, model Introna osiąga zdecydowaną przewagę. 

Osiąga o 68,6% lepszą dokładność w rozpoznawaniu afrykańskich nazwisk, organizacji i lokalizacji oraz jest o 55,6% ostrzejszy w transkrypcji liczb, ułamków i walut. Ponadto posiada o 36,5% większą odporność na halucynacje AI spowodowane hałasem w tle i nakładającymi się mówcami, wraz z 46,7% wzrostem wydajności w wyspecjalizowanych sektorach, takich jak opieka zdrowotna, prawo, telekomunikacja i finanse.

Poza imponującymi wynikami testów, Sahara-v2 to poważny silnik produktywności zaprojektowany do rzeczywistego wdrożenia w przedsiębiorstwach. Wspierany przez solidne API, które można wdrożyć w zaledwie pięć minut, infrastruktura już aktywnie zasila bankowość głosową, zautomatyzowane procesy KYC i systemy automatycznego wypełniania od danych zdrowotnych po formularze otwierania kont. Pierwsi użytkownicy korporacyjni raportują, że technologia skraca czasy przetwarzania administracyjnego nawet do 4,4 razy.

Aby sprostać unikalnym realiom językowym kontynentu, Intron wprowadził wysoce wyspecjalizowane funkcje regionalne. We współpracy z kenijskim Penda Health wprowadzili pierwszy na świecie dwujęzyczny model automatycznego rozpoznawania mowy suahili-angielski (ASR), idealnie oddający, jak ludzie naturalnie przełączają się między językami w środku zdania. 

Dla tutejszego rynku uruchomili natywny model zamiany tekstu na mowę w języku hausa (TTS), umożliwiający boty głosowe o niskim opóźnieniu, działające 24/7. A dla rządów i przedsiębiorstw borykających się z obawami dotyczącymi prywatności danych, wdrożenie Sahara-v2 obejmuje nowe wsparcie offline, pozwalając na zachowanie bezpieczeństwa i lokalności danych w celu zgodności z suwerennym AI.

Intron wprowadza Sahara-v2, obsługując 24 nowe języki afrykańskie, aby ustanowić nowy globalny standard dla afrykańskiego AI głosowegoSahara-v2 Introna

Przedsiębiorstwa i klienci rządowi w sześciu krajach już wykorzystują system. Ayo Oluleye, Head of Data & Insights w ARM Investments, zauważył: "Używając modeli AI Introna, zauważyliśmy znaczną poprawę w transkrypcjach i podsumowaniach w porównaniu z modelami, które wcześniej badaliśmy. Ich systemy lepiej wychwytują kontekst i niuanse, prowadząc do dokładniejszych wyników". Sarah Morris, CPO w Audere, potwierdziła to, zgłaszając ponad 99% wskaźnik sukcesu API i doskonałą dokładność w przypadku akcentów z Afryki Południowej.

Wraz z uruchomieniem Sahara-v2, Intron opublikował również swój inauguracyjny Raport Africa Voice AI 2026. Publikacja oferuje kompleksowe, pierwsze w swoim rodzaju spojrzenie na ekosystem, szczegółowo opisując lekcje wyciągnięte z wdrażania AI głosowego w złożonych środowiskach, aby prowadzić startupy, inwestorów i decydentów.

Przeczytaj także: Google trenuje AI w 21 językach afrykańskich, w tym joruba, hausa i igbo

Najnowsze języki obejmują francuski afrykański, afrikaans, akan, amharski, arabski, bemba, fulani, ga, hausa, igbo, kinyarwanda, luganda, oromo, pedi i pidgin. Inne to sesotho, shona, suahili, tswana, twi, wolof, xhosa, joruba i zulu. Wraz z tymi dodatkami drzwi do cyfrowego świata wreszcie otwierają się szeroko. 

Jak ujął to CEO Introna, Tobi Olatunji: "Sahara-v2 dowodzi, że gdy technologia jest budowana z głębokim zrozumieniem kulturowym i językowym, mogą się dziać niesamowite rzeczy, a to dopiero początek".

Post Intron uruchamia Sahara-v2, model AI głosowego obsługujący 24 nowe języki afrykańskie po raz pierwszy ukazał się na Technext.

Zastrzeżenie: Artykuły udostępnione na tej stronie pochodzą z platform publicznych i służą wyłącznie celom informacyjnym. Niekoniecznie odzwierciedlają poglądy MEXC. Wszystkie prawa pozostają przy pierwotnych autorach. Jeśli uważasz, że jakakolwiek treść narusza prawa stron trzecich, skontaktuj się z [email protected] w celu jej usunięcia. MEXC nie gwarantuje dokładności, kompletności ani aktualności treści i nie ponosi odpowiedzialności za jakiekolwiek działania podjęte na podstawie dostarczonych informacji. Treść nie stanowi porady finansowej, prawnej ani innej profesjonalnej porady, ani nie powinna być traktowana jako rekomendacja lub poparcie ze strony MEXC.