Google và một tập đoàn các tổ chức nghiên cứu châu Phi đã ra mắt bộ dữ liệu WAXAL, một nỗ lực mới lớn để… Bài viết Google đào tạo AI bằng 21 ngôn ngữ châu PhiGoogle và một tập đoàn các tổ chức nghiên cứu châu Phi đã ra mắt bộ dữ liệu WAXAL, một nỗ lực mới lớn để… Bài viết Google đào tạo AI bằng 21 ngôn ngữ châu Phi

Google đào tạo AI trong 21 ngôn ngữ châu Phi, bao gồm Yoruba, Hausa và Igbo

2026/02/02 22:00

Google và một tập đoàn các tổ chức nghiên cứu châu Phi đã ra mắt bộ dữ liệu WAXAL, một nỗ lực lớn mới nhằm khắc phục một trong những thách thức chính của trí tuệ nhân tạo (AI) trên lục địa này, đó là khả năng diễn giải và hiểu hầu hết các ngôn ngữ châu Phi.

Dự án cung cấp một bộ dữ liệu giọng nói mở lớn bao gồm 21 ngôn ngữ châu Phi cận Sahara và mang công nghệ giọng nói đến hơn 100 triệu người bị loại trừ khỏi nền kinh tế AI.

Bộ dữ liệu WAXAL là sản phẩm của sự hợp tác ba năm được tài trợ bởi Google và do các trường đại học địa phương cũng như các nhóm cộng đồng dẫn đầu.

Nó bao gồm 1.250 giờ lời nói tự nhiên được phiên âm và hơn 20 giờ ghi âm chất lượng studio nhằm xây dựng các giọng nói tổng hợp có độ trung thực cao. Nó nhắm đến các ngôn ngữ như Hausa, Yoruba, Luganda, Igbo và Acholi, nhiều ngôn ngữ trong số này được hàng chục triệu người nói nhưng vẫn phần lớn vô hình đối với các hệ thống giọng nói thương mại.

Google và các trường đại học châu Phi ra mắt bộ dữ liệu WAXAL để đào tạo AI bằng 21 ngôn ngữ châu Phi, bao gồm Yoruba, Hausa và Igbo

Bất chấp tất cả những cuộc nói chuyện về AI toàn cầu, các công nghệ giọng nói vẫn nghiêng nhiều về tiếng Anh và một số ít ngôn ngữ châu Âu và châu Á. Châu Phi, nơi có hơn 2.000 ngôn ngữ, đã bị bỏ lại ở lề.

Khoảng cách đó không chỉ mang tính học thuật; nó định hình ai có thể sử dụng các dịch vụ kỹ thuật số, ai có thể tiếp cận các công cụ giáo dục và chăm sóc sức khỏe, và ai có thể xây dựng công ty trên các nền tảng AI hiện đại. Google đóng khung công việc này như một bước tiến hướng tới việc thu hẹp khoảng cách dữ liệu lâu đời đã khiến nhiều ngôn ngữ châu Phi không có mặt trên trợ lý giọng nói và các công cụ khác.

Tại sao bộ dữ liệu WAXAL quan trọng đối với kiến trúc AI của châu Phi

Ngoài việc giải quyết trực tiếp sự mất cân bằng này, dự án còn quan trọng như chính dữ liệu.

Không giống như các sáng kiến trước đó, nơi dữ liệu giọng nói châu Phi được trích xuất và sở hữu ở nơi khác, WAXAL được dẫn dắt tại chỗ bởi các tổ chức châu Phi. Đại học Makerere ở Uganda, Đại học Ghana và Digital Umuganda ở Rwanda giám sát việc thu thập dữ liệu, gắn kết cộng đồng và quản lý ngôn ngữ, với sự hỗ trợ kỹ thuật từ Google Research Africa.

Quan trọng là, các tổ chức đó giữ quyền sở hữu dữ liệu. Đó là một sự thay đổi đáng chú ý trong một lĩnh vực thường bị chỉ trích vì tái tạo động lực khai thác dưới danh nghĩa cởi mở.

Theo Aisha Walcott-Bryant, Trưởng phòng Google Research Africa, "Tác động cuối cùng của WAXAL là trao quyền cho người dân ở châu Phi. Bộ dữ liệu này cung cấp nền tảng quan trọng cho sinh viên, nhà nghiên cứu và doanh nhân để xây dựng công nghệ theo các điều khoản của riêng họ, bằng ngôn ngữ của riêng họ, cuối cùng tiếp cận hơn 100 triệu người."

"Chúng tôi mong muốn nhìn thấy các nhà đổi mới châu Phi sử dụng dữ liệu này để tạo ra mọi thứ từ các công cụ giáo dục mới đến các dịch vụ kích hoạt bằng giọng nói tạo ra cơ hội kinh tế hữu hình trên khắp lục địa", cô nói thêm. 

Google và các trường đại học châu Phi ra mắt bộ dữ liệu WAXAL để đào tạo AI bằng 21 ngôn ngữ châu Phi, bao gồm Yoruba, Hausa và IgboAisha Walcott-Bryant, Trưởng phòng Google Research Africa

Khung đó được các trường đại học tham gia lặp lại. Joyce Nakatumba-Nabende, một giảng viên cao cấp tại Đại học Makerere, cho biết:

"Để AI có tác động thực sự ở châu Phi, nó phải nói ngôn ngữ của chúng ta và hiểu bối cảnh của chúng ta. Bộ dữ liệu WAXAL cung cấp cho các nhà nghiên cứu của chúng tôi dữ liệu chất lượng cao mà họ cần để xây dựng các công nghệ giọng nói phản ánh các cộng đồng độc đáo của chúng tôi. Ở Uganda, nó đã tăng cường năng lực nghiên cứu địa phương của chúng tôi và hỗ trợ các dự án mới do sinh viên và giảng viên dẫn đầu."

Tại Đại học Ghana, Phó Giáo sư Isaac Wiafe chỉ ra quy mô tham gia của công chúng: 

"Đối với chúng tôi tại Đại học Ghana, tác động của WAXAL vượt ra ngoài chính dữ liệu. Nó đã trao quyền cho chúng tôi xây dựng tài nguyên ngôn ngữ của riêng mình và đào tạo một thế hệ nhà nghiên cứu AI mới. Hơn 7.000 tình nguyện viên đã tham gia cùng chúng tôi vì họ muốn giọng nói và ngôn ngữ của họ thuộc về tương lai kỹ thuật số. Hôm nay, nỗ lực tập thể đó đã châm ngòi cho một hệ sinh thái đổi mới trong các lĩnh vực như y tế, giáo dục và nông nghiệp. Điều này chứng minh rằng khi dữ liệu tồn tại, khả năng mở rộng ở mọi nơi."

Có lý do cho sự lạc quan thận trọng. Các bộ dữ liệu giọng nói mở có thể giảm rào cản cho các startup địa phương và nhà nghiên cứu thiếu nguồn lực để thu thập dữ liệu ở quy mô lớn. Chúng cũng có thể giảm sự phụ thuộc vào API mới ngoại quốc hiếm khi hỗ trợ tốt các ngôn ngữ châu Phi, nếu có.

Google và các trường đại học châu Phi ra mắt bộ dữ liệu WAXAL để đào tạo AI bằng 21 ngôn ngữ châu Phi, bao gồm Yoruba, Hausa và IgboBộ dữ liệu WAXAL

Tuy nhiên, các bộ dữ liệu không đảm bảo kết quả; việc xây dựng các hệ thống giọng nói đáng tin cậy đòi hỏi đầu tư bền vững, triển khai địa phương và các con đường thương mại giữ giá trị trong nước. Vai trò của Google với tư cách là nhà tài trợ và người triệu tập sẽ mời gọi sự giám sát, đặc biệt là xung quanh cách dữ liệu WAXAL được sử dụng bởi các công ty toàn cầu trong tương lai.

Hiện tại, việc phát hành bộ dữ liệu WAXAL đánh dấu một bước tiến cụ thể hướng tới một hệ sinh thái AI toàn diện hơn về mặt ngôn ngữ. Nó không giải quyết các thách thức AI của châu Phi, nhưng nó giải quyết một vấn đề nền tảng. Giọng nói thường là giao diện tự nhiên nhất với công nghệ. Đảm bảo AI có thể nghe châu Phi nói, với tất cả sự đa dạng của nó, đã quá muộn.

Bài đăng Google đào tạo AI bằng 21 ngôn ngữ châu Phi, bao gồm Yoruba, Hausa và Igbo xuất hiện đầu tiên trên Technext.

Tuyên bố miễn trừ trách nhiệm: Các bài viết được đăng lại trên trang này được lấy từ các nền tảng công khai và chỉ nhằm mục đích tham khảo. Các bài viết này không nhất thiết phản ánh quan điểm của MEXC. Mọi quyền sở hữu thuộc về tác giả gốc. Nếu bạn cho rằng bất kỳ nội dung nào vi phạm quyền của bên thứ ba, vui lòng liên hệ [email protected] để được gỡ bỏ. MEXC không đảm bảo về tính chính xác, đầy đủ hoặc kịp thời của các nội dung và không chịu trách nhiệm cho các hành động được thực hiện dựa trên thông tin cung cấp. Nội dung này không cấu thành lời khuyên tài chính, pháp lý hoặc chuyên môn khác, và cũng không được xem là khuyến nghị hoặc xác nhận từ MEXC.