Trong thế giới ngày càng số hóa, thách thức không phải lúc nào cũng là thiếu thông tin, mà là không có khả năng truy cập thông tin một cách hiệu quả. Vấn đề cơ bản này,Trong thế giới ngày càng số hóa, thách thức không phải lúc nào cũng là thiếu thông tin, mà là không có khả năng truy cập thông tin một cách hiệu quả. Vấn đề cơ bản này,

Mở khóa Kiến thức Tiềm ẩn: Shrikrishna Joisa về Tương lai của OpenSpeechAI

2026/02/28 21:51
Đọc trong 11 phút

Trong thế giới ngày càng số hóa, thách thức không phải luôn là thiếu thông tin, mà là không thể truy cập thông tin một cách hiệu quả. Vấn đề cơ bản này, một nguồn gây cản trở lặp đi lặp lại trên vô số trang web và sản phẩm kỹ thuật số, đã truyền cảm hứng cho kỹ sư phần mềm Shrikrishna Joisa tạo ra OpenSpeechAI, một nền tảng sáng tạo được thiết kế để chuyển đổi cách các tổ chức giao tiếp và người dùng tìm câu trả lời.

Joisa, một Kỹ sư Phần mềm dày dạn kinh nghiệm tại Thành phố New York, chuyên về hệ thống hỗ trợ bởi AI và học máy, đã quan sát một vấn đề phổ biến: các công ty đầu tư rất nhiều vào việc tạo ra tài liệu toàn diện, Vấn đề thường gặp và các trang sản phẩm chi tiết, nhưng khách truy cập vẫn thường xuyên rời đi với những câu hỏi chưa được trả lời. Thủ phạm, ông giải thích, không phải là thiếu dữ liệu, mà là việc điều hướng tốn thời gian và trải nghiệm tìm kiếm hạn chế của các trang web truyền thống.

Unlocking Latent Knowledge: Shrikrishna Joisa on the Future of OpenSpeechAI

"Tôi thành lập OpenSpeechAI sau khi liên tục quan sát cùng một sự cản trở trên các sản phẩm kỹ thuật số và trang web công ty: thông tin tồn tại, nhưng người dùng không thể truy cập hiệu quả," Joisa nói trong một cuộc phỏng vấn. "Các nhóm đầu tư rất nhiều vào tài liệu, Vấn đề thường gặp và các trang sản phẩm, nhưng khách truy cập vẫn rời đi với những câu hỏi chưa được trả lời chỉ đơn giản vì việc điều hướng tốn thời gian và trải nghiệm tìm kiếm bị hạn chế."

Động lực của ông rất cá nhân. "Tôi ghét khi khách truy cập rời khỏi trang web của tôi với những câu hỏi chưa được trả lời. Bạn dành hàng tuần viết tài liệu, tạo các trang Vấn đề thường gặp và thêm mô tả sản phẩm chi tiết. Và vẫn vậy, mọi người nhắn tin hỏi bạn những thứ đang nằm ngay đó trên trang ba của tài liệu của bạn."

Vấn đề cốt lõi, Joisa nhấn mạnh, không phải là sự vắng mặt của thông tin, mà là khả năng khám phá nó. "Thông tin tồn tại; chỉ là mọi người không thể tìm thấy nó," ông nói. "Họ sẽ không đào qua 47 trang PDF để có được câu trả lời, và họ chắc chắn sẽ không dành 10 phút điều hướng qua cấu trúc trang web của bạn."

OpenSpeechAI được hình thành như một liều thuốc giải độc cho trò chơi trốn tìm kỹ thuật số này. Tiền đề của nó đơn giản một cách đánh lừa nhưng lại có tác động sâu sắc: tải lên nội dung của bạn, huấn luyện một AI Agent và để nó trả lời câu hỏi của khách truy cập theo thời gian thực. Cách tiếp cận này thu hẹp khoảng cách bằng cách làm cho kiến thức hiện có trở nên có tính đối thoại và có thể truy cập ngay lập tức, cho phép các tổ chức hiển thị thông tin liên quan thông qua "phản hồi AI có căn cứ". Mục tiêu, Joisa nhấn mạnh, "không phải là thay thế tài liệu, mà là làm cho nó có thể sử dụng được."

Thu hẹp khoảng cách thông tin cho B2B và B2C

Theo một báo cáo gần đây từ Master of Code, khoảng 70% đến 80% công ty đã áp dụng hoặc đang có kế hoạch áp dụng chatbots cho dịch vụ khách hàng và tương tác hỗ trợ bởi AI. Dữ liệu năm 2026 gần đây chỉ ra rằng 78% công ty đã triển khai AI Đối thoại trong ít nhất một chức năng cốt lõi. Việc áp dụng cao hơn trong lĩnh vực B2B (60%) so với B2C (42%), được thúc đẩy bởi tiết kiệm chi phí và nhu cầu dịch vụ 24/7.

Nhu cầu về OpenSpeechAI vượt qua các đặc điểm cụ thể của ngành, chứng tỏ sự quan trọng cho cả nền tảng Doanh nghiệp-với-Doanh nghiệp (B2B) và Doanh nghiệp-với-Người tiêu dùng (B2C). Như Joisa giải thích, "Cả nền tảng B2B và B2C đều gặp khó khăn với việc khám phá thông tin," ông nói. "Trong môi trường B2B, người mua thường cần làm rõ kỹ thuật trước khi đưa ra quyết định. Trong môi trường B2C, người dùng mong đợi câu trả lời tức thì và hướng dẫn được cá nhân hóa."

Các chatbot truyền thống thường thiếu sót, dựa vào các luồng kịch bản hoặc tạo ngôn ngữ chung có thể hạn chế tính hữu ích của chúng. OpenSpeechAI tự phân biệt bằng cách truy xuất và đặt nền tảng phản hồi trực tiếp trong tài liệu đã được xác minh của chính tổ chức. Điều này cho phép nó cung cấp câu trả lời theo ngữ cảnh, chính xác thay vì các câu trả lời theo mẫu, giảm đáng kể sự cản trở trong hành trình khách hàng đồng thời đảm bảo tính nhất quán của thương hiệu.

Theo một báo cáo năm 2025 từ Statista, khoảng một nửa phản hồi chatbot từ các chatbot phổ biến (phiên bản miễn phí của ChatGPT, Gemini, Copilot và Perplexity) có vấn đề về độ chính xác (48 phần trăm). Ngoài ra, 17 phần trăm có lỗi đáng kể, chủ yếu liên quan đến việc tìm nguồn và thiếu ngữ cảnh. So với báo cáo Statistica tháng 12 năm 2024, tỷ lệ phản hồi không chính xác cao hơn đáng kể: 72 phần trăm cho tất cả bốn LLM, chứng minh rằng những cải tiến lớn đang được thực hiện, tuy nhiên cần phải làm nhiều hơn nữa để cải thiện các mô hình LLM tổng thể. 

Vượt qua các hạn chế của Chatbot AI hiện tại

Joisa rất nhận thức được những thiếu sót hiện tại phổ biến trong nhiều trợ lý chatbot AI. "Một trong những hạn chế lớn nhất là độ tin cậy; nhiều chatbot AI tạo ra các phản hồi trôi chảy, nhưng nếu không đặt nền tảng các phản hồi đó trong nội dung đã được xác minh, chúng có nguy cơ tạo ra ảo giác hoặc câu trả lời mơ hồ," ông nói

Ngoài sự trôi chảy đơn thuần, ông chỉ ra sự thiếu chiều sâu trong nhiều hệ thống. "Một hạn chế khác là tương tác ở mức bề mặt." Như Joisa giải thích: "Một số hệ thống phản hồi theo cách đối thoại, nhưng thiếu truy xuất có cấu trúc, quản lý bộ nhớ theo ngữ cảnh, hoặc tích hợp với cơ sở kiến thức thực của công ty. Không có những thành phần đó, trợ lý AI có thể cảm thấy hữu ích lúc đầu nhưng thất bại dưới các truy vấn phức tạp hơn." 

OpenSpeechAI giải quyết trực tiếp những vấn đề này bằng cách ưu tiên độ chính xác, truy xuất ngữ cảnh và tích hợp sâu với cơ sở kiến thức của tổ chức.

Nghệ thuật của ngôn ngữ đối thoại và dễ tiếp cận

Đảm bảo OpenSpeechAI duy trì tính đối thoại và dễ tiếp cận về ngôn ngữ là trung tâm của thiết kế của nó. Joisa giải thích: "Duy trì sự rõ ràng trong đối thoại bắt đầu bằng ngữ cảnh. Mỗi phản hồi được tạo ra dựa trên truy vấn cụ thể của người dùng và nội dung được truy xuất liên quan nhất, thay vì dựa vào các kịch bản tĩnh hoặc câu trả lời chung."

Một tính năng quan trọng là khả năng thích ứng ngôn ngữ tự động của nó. "Hệ thống cũng phát hiện ngôn ngữ của đầu vào của người dùng và phản hồi tương ứng, cho phép các tương tác vẫn tự nhiên mà không cần cấu hình thủ công. Bằng cách kết hợp nền tảng ngữ cảnh với khả năng thích ứng ngôn ngữ tự động, trợ lý vẫn duy trì tính đối thoại trong khi vẫn phù hợp với tài liệu nguồn đã được xác minh." Điều này có nghĩa là một khách truy cập từ Tây Ban Nha đặt câu hỏi lúc 2 giờ sáng sẽ nhận được câu trả lời bằng tiếng Tây Ban Nha, một cách liền mạch và không cần bất kỳ thiết lập thủ công nào.

Nền tảng là tương lai của tương tác AI

Động lực đằng sau OpenSpeechAI—làm cho nội dung hiện có có thể truy cập theo thời gian thực bằng cách đặt nền tảng phản hồi trực tiếp trong tài liệu của chính tổ chức—là điều Joisa tin rằng định vị nó như tương lai của tương tác AI.

"Khi việc áp dụng AI tăng lên, lòng tin trở thành trung tâm," ông nói. "Người dùng và tổ chức cần các hệ thống không chỉ trôi chảy mà còn chính xác. Đặt nền tảng phản hồi trong tài liệu của chính tổ chức đảm bảo rằng câu trả lời có thể truy nguyên và phù hợp với thông tin đã được xác minh."

Cách tiếp cận này biểu thị một sự thay đổi mô hình. "Cách tiếp cận này chuyển AI từ việc là một lớp đối thoại chung sang trở thành một điểm truy cập thông minh cho kiến thức có cấu trúc; thay vì thay thế nội dung, nó nâng cao khả năng sử dụng của nó." Joisa tin tưởng mạnh mẽ vào tính bền vững lâu dài của mô hình này: "Về lâu dài, các hệ thống kết hợp truy xuất, xác thực và giao diện đối thoại sẽ bền vững hơn các công cụ tạo sinh thuần túy."

Vai trò không thể thiếu của khả năng đa ngôn ngữ

Trong bối cảnh kỹ thuật số toàn cầu hóa, hỗ trợ đa ngôn ngữ không chỉ là một tính năng, mà là một sự cần thiết. "Đối tượng kỹ thuật số là toàn cầu, và các tương tác của người dùng không tuân theo một ranh giới ngôn ngữ duy nhất. Kích hoạt khả năng đa ngôn ngữ giảm cản trở và làm cho hỗ trợ có thể truy cập trên các khu vực mà không cần triển khai riêng biệt hoặc cấu hình thủ công."

OpenSpeechAI tận dụng các mô hình ngôn ngữ tiên tiến để hỗ trợ hơn 50 ngôn ngữ được nói rộng rãi, tự động phát hiện ngôn ngữ của khách truy cập và phản hồi tương ứng. "Trọng tâm không chỉ đơn giản là dịch thuật, mà là bảo toàn ngữ cảnh và ý định trong khi đặt nền tảng phản hồi trong tài liệu nguồn của tổ chức," ông nói. "Điều này đảm bảo rằng người dùng có thể truy cập thông tin chính xác bằng ngôn ngữ mà họ cảm thấy thoải mái nhất khi sử dụng."

Con đường phía trước: Phát triển theo nhu cầu của người dùng

Nhìn về phía trước, Joisa nhấn mạnh rằng phát triển sản phẩm của OpenSpeechAI sẽ vẫn năng động và lấy người dùng làm trung tâm. "Phát triển sản phẩm sẽ tiếp tục được định hình bởi phản hồi thực của người dùng," ông nói. "Trong khi hệ thống cốt lõi tập trung vào truy xuất kiến thức và tương tác đối thoại, chúng tôi đang tích cực tinh chỉnh giao diện người dùng, mở rộng công cụ hỗ trợ và cải thiện cách các tổ chức quản lý và cập nhật nội dung của họ."

Khi việc áp dụng tăng lên, trọng tâm sẽ mở rộng vượt ra ngoài khả năng cốt lõi đến khả năng sử dụng và hỗ trợ. "Điều đó bao gồm phân tích tốt hơn, quy trình cấu hình rõ ràng hơn và cải tiến lặp đi lặp lại dựa trên cách người dùng thực sự tương tác với hệ thống," Joisa nói. "Mục tiêu dài hạn là phát triển nền tảng một cách có trách nhiệm—mở rộng các tính năng mà không làm tổn hại đến độ tin cậy, sự rõ ràng hoặc hiệu suất."

Bình luận
Tuyên bố miễn trừ trách nhiệm: Các bài viết được đăng lại trên trang này được lấy từ các nền tảng công khai và chỉ nhằm mục đích tham khảo. Các bài viết này không nhất thiết phản ánh quan điểm của MEXC. Mọi quyền sở hữu thuộc về tác giả gốc. Nếu bạn cho rằng bất kỳ nội dung nào vi phạm quyền của bên thứ ba, vui lòng liên hệ [email protected] để được gỡ bỏ. MEXC không đảm bảo về tính chính xác, đầy đủ hoặc kịp thời của các nội dung và không chịu trách nhiệm cho các hành động được thực hiện dựa trên thông tin cung cấp. Nội dung này không cấu thành lời khuyên tài chính, pháp lý hoặc chuyên môn khác, và cũng không được xem là khuyến nghị hoặc xác nhận từ MEXC.