Công ty khởi nghiệp AI có trụ sở tại Trung Quốc DeepSeek đã giới thiệu mô hình ngôn ngữ thử nghiệm mới nhất của mình, V3.2-exp, được thiết kế để cắt giảm chi phí suy luận cho các tác vụ ngữ cảnh dài gần một nửa.
Mô hình được công bố vào thứ Hai, nhằm giải quyết một trong những thách thức cấp bách nhất trong việc áp dụng AI quy mô lớn: chi phí xử lý đầu vào mở rộng.
V3.2-exp tận dụng hệ thống mới có tên DeepSeek Sparse Attention, kết hợp "lightning indexer" với một mô-đun phụ để lựa chọn token chi tiết.
Cùng nhau, những đổi mới này cho phép mô hình tập trung vào các đoạn trích liên quan nhất trong khi quản lý chi tiết cấp token một cách chính xác. Thử nghiệm nội bộ ban đầu cho thấy hệ thống có thể giảm đáng kể tải máy chủ, với chi phí API có khả năng giảm 50% cho các hoạt động ngữ cảnh dài.
Không giống như nhiều bản phát hành AI thương mại vẫn đóng, V3.2-exp đã được ra mắt như một mô hình trọng số mở. Hiện nó có thể truy cập trên Hugging Face, mang đến cho các nhà nghiên cứu, nhà phát triển và doanh nghiệp cơ hội để chạy đánh giá độc lập.
Quyết định này nhấn mạnh nỗ lực liên tục của DeepSeek hướng tới tính minh bạch và hợp tác, đặc biệt khi các công ty ngày càng xem xét kỹ lưỡng các tuyên bố về hiệu quả và hiệu suất.
Việc phát hành mô hình mở cũng phù hợp với chiến lược trước đây của DeepSeek với mô hình R1 của họ vào đầu năm nay, nơi việc đánh giá mở cho phép cộng đồng xác minh khả năng lập luận của nó. Bằng cách áp dụng cùng một phương pháp cho V3.2-exp, DeepSeek đang thể hiện sự tự tin vào những đột phá về hiệu quả của mình.
Việc ra mắt V3.2-exp diễn ra sau một loạt các bản cập nhật và thử nghiệm từ DeepSeek trong những tháng gần đây. Vào đầu tháng 9 này, công ty đã giới thiệu DeepSeek-V3.1-Terminus, một bản tinh chỉnh nhằm cải thiện hiệu suất AI Agent và giải quyết các vấn đề được báo cáo như ký hiệu không đọc được và chuyển đổi ngôn ngữ không nhất quán.
Mặc dù bản cập nhật đó mang lại những cải tiến nhỏ trong các tiêu chuẩn như Humanity's Last Exam và các nhiệm vụ lập trình, một số thách thức vẫn còn tồn tại, đặc biệt là trong hiệu suất ngôn ngữ Trung Quốc.
Trong khi đó, các báo cáo ngành đã tiết lộ rằng DeepSeek đang làm việc trên một mô hình tập trung vào AI Agent thế hệ tiếp theo, dự kiến ra mắt vào Q4 2025. Dự án phản ánh sự chuyển dịch rộng hơn của ngành công nghiệp hướng tới các hệ thống AI tự chủ, có khả năng thực hiện các nhiệm vụ nhiều bước với sự giám sát tối thiểu của con người. Bản phát hành V3.2-exp dường như bổ sung cho quỹ đạo này bằng cách củng cố nền tảng công nghệ của công ty về hiệu quả trước khi các tính năng AI Agent tiên tiến hơn được triển khai.
Sự đổi mới của DeepSeek xuất hiện vào thời điểm cạnh tranh trong lĩnh vực AI Trung Quốc đang gia tăng. Các công ty đối thủ như Alibaba và Tencent đang mở rộng đầu tư AI của họ một cách đáng kể, với Alibaba cam kết hơn 380 tỷ RMB (52,9 tỷ USD) vào điện toán đám mây và cơ sở hạ tầng AI.
Mặc dù DeepSeek đã được ca ngợi vì đạt được kết quả hiệu quả về chi phí với nguồn lực tương đối khiêm tốn, các nhà phân tích cảnh báo rằng công ty phải duy trì đà phát triển để tránh bị lu mờ bởi các đối thủ giàu tiền mặt của mình.
Bài viết Mô hình DeepSeek mới giảm một nửa chi phí API cho ngữ cảnh mở rộng xuất hiện đầu tiên trên CoinCentral.



