TLDRs; DeepSeek ra mắt V3.2-exp, một mô hình AI thử nghiệm cắt giảm chi phí suy luận cho các tác vụ ngữ cảnh dài gần một nửa. Mô hình sử dụng "Sparse Attention" và "lightning indexer" để xử lý đầu vào dài một cách hiệu quả hơn. Được phát hành dưới dạng mô hình trọng số mở trên Hugging Face, nó cho phép Bên thứ ba kiểm tra và đánh giá. DeepSeek đối mặt với sự cạnh tranh ngày càng tăng từ các công ty công nghệ Trung Quốc được tài trợ mạnh mẽ [...] Bài viết New DeepSeek Model Halves API Costs for Extended Contexts xuất hiện đầu tiên trên CoinCentral.TLDRs; DeepSeek ra mắt V3.2-exp, một mô hình AI thử nghiệm cắt giảm chi phí suy luận cho các tác vụ ngữ cảnh dài gần một nửa. Mô hình sử dụng "Sparse Attention" và "lightning indexer" để xử lý đầu vào dài một cách hiệu quả hơn. Được phát hành dưới dạng mô hình trọng số mở trên Hugging Face, nó cho phép Bên thứ ba kiểm tra và đánh giá. DeepSeek đối mặt với sự cạnh tranh ngày càng tăng từ các công ty công nghệ Trung Quốc được tài trợ mạnh mẽ [...] Bài viết New DeepSeek Model Halves API Costs for Extended Contexts xuất hiện đầu tiên trên CoinCentral.

Mô hình DeepSeek mới giảm một nửa chi phí API cho ngữ cảnh mở rộng

2025/09/30 21:59
Đọc trong 5 phút
Đối với phản hồi hoặc thắc mắc liên quan đến nội dung này, vui lòng liên hệ với chúng tôi qua [email protected]

TLDRs;

  • DeepSeek đã ra mắt V3.2-exp, một mô hình AI thử nghiệm giảm chi phí suy luận cho các tác vụ ngữ cảnh dài gần một nửa.
  • Mô hình sử dụng "Sparse Attention" và "lightning indexer" để xử lý đầu vào dài một cách hiệu quả hơn.
  • Được phát hành dưới dạng mô hình trọng số mở trên Hugging Face, cho phép bên thứ ba kiểm tra và đánh giá.
  • DeepSeek đối mặt với sự cạnh tranh ngày càng tăng từ các gã khổng lồ công nghệ Trung Quốc được tài trợ mạnh mẽ đang mở rộng danh mục đầu tư AI của họ.

Công ty khởi nghiệp AI có trụ sở tại Trung Quốc DeepSeek đã giới thiệu mô hình ngôn ngữ thử nghiệm mới nhất của mình, V3.2-exp, được thiết kế để cắt giảm chi phí suy luận cho các tác vụ ngữ cảnh dài gần một nửa.

Mô hình được công bố vào thứ Hai, nhằm giải quyết một trong những thách thức cấp bách nhất trong việc áp dụng AI quy mô lớn: chi phí xử lý đầu vào mở rộng.

V3.2-exp tận dụng hệ thống mới có tên DeepSeek Sparse Attention, kết hợp "lightning indexer" với một mô-đun phụ để lựa chọn token chi tiết.

Cùng nhau, những đổi mới này cho phép mô hình tập trung vào các đoạn trích liên quan nhất trong khi quản lý chi tiết cấp token một cách chính xác. Thử nghiệm nội bộ ban đầu cho thấy hệ thống có thể giảm đáng kể tải máy chủ, với chi phí API có khả năng giảm 50% cho các hoạt động ngữ cảnh dài.

Mô hình trọng số mở hiện đã có sẵn

Không giống như nhiều bản phát hành AI thương mại vẫn đóng, V3.2-exp đã được ra mắt như một mô hình trọng số mở. Hiện nó có thể truy cập trên Hugging Face, mang đến cho các nhà nghiên cứu, nhà phát triển và doanh nghiệp cơ hội để chạy đánh giá độc lập.

Quyết định này nhấn mạnh nỗ lực liên tục của DeepSeek hướng tới tính minh bạch và hợp tác, đặc biệt khi các công ty ngày càng xem xét kỹ lưỡng các tuyên bố về hiệu quả và hiệu suất.

Việc phát hành mô hình mở cũng phù hợp với chiến lược trước đây của DeepSeek với mô hình R1 của họ vào đầu năm nay, nơi việc đánh giá mở cho phép cộng đồng xác minh khả năng lập luận của nó. Bằng cách áp dụng cùng một phương pháp cho V3.2-exp, DeepSeek đang thể hiện sự tự tin vào những đột phá về hiệu quả của mình.

Xây dựng trên các bản phát hành trước đây

Việc ra mắt V3.2-exp diễn ra sau một loạt các bản cập nhật và thử nghiệm từ DeepSeek trong những tháng gần đây. Vào đầu tháng 9 này, công ty đã giới thiệu DeepSeek-V3.1-Terminus, một bản tinh chỉnh nhằm cải thiện hiệu suất AI Agent và giải quyết các vấn đề được báo cáo như ký hiệu không đọc được và chuyển đổi ngôn ngữ không nhất quán.

Mặc dù bản cập nhật đó mang lại những cải tiến nhỏ trong các tiêu chuẩn như Humanity's Last Exam và các nhiệm vụ lập trình, một số thách thức vẫn còn tồn tại, đặc biệt là trong hiệu suất ngôn ngữ Trung Quốc.

Trong khi đó, các báo cáo ngành đã tiết lộ rằng DeepSeek đang làm việc trên một mô hình tập trung vào AI Agent thế hệ tiếp theo, dự kiến ra mắt vào Q4 2025. Dự án phản ánh sự chuyển dịch rộng hơn của ngành công nghiệp hướng tới các hệ thống AI tự chủ, có khả năng thực hiện các nhiệm vụ nhiều bước với sự giám sát tối thiểu của con người. Bản phát hành V3.2-exp dường như bổ sung cho quỹ đạo này bằng cách củng cố nền tảng công nghệ của công ty về hiệu quả trước khi các tính năng AI Agent tiên tiến hơn được triển khai.

Cảnh quan cạnh tranh nóng lên

Sự đổi mới của DeepSeek xuất hiện vào thời điểm cạnh tranh trong lĩnh vực AI Trung Quốc đang gia tăng. Các công ty đối thủ như Alibaba và Tencent đang mở rộng đầu tư AI của họ một cách đáng kể, với Alibaba cam kết hơn 380 tỷ RMB (52,9 tỷ USD) vào điện toán đám mây và cơ sở hạ tầng AI.

Mặc dù DeepSeek đã được ca ngợi vì đạt được kết quả hiệu quả về chi phí với nguồn lực tương đối khiêm tốn, các nhà phân tích cảnh báo rằng công ty phải duy trì đà phát triển để tránh bị lu mờ bởi các đối thủ giàu tiền mặt của mình.

Bài viết Mô hình DeepSeek mới giảm một nửa chi phí API cho ngữ cảnh mở rộng xuất hiện đầu tiên trên CoinCentral.

Cơ hội thị trường
Logo null
Giá null(null)
--
----
USD
Biểu đồ giá null (null) theo thời gian thực
Tuyên bố miễn trừ trách nhiệm: Các bài viết được đăng lại trên trang này được lấy từ các nền tảng công khai và chỉ nhằm mục đích tham khảo. Các bài viết này không nhất thiết phản ánh quan điểm của MEXC. Mọi quyền sở hữu thuộc về tác giả gốc. Nếu bạn cho rằng bất kỳ nội dung nào vi phạm quyền của bên thứ ba, vui lòng liên hệ [email protected] để được gỡ bỏ. MEXC không đảm bảo về tính chính xác, đầy đủ hoặc kịp thời của các nội dung và không chịu trách nhiệm cho các hành động được thực hiện dựa trên thông tin cung cấp. Nội dung này không cấu thành lời khuyên tài chính, pháp lý hoặc chuyên môn khác, và cũng không được xem là khuyến nghị hoặc xác nhận từ MEXC.