DeepSeek ra mô hình AI 'giảm nửa chi phí khi suy luận'

DeepSeek ra mô hình AI 'giảm nửa chi phí khi suy luận'

DeepSeek ra mô hình AI 'giảm nửa chi phí khi suy luận'

30-09-2025, 11:13 am

Ngày 29/9, DeepSeek công bố mô hình V3.2-exp trên nền tảng Hugging Face và GitHub. Đây là phiên bản thử nghiệm mới được thiết kế để tối ưu khả năng xử lý ngữ cảnh dài, đồng thời giảm đáng kể chi phí suy luận. Mô hình hiện trong giai đoạn thử nghiệm cuối và sẽ sớm triển khai dưới dạng API cho các nhà phát triển.

Sparse Attention – Trái tim của V3.2-exp

Điểm nổi bật nhất của V3.2-exp chính là DeepSeek Sparse Attention, một hệ thống phức tạp sử dụng module riêng để ưu tiên xử lý các đoạn trích quan trọng trong cửa sổ ngữ cảnh.

Cùng với đó, kỹ thuật “fine-grained token selection” cho phép chọn lọc chính xác các token cần thiết, đưa vào “cửa sổ Attention” theo trình tự hạn chế. Cách tiếp cận này giúp tiết kiệm tài nguyên nhưng vẫn đảm bảo chất lượng suy luận, đặc biệt hiệu quả khi làm việc với chuỗi ngữ cảnh dài.

Giảm chi phí suy luận tới một nửa

Theo kết quả thử nghiệm sơ bộ, chi phí cho một lệnh gọi API đơn giản trong ngữ cảnh dài có thể giảm tới 50% khi sử dụng Sparse Attention. Đây được coi là bước tiến lớn, nhất là trong bối cảnh nhiều doanh nghiệp đang phải đối mặt với chi phí hạ tầng AI ngày càng tăng.

Tuy vậy, DeepSeek cũng lưu ý rằng mô hình vẫn cần thêm thời gian thử nghiệm và đánh giá chi tiết trước khi chính thức ra mắt bản hoàn thiện cho người dùng cuối.

Tiềm năng ứng dụng rộng mở

Theo TechCrunch, V3.2-exp có thể trở thành giải pháp đột phá trong việc cung cấp khả năng suy luận hiệu năng cao với chi phí thấp – một trong những bài toán được quan tâm nhiều nhất trong lĩnh vực AI hiện nay. Với lợi thế về chi phí, V3.2-exp hứa hẹn giúp công nghệ AI tiếp cận đến nhiều doanh nghiệp và nhà phát triển hơn.

DeepSeek – Hành trình theo đuổi AI hiệu quả và chi phí thấp

DeepSeek có trụ sở tại Trung Quốc, từng gây chú ý mạnh mẽ với các mô hình V3 và R1 hồi đầu năm. Công ty nổi tiếng với việc áp dụng phương pháp “chưng cất” (distillation), cho phép mô hình đạt hiệu suất cao trong khi chi phí đào tạo và vận hành rẻ hơn nhiều.

Tuy nhiên, dù tạo được tiếng vang ban đầu, những mô hình trước đây chưa đủ tạo ra cuộc cách mạng toàn diện như kỳ vọng, khiến DeepSeek dần mất đi sự chú ý trong thời gian sau. Với V3.2-exp, công ty kỳ vọng sẽ lấy lại vị thế trong cuộc đua phát triển AI toàn cầu.

DeepSeek V3.2-exp đánh dấu bước tiến mới trong việc cân bằng giữa hiệu năng và chi phí, mở ra cơ hội để AI trở nên phổ cập hơn trong nhiều lĩnh vực.

avatar
Nguyễn Hà My
Author Tại
Maytinhcdc
Là một nhân viên của maytinhcdc.vn, đồng thời cũng là một người yêu thích công nghệ, mình mong muốn có thể cung cấp tới mọi người những thông tin hữu ích nhất
Bài viết liên quan