DeepSeek đại hạ giá 1 triệu token chỉ còn giá 77 VNĐ
DeepSeek liên tiếp giảm giá hai lần trong hai ngày sau khi ra mắt, đẩy giá 1 triệu token xuống chỉ còn 0,02 nhân dân tệ, tương đương 77 VNĐ.

Các mô hình ngôn ngữ lớn đang chuyển dịch mạnh mẽ từ trạng thái trò chuyện giải trí sang giai đoạn thực thi công việc thực tế. Điều khiến các nhà phát triển và người dùng doanh nghiệp thực sự lo lắng hiện nay không còn là giá của một lần hỏi đáp mà chính là chi phí token bị tiêu tốn liên tục khi vận hành các tác tử AI trong các quy trình tự động hóa phức tạp.
Khác với việc đặt câu hỏi đơn lẻ, một hệ thống tác tử AI có thể tiêu tốn hàng triệu token chỉ trong một thời gian ngắn để hoàn thành các nhiệm vụ suy luận và xử lý mã nguồn. Để giải quyết bài toán chi phí này, DeepSeek đã thực hiện hai đợt hạ giá liên tiếp chỉ trong vòng 48 giờ, đưa mức phí xử lý một triệu token xuống mức cực thấp là 0,02 nhân dân tệ (tương đương 77 đồng). Động thái này khiến lượng gọi API tăng vọt và thiết lập một chuẩn mực giá cả hoàn toàn mới cho ngành công nghiệp trí tuệ nhân tạo.
Chiến lược ép giá cực hạn đưa 1 triệu token xuống còn 77 VNĐ
DeepSeek-V4 phiên bản xem trước vừa được phát hành vào ngày 24/4 cùng với việc công bố mã nguồn mở đã tạo ra một sự quan tâm đặc biệt trong cộng đồng công nghệ nhờ năng lực của Agent và hiệu suất suy luận vượt trội. Tuy nhiên, yếu tố thực sự tạo nên sự chú ý chính là chính sách giá mang tính triệt hạ đối thủ. Ngay vào tối ngày 25/4, hãng đã công bố mức ưu đãi giảm còn 75% cho API của mô hình V4-Pro, chương trình kéo dài đến hết ngày 5/5/2026.
Tiếp đến, vào tối ngày 26/4, DeepSeek lại thực hiện một bước đi táo bạo hơn khi hạ giá cho các lượt trúng bộ nhớ đệm đầu vào (những đoạn dữ liệu văn bản mà hệ thống AI không cần phải tốn công tính toán và xử lý lại từ đầu vì chúng đã được lưu trữ sẵn trong bộ nhớ tạm thời của máy chủ) xuống chỉ còn 1/10 so với giá ban đầu. Khi cộng dồn các ưu đãi này, mức giá xử lý trúng bộ nhớ đệm cho mỗi triệu token của DeepSeek-V4-Flash chỉ còn 0,02 nhân dân tệ, còn phiên bản Pro cũng chỉ ở mức 0,025 nhân dân tệ.
Để thấy rõ sức mạnh của đòn đại hạ giá này, chúng ta cần thực hiện một phép so sánh trực tiếp với các ông lớn hàng đầu thế giới. Từ trước đợt giảm giá liên tiếp hai ngày này, giá của DeepSeek-V4 vốn đã cực kỳ "có tính sát thương". Cùng xử lý một triệu token cho cả đầu vào và đầu ra:
- GPT-5.5: Tổng chi phí khoảng 35 USD
- Claude Opus 4.7: Tổng chi phí khoảng 30 USD
- DeepSeek-V4-Pro: Chỉ cần 5,27 USD
Nếu đầu vào trúng bộ nhớ đệm, giá đầu vào tiếp tục giảm xuống còn 0,145 USD/triệu token, tổng chi phí giảm xuống còn 3,66 USD.
Nói cách khác, ở mức giá tiêu chuẩn, chi phí của DeepSeek-V4-Pro chỉ bằng khoảng 1/7 so với GPT-5.5 và 1/6 so với Claude Opus 4.7. Nếu trúng cache, tỷ lệ này còn giảm xuống khoảng 1/10 và 1/8.
Riêng với DeepSeek-V4-Flash:
- Giá đầu vào: 0,145 USD/triệu token
- Giá đầu ra: 0,293 USD/triệu token
- Tổng cộng: 0,439 USD
- Sau khi trúng cache: giảm tiếp xuống còn 0,322 USD
Và hiện nay, với việc giảm giá cộng dồn ưu đãi giới hạn thời gian (trước 5/5/2026), mức giá cho trường hợp trúng cache đầu vào của DeepSeek-V4-Pro đã hạ xuống chỉ còn 0,025 nhân dân tệ/triệu token và với DeepSeek-V4-Flash là 0,02 nhân dân tệ/triệu token (khoảng 77 VNĐ), tức bằng 1/40 so với giá gốc.
Lượng gọi API tăng trưởng phi mã và áp lực thay đổi toàn hệ sinh thái
Sức hấp dẫn từ mức giá siêu rẻ kết hợp cùng năng lực thực thi mạnh mẽ đã ngay lập tức mang lại kết quả thực tế trên các nền tảng công nghệ số. Dữ liệu từ OpenRouter, hệ thống tổng hợp giao diện lập trình ứng dụng lớn nhất hiện nay, cho thấy lượng gọi các mô hình của DeepSeek đã tăng trưởng bùng nổ ngay sau khi ra mắt.
Vào ngày 25/4, lượng gọi mô hình DeepSeek-V4-Flash đạt mức 50,2 tỉ token, tăng trưởng gần 86% so với ngày trước đó. Đặc biệt hơn, phiên bản V4-Pro ghi nhận lượng gọi đạt 13,6 tỉ token, tăng gấp gần bốn lần so với dữ liệu của ngày 24/4. Mặc dù lượng gọi có sự điều chỉnh nhẹ sau những đợt bùng phát ban đầu, nhưng xu hướng tăng trưởng đi lên vẫn là một minh chứng không thể phủ nhận cho sự ưu tiên của các nhà lập trình đối với các giải pháp tiết kiệm chi phí.
Theo Giáo sư Hồ Diên Bình từ Đại học Tài chính và Kinh tế Thượng Hải, động thái này nhắm thẳng vào việc thu hút nhóm khách hàng doanh nghiệp và các nhà phát triển Agent thông minh. Do các Agent thường tiêu tốn lượng token rất lớn cho các nhiệm vụ suy luận chuyên sâu và xử lý ngữ cảnh dài, việc DeepSeek cung cấp mức giá thấp hơn hẳn các mô hình nội địa khác mang lại một sức hút vô cùng mãnh liệt.
Hành động hạ giá kịch sàn này đang tạo ra một áp lực khổng lồ lên kỳ vọng giá của các mô hình nội địa khác như Kimi, Qwen hay MiniMax. Các chuyên gia nhận định rằng nếu năng lực tính toán suy luận trong nước tiếp tục được mở rộng quy mô, thị trường có thể sẽ chứng kiến một bước ngoặt về giá cả trong tương lai gần.
Dù đòn tấn công này có thể chưa gây ảnh hưởng trực tiếp đến các mô hình đóng nguồn đỉnh cao như GPT-5.5 hay Claude 4.7 Opus do tệp khách hàng đặc thù, sự xuất hiện của DeepSeek-V4 chắc chắn đã làm xáo trộn thị trường. Đối với đông đảo các nhà phát triển, một kỷ nguyên mới với nhiều lựa chọn đa dạng và chi phí vận hành thấp hơn đang tiến đến ngày một nhanh hơn.
Sự hiện diện của DeepSeek giống như một nhân tố khuấy đảo, thúc đẩy các nhà sản xuất khác phải tối ưu hóa quy trình để giảm giá thành nếu không muốn bị bỏ lại phía sau. Cuối cùng, chính người dùng và các doanh nghiệp sẽ là những đối tượng hưởng lợi lớn nhất từ cuộc đua giảm giá khốc liệt này, giúp cho các ứng dụng trí tuệ nhân tạo trở nên phổ biến và thực dụng hơn trong mọi ngõ ngách của đời sống kinh tế.


