AI & Blockchain

DeepSeek tăng cửa sổ ngữ cảnh gấp 10 lần, Zhipu AI tung GLM-5 làm nóng cuộc đua AI

Sơn Vân • 12/02/2026 05:25

Bản nâng cấp giúp mô hình AI của DeepSeek ghi nhớ và xử lý nhiều thông tin hơn trong một cuộc hội thoại.

Công ty khởi nghiệp AI (trí tuệ nhân tạo) DeepSeek vừa cập nhật mô hình chủ lực của mình trước Tết Nguyên đán, bổ sung khả năng hỗ trợ cửa sổ ngữ cảnh lớn hơn với kiến thức được cập nhật mới hơn, qua đó làm gia tăng kỳ vọng về bản phát hành lớn tiếp theo.

Khi được hỏi, chatbot cùng tên của DeepSeek xác nhận trong nhiều phản hồi rằng kể từ ngày 11.2, công ty đã mở rộng cửa sổ ngữ cảnh từ 128.000 token lên hơn 1 triệu token, mức tăng gần gấp 10 lần, được kỳ vọng sẽ cải thiện khả năng xử lý truy vấn của người dùng.

Cửa sổ ngữ cảnh lớn hơn đồng nghĩa với việc mô hình AI có thể ghi nhớ và xử lý nhiều thông tin hơn trong một cuộc trò chuyện hoặc tác vụ duy nhất, cho phép thực hiện suy luận phức tạp hơn hoặc làm việc hiệu quả hơn với dữ liệu và mã nguồn.

Bản cập nhật này cũng đẩy mốc dữ liệu kiến thức của mô hình AI DeepSeek từ tháng 7.2024 lên tháng 5.2025, bổ sung gần 1 năm thông tin mới vào hệ thống và cho phép người dùng tiếp cận dữ liệu cập nhật hơn.

DeepSeek không công bố bản cập nhật này trên các tài khoản mạng xã hội của mình và cũng không phản hồi khi trang SCMP đề nghị bình luận. Vì thế, chưa rõ đây là phiên bản mô hình AI nào.

Việc công ty khởi nghiệp có trụ sở tại thành phố Hàng Châu (Trung Quốc) nâng cấp mô hình AI diễn ra trong bối cảnh xuất hiện nhiều đồn đoán về bản phát hành lớn tiếp theo, được cho là DeepSeek V4.

Nhiều người kỳ vọng DeepSeek phát hành mô hình AI mới trước Tết Nguyên đán - Ảnh: Internet — Mô hình AI mới của DeepSeek được mở rộng cửa sổ ngữ cảnh từ 128.000 token lên hơn 1 triệu token, bổ sung gần 1 năm thông tin - Ảnh: Internet

Các công ty Trung Quốc khác đang chạy đua ra mắt những mô hình AI mới nhất trước Tết Nguyên đán với hy vọng tạo được kỳ tích giống DeepSeek năm ngoái.

Cùng ngày 11.2, Zhipu AI công bố mô hình chủ lực tiếp theo là GLM-5, động thái được dự báo sẽ làm gia tăng cạnh tranh trong cuộc đua AI.

GLM-5 của Zhipu AI được cải thiện về khả năng lập trình và năng lực tự hành động nhờ số lượng tham số tăng gấp đôi và việc áp dụng DeepSeek Sparse Attention. Đây là một kỹ thuật do DeepSeek phát minh nhằm cân bằng giữa hiệu suất mô hình AI và hiệu quả tính toán.

GLM-5 hiện có sẵn trên trang web Z.ai của Zhipu AI.

Kỳ vọng về mô hình mới của Zhipu AI cùng sự hào hứng toàn cầu khi Trung Quốc tiến bộ trong lĩnh vực AI giúp giá cổ phiếu công ty tăng hơn 40% năm ngày qua.

Trước Zhipu AI, Alibaba và Moonshot AI đã phát hành mô hình AI mới cuối tháng 1 với phiên bản Qwen3-Max-Thinking và Kimi 2.5.

Qwen3-Max-Thinking là phiên bản suy luận nâng cao của dòng Qwen3 với hệ thống suy luận quy mô lớn và hỗ trợ các công cụ gốc như tìm kiếm, ghi nhớ, chạy mã lệnh bên trong mô hình.

Mô hình mới này thay đổi cách suy luận, cho phép kiểm soát chiều sâu tư duy khi tính toán thời gian thực, tận dụng kết quả trung gian để cải thiện hiệu quả và độ chính xác.

Thêm điểm đáng chú ý là Qwen3-Max-Thinking tự quyết định khi nào nên gọi các công cụ như tìm kiếm, ghi nhớ phiên hay thực thi mã, phục vụ tốt hơn các nhiệm vụ tự chủ phức tạp.

Theo gã khổng lồ công nghệ Alibaba, Qwen3-Max-Thinking ghi nhận hiệu suất được cải thiện trong các bài kiểm tra toán học, khoa học, suy luận tổng thể và lập trình.

Trong khi đó, Kimi K2.5 của Moonshot AI nhận sự hoan nghênh toàn cầu khi các bài kiểm tra chuẩn cho thấy nó đã đưa khả năng AI mã nguồn mở của Trung Quốc đến gần các hệ thống AI mã nguồn đóng hàng đầu Mỹ hơn bao giờ hết.

Kimi K2.5 là mô hình đa phương thức nguồn mở mạnh mẽ, có khả năng xử lý văn bản, hình ảnh và video trong cùng một kiến trúc mà không cần gắn thêm mô đun riêng biệt.

Hiện tại, Kimi K2.5 được xếp hạng thứ 5 trong chỉ số trí tuệ của Artificial Analysis, chỉ đứng sau 4 mô hình hàng đầu từ các công ty Mỹ. Kimi K2.5 là mô hình AI mã nguồn mở duy nhất và mô hình duy nhất của Trung Quốc trong top 5.

Artificial Analysis là công ty nghiên cứu và đánh giá độc lập chuyên theo dõi, so sánh và xếp hạng các mô hình AI như tạo văn bản, hình ảnh, video. Công ty này xây dựng các bảng đánh giá chuẩn để đo lường chất lượng, tốc độ, chi phí và hiệu năng của từng mô hình. Từ đó, doanh nghiệp, nhà phát triển và giới đầu tư sẽ hiểu rõ mô hình AI nào đang dẫn đầu, có lợi thế về giá hay khả năng mở rộng. Các báo cáo và xếp hạng của Artificial Analysis thường được truyền thông và giới công nghệ trích dẫn như một nguồn tham khảo đáng tin cậy trong lĩnh vực AI.

Kỳ tích của DeepSeek R1

Ngày 27.1.2025, ngay trước Tết Nguyên đán, DeepSeek tung ra mô hình suy luận nguồn mở R1 có hiệu năng cao ngang sản phẩm Mỹ như của OpenAI, Google, Anthropic nhưng chi phí huấn luyện thấp hơn rất nhiều. Động thái đó đã gây chấn động giới công nghệ khi Trung Quốc chuẩn bị bước vào kỳ nghỉ Tết Ất Tỵ.

R1 đã kích hoạt đợt bán tháo cổ phiếu công nghệ trị giá khoảng 1.000 tỉ USD trên thị trường toàn cầu. Riêng Nvidia, công ty Mỹ chuyên cung cấp chip tiên tiến đắt đỏ để huấn luyện các mô hình AI, mất gần 600 tỉ USD vốn hóa thị trường chỉ trong một ngày.

Sau đó, các doanh nghiệp Trung Quốc khác đã tăng tốc phát triển các mô hình AI của riêng mình. Việc áp dụng AI tạo sinh cũng bùng nổ trong nhóm các gã khổng lồ internet Trung Quốc, từ Alibaba đến Tencent.

Hồi tháng 9.2025, DeepSeek gây sốc khi tiết lộ R1 có chi phí huấn luyện chỉ 294.000 USD và sử dụng 512 GPU Nvidia H800. Đây không phải là loại chip AI hàng đầu của Nvidia, ban đầu được phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.

Trong một báo cáo công bố tháng trước, Microsoft nhận định DeepSeek đã tái định hình bức tranh AI toàn cầu năm qua, khi đạt được sức lan tỏa đáng kể tại những thị trường chưa được các nhà cung cấp Mỹ phục vụ đầy đủ.

Báo cáo về mức độ ứng dụng AI trên toàn cầu cho thấy các mô hình AI miễn phí và có giấy phép cởi mở của DeepSeek đạt tỷ lệ sử dụng cao nhất tại những quốc gia bị hạn chế tiếp cận sản phẩm hàng đầu của Mỹ. Những thị trường này gồm Nga, Iran, Cuba, Belarus, cùng các khu vực kém phát triển hơn như nhiều quốc gia ở châu Phi.

“Việc không thu phí đăng ký hay không yêu cầu thanh toán đã hạ thấp rào cản tiếp cận với hàng triệu người dùng, đặc biệt tại những khu vực nhạy cảm về giá. Động lực này cho thấy AI mã nguồn mở có thể hoạt động như một công cụ địa chính trị, mở rộng ảnh hưởng của Trung Quốc tại những nơi mà các nền tảng phương Tây khó có thể hiện diện”, báo cáo của Microsoft nêu rõ.

Các mô hình AI mã nguồn mở của Trung Quốc từng chiếm gần 30% tổng mức sử dụng AI toàn cầu trên OpenRouter (nền tảng tổng hợp mô hình bên thứ ba) vào thời điểm đỉnh cao năm 2025, tăng mạnh từ mức chỉ 1,2% vào cuối năm 2024. OpenRouter công bố nghiên cứu này vào tháng trước.

Microsoft cảnh báo các công ty AI của Mỹ đang mất dần thị phần về tay Trung Quốc, trong cuộc chiến giành người dùng bên ngoài phương Tây.