AI & Blockchain

DeepSeek-V3.1-Terminus cải thiện lập trình và tìm kiếm: Bước tiến ở kỷ nguyên tác tử AI

Sơn Vân • 23/09/2025 17:30

DeepSeek-V3.1-Terminus được công bố chỉ 1 tháng sau khi công ty khởi nghiệp AI Trung Quốc ra mắt V3.1.

DeepSeek vừa tung ra V3.1-Terminus (bản cập nhật cho V3.1) với cải tiến về khả năng hành động tự chủ và xử lý lỗi dựa trên phản hồi từ người dùng, trong bối cảnh tập trung mạnh hơn vào tác tử AI.

Vào cuối tháng 8, V3.1 từng được Artificial Analysis đánh giá là mô hình tiên tiến nhất của DeepSeek - công ty khởi nghiệp có trụ sở ở thành phố Hàng Châu.

Artificial Analysis là công ty Mỹ chuyên về việc đánh giá và so sánh các mô hình AI. Họ cung cấp các bảng xếp hạng và báo cáo độc lập để đánh giá hiệu suất của các mô hình AI, đặc biệt là các mô hình ngôn ngữ lớn. Mục tiêu của Artificial Analysis là mang lại sự minh bạch cho thị trường AI đang phát triển nhanh chóng, giúp các nhà phát triển và doanh nghiệp đưa ra quyết định sáng suốt khi lựa chọn mô hình AI phù hợp với nhu cầu của mình.

Theo DeepSeek, V3.1 hỗ trợ cả chế độ suy luận và không suy luận, đánh dấu bước đầu tiên hướng tới kỷ nguyên tác tử AI của công ty, đặt nền móng cho việc hỗ trợ các phần mềm giúp người dùng tự động hóa những tác vụ cụ thể.

Tác tử AI là hệ thống có khả năng nhận thức, lập kế hoạch và thực hiện các hành động độc lập để đạt được mục tiêu. Ví dụ, tác tử AI có thể tự động tìm kiếm thông tin trên internet, tổng hợp dữ liệu, và thực hiện các tác vụ phức tạp mà không cần sự can thiệp liên tục từ người dùng.

DeepSeek tuyên bố V3.1 đưa ra câu trả lời nhanh hơn R1, vốn được cập nhật lần gần nhất vào cuối tháng tháng 5 qua phiên bản R1-0528.

V3.1 được mở rộng cửa sổ ngữ cảnh lên 128k, có khả năng lưu giữ nhiều thông tin hơn trong các cuộc trò chuyện với người dùng, tương đương cuốn sách khoảng 300 trang.

Ngày 23.9, DeepSeek cho biết V3.1-Terminus được cải thiện khả năng lập trình và tìm kiếm so với V3.1, cũng như tăng cường độ nhất quán về ngôn ngữ.

DeepSeek-V3.1-Terminus cải thiện lập trình và tìm kiếm Bước tiến ở kỷ nguyên tác tử AI (2) — DeepSeek-V3.1-Terminus cải thiện về khả năng lập trình và tìm kiếm so với V3.1

Trước khi có V3.1-Terminus, người dùng đã chia sẻ ảnh chụp màn hình cho thấy chatbot DeepSeek tạo ra các phản hồi chứa ký hiệu khó đọc và đôi khi tự động chuyển đổi giữa tiếng Trung và tiếng Anh mà không có yêu cầu.

Theo điểm số do chính DeepSeek công bố, V3.1-Terminus cải thiện nhẹ trên một số chuẩn đánh giá phổ biến. Trong đó có Humanity’s Last Exam (bộ câu hỏi học thuật nghiêm ngặt được thiết kế để kiểm tra giới hạn của mô hình AI) và các chuẩn đánh giá lập trình khác. Nhiều chuyên gia AI tin rằng khả năng lập trình mạnh mẽ là yếu tố then chốt để phát triển các hệ thống AI toàn diện với năng lực tổng quát.

V3.1-Terminus cũng cho thấy sự cải thiện trên chuẩn BrowseComp do OpenAI hậu thuẫn, vốn đánh giá khả năng truy xuất thông tin khó tìm từ internet. Tuy nhiên, ở phiên bản tiếng Trung của BrowseComp là BrowseComp-ZH, điểm số V3.1-Terminus lại giảm từ 49,2% xuống còn 45%.

DeepSeek-V3.1-Terminus cải thiện lập trình và tìm kiếm Bước tiến ở kỷ nguyên tác tử AI (1) — Bảng so sánh điểm của V3.1-Terminus và V3.1 trên một số chuẩn đánh giá

Chuẩn đánh giá BrowseComp-ZH dường như đặc biệt khó khăn với các mô hình AI của DeepSeek, theo ông Zhou Peilin.

Zhou Peilin là tác giả chính của BrowseComp-ZH và là nhà nghiên cứu AI tại Đại học Khoa học & Công nghệ Hồng Kông.

Ông chỉ ra rằng mô hình suy luận R1 của DeepSeek còn thể hiện kết quả tệ hơn trên chuẩn này khi được kết nối với internet. Đây là hiện tượng không xuất hiện ở các mô hình AI hàng đầu khác.

“Phải xem một báo cáo kỹ thuật đầy đủ, chúng ta mới có thể hiểu được tại sao DeepSeek-V3.1-Terminus lại hoạt động kém hơn so với V3.1 trên chuẩn đánh giá BrowseComp-ZH”, Zhou Peilin nói.

Sự cạnh tranh khốc liệt trong nước

DeepSeek đang đối mặt với sự cạnh tranh ngày càng gia tăng trên thị trường nội địa đầy biến động cho các mô hình nền tảng, với các đối thủ như dòng Qwen của Alibaba và Doubao của ByteDance ngày càng thu hút cả khách hàng doanh nghiệp lẫn người dùng phổ thông.

Theo nền tảng điện toán đám mây PPIO (Trung Quốc), DeepSeek từng chiếm hơn 99% lượng sử dụng mô hình AI mã nguồn mở trên nền tảng này trong quý 1/2025, nhưng sự thống trị đó đã suy giảm đáng kể vào tháng 5, giữa lúc các mô hình Qwen tăng mạnh về mức độ phổ biến.

Dù vậy, các mô hình AI của DeepSeek vẫn tiếp tục thu hút sự quan tâm đáng kể trên toàn cầu. DeepSeek sắp trở thành tổ chức đầu tiên vượt mốc 100.000 người theo dõi trên Hugging Face, theo bài đăng trên mạng xã hội hôm 22.9 của Clément Delangue - giám đốc điều hành nền tảng phát triển mã nguồn mở này.

DeepSeek đã công bố trọng số của DeepSeek-V3.1-Terminus trên Hugging Face và các nền tảng mã nguồn mở khác như ModelScope (do Alibaba hậu thuẫn), cho phép các nhà phát triển toàn cầu tải xuống và xây dựng phiên bản khác dựa trên mô hình này.

Át chủ bài cho tham vọng tự chủ chip AI của Trung Quốc

Ra mắt cuối tháng 8, V3.1 thổi luồng lạc quan mới vào triển vọng Trung Quốc tự phát triển được chip AI tiên tiến.

V3.1 hỗ trợ một định dạng dữ liệu sáng tạo có tên UE8M0 FP8, “mở ra một chuỗi sức mạnh điện toán nội địa bùng nổ”, các nhà phân tích thuộc Huatai Securities (công ty chứng khoán hàng đầu Trung Quốc) viết trong một báo cáo nghiên cứu.

Báo cáo cho biết kiến trúc này cho thấy sự cộng hưởng giữa phần mềm và chip do Trung Quốc thiết kế có thể mang lại những kết quả quan trọng.

FP8 (floating-point 8) là định dạng dữ liệu 8-bit, giảm độ chính xác nhằm tăng tốc độ huấn luyện và suy luận AI nhờ sử dụng ít bộ nhớ và băng thông hơn. UE8M0, một định dạng 8-bit khác, được cho là giúp tăng hiệu quả huấn luyện, giảm yêu cầu phần cứng khi có thể giảm tới 75% mức sử dụng bộ nhớ.

Định dạng dữ liệu UE8M0 FP8 của DeepSeek V3.1 được đánh giá là “trụ cột then chốt để xây dựng hệ sinh thái AI độc lập và có thể kiểm soát” cho Trung Quốc. Cường quốc châu Á đang thiết lập “hệ sinh thái lành mạnh cho sự phát triển đồng bộ của phần cứng, phần mềm và ứng dụng trong lĩnh vực tính toán AI”, theo báo cáo của Haitong Securities.

“Sự phát triển AI của Trung Quốc đang bước vào giai đoạn hợp tác giữa phần mềm và phần cứng, điều này có thể giảm đáng kể sự phụ thuộc vào sức mạnh điện toán từ nước ngoài”, nhà phân tích Mo Wenyu của công ty chứng khoán Cinda Securities viết.

Những đánh giá trên phản ánh nỗ lực ngày càng lớn của ngành AI và công nghiệp bán dẫn Trung Quốc nhằm thúc đẩy mục tiêu tự chủ công nghệ trong bối cảnh Mỹ siết chặt xuất khẩu công nghệ và căng thẳng địa chính trị gia tăng.

Diễn biến này diễn ra khi Trung Quốc bày tỏ lo ngại an ninh về các chip H20 của Nvidia. Tháng 7, một nhóm các công ty bán dẫn và AI Trung Quốc đã thành lập Liên minh Đổi mới Hệ sinh thái Mô hình-Chip nhằm thúc đẩy việc sử dụng bộ xử lý nội địa cho các dự án AI.

Hôm 21.8, DeepSeek từng gợi ý rằng V3.1 được thiết kế đặc biệt “cho các chip AI nội địa thế hệ mới sắp ra mắt”, làm bùng lên sự quan tâm của các nhà đầu tư với các nhà phát triển chip AI trong nước.

DeepSeek không nêu tên nhà cung cấp, cũng không chỉ rõ những chip AI mới sẽ được sử dụng để làm gì, huấn luyện mô hình hay suy luận (giai đoạn mà AI áp dụng những gì đã học vào thực tiễn).

Trên mạng xuất hiện cuộc thảo luận về việc nhà cung cấp chip AI nào Trung Quốc sẽ tạo nên bước đột phá trong bối cảnh các hạn chế công nghệ từ Mỹ vẫn tiếp diễn.

Các nhà cung cấp chip AI thế hệ mới cho DeepSeek được đồn đoán gồm Huawei, Moore Threads, Hygon Information Technology và MetaX Integrated Circuits. Một báo cáo của China Securities nhấn mạnh Huawei là một trong những công ty tiềm năng nhất trong lĩnh vực bán dẫn AI Trung Quốc.

“Gần đây, các sản phẩm máy chủ dựa trên chip Ascend của Huawei đã giành được nhiều đơn hàng lớn trong các ngành công nghiệp khác nhau, gồm chính phủ, tài chính và viễn thông”, China Securities cho biết. Báo cáo cũng nhấn mạnh hiệu quả chi phí của chip nội địa tiếp tục được cải thiện trong bối cảnh rủi ro ngày càng gia tăng từ chuỗi cung ứng nước ngoài.

Liu Jie, kỹ sư tại một hãng phát triển GPU (bộ xử lý đồ họa) có trụ sở ở thành phố Thượng Hải, dự đoán: “Có khả năng V3.1 sẽ hỗ trợ nhiều loại chip AI, không chỉ chip Huawei hay một công ty khác”.

“Kiến trúc FP8 được thiết kế đặc biệt để phù hợp với logic phần cứng của chip Trung Quốc, cho phép mô hình AI chạy mượt trên phần cứng này”, Su Lian Jye, nhà phân tích chính tại công ty nghiên cứu Omdia, nhận định.

Su Lian Jye bổ sung rằng các chip Trung Quốc hiện có khả năng hỗ trợ FP8 gồm sản phẩm của Huawei HiSilicon, Cambricon Technologies, MetaX và Moore Threads.

Trong một bài đăng trên WeChat, Viện nghiên cứu Zhitan AI (Trung Quốc) cho biết chip Huawei 910D và Siyuan 690 của Cambricon Technologies có thể sẽ được sử dụng cho DeepSeek V3.1.

Những đánh giá đó đã làm dấy lên suy đoán rằng một số nhà thiết kế chip nội địa có thể giành thị phần trong nước từ Nvidia, vốn đang phải đối mặt với sự giám sát chặt chẽ hơn từ các cơ quan quản lý Trung Quốc.

Giới chức nước này gần đây bày tỏ lo ngại về việc chip H20, vừa được Mỹ cho phép bán trở lại cho khách hàng Trung Quốc sau một thời gian tạm dừng, có thể gây rủi ro an ninh mạng, điều mà Nvidia bác bỏ.

Thậm chí một số cơ quan Trung Quốc như Cục Quản lý Không gian mạng (CAC), Ủy ban Cải cách và Phát triển Quốc gia (NDRC) và Bộ Công nghiệp và Công nghệ Thông tin (MIIT) hạn chế doanh nghiệp công nghệ trong nước mua chip AI Nvidia.

Dẫu vậy, Su Lian Jye dự báo DeepSeek sẽ tiếp tục gặp thách thức với chip AI thế hệ mới của Trung Quốc trong ngắn hạn.

“Đội ngũ DeepSeek luôn sử dụng chip Nvidia để phát triển mô hình của mình. Vì vậy, không có gì ngạc nhiên khi quá trình chuyển đổi sang chip AI Trung Quốc đã gặp phải những thách thức về tính ổn định, tốc độ kết nối và hệ sinh thái phần mềm”, Su Lian Jye nhận định.

Giữa tháng 8, trang FT đưa tin DeepSeek phải hoãn phát hành mô hình suy luận R2 vì cố dùng chip AI Ascend của Huawei thay Nvidia.

Theo FT, DeepSeek gặp phải các vấn đề kỹ thuật kéo dài trong quá trình huấn luyện R2 bằng chip AI Ascend. Điều đó buộc công ty phải dùng chip AI Nvidia cho giai đoạn huấn luyện và chip Huawei ở giai đoạn suy luận, các nguồn tin cho biết.