Đột phá

Hãng Trung Quốc nào thay Nvidia cung cấp chip AI thế hệ mới cho DeepSeek?

Sơn Vân • 23/08/2025 23:33

Làn sóng đồn đoán xuất hiện sau khi DeepSeek hé lộ các chip AI thế hệ mới của Trung Quốc sắp ra mắt.

Hôm 21.8 ,DeepSeek tiết lộ mô hình V3.1 hỗ trợ cả chế độ suy luận và không suy luận, đánh dấu bước đầu tiên hướng tới kỷ nguyên tác tử AI của công ty. Đây là động thái cho thấy sự thay đổi của DeepSeek trong trọng tâm nghiên cứu.

Tác tử AI là hệ thống có khả năng nhận thức, lập kế hoạch và thực hiện các hành động độc lập để đạt được mục tiêu. Ví dụ, tác tử AI có thể tự động tìm kiếm thông tin trên internet, tổng hợp dữ liệu, và thực hiện các tác vụ phức tạp mà không cần sự can thiệp liên tục từ người dùng.

Chế độ suy luận trên chatbot cùng tên DeepSeek trước đó được vận hành bởi R1, từng gây chú ý toàn cầu sau khi ra mắt vào tháng 1, ngay sau khi mô hình nền tảng V3 được giới thiệu hồi tháng 12.2024.

Trong khi V3.1 (bản nâng cấp cho V3) áp dụng cách tiếp cận “một mô hình, hai chế độ”, cho thấy DeepSeek có thể sẽ không phát triển R2 - phiên bản kế nhiệm mô hình suy luận R1.

DeepSeek cho biết V3.1 đưa ra câu trả lời nhanh hơn R1, vốn được cập nhật lần gần nhất vào cuối tháng tháng 5 qua phiên bản R1-0528.

Được mở rộng cửa sổ ngữ cảnh lên 128k, V3.1 có khả năng lưu giữ nhiều thông tin hơn trong các cuộc trò chuyện với người dùng, tương đương cuốn sách khoảng 300 trang.

V3.1 đã có mặt trên Hugging Face - cộng đồng AI mã nguồn mở lớn nhất thế giới. Một số thử nghiệm bên thứ ba cho thấy V3.1 đã cải thiện khả năng lập trình.

Theo Aider Benchmark - bộ đánh giá khả năng lập trình của mô hình AI, DeepSeek V3.1 đứng đầu trong số các hệ thống Trung Quốc. Song khi so với các đối thủ quốc tế, V3.1 vẫn xếp sau Claude Opus 4, vốn được công nhận là một trong những mô hình AI lập trình tốt nhất hiện nay.

DeepSeek V3.1 mở đường cho tác tử AI, Trung Quốc sắp ra chip AI thế hệ mới (2) — DeepSeek V3.1 là mô hình lai, hỗ trợ cả chế độ suy luận và không suy luận - Ảnh: Internet

Cũng trong ngày 21.8, DeepSeek bất ngờ hé lộ “các chip AI nội địa thế hệ mới" sắp ra mắt. Cụ thể hơn, công ty khởi nghiệp AI có trụ sở ở thành phố Hàng Châu cho biết Trung Quốc sắp có các chip thế hệ mới tự phát triển được thiết kế đặc biệt để xếp chồng lên nhau nhằm tăng cường hiệu suất cho tác vụ AI. Đây là kỹ thuật tiên tiến trong công nghệ bán dẫn, cho phép kết nối nhiều chip theo chiều dọc, tạo thành một khối tích hợp 3D, với mục đích:

Tăng mật độ và hiệu suất: Xếp chồng chip giúp gói gọn nhiều sức mạnh xử lý hơn trong cùng một không gian, từ đó tăng tốc độ tính toán.

Giảm độ trễ: Các kết nối giữa các lớp chip ngắn hơn nhiều so với việc đặt chúng cạnh nhau trên bảng mạch in, giúp giảm độ trễ khi truyền dữ liệu.

Tăng băng thông: Việc xếp chồng cũng giúp mở rộng băng thông bộ nhớ và xử lý, cho phép truyền tải lượng dữ liệu khổng lồ cần thiết cho các mô hình AI một cách nhanh chóng.

Thông qua dòng ghi chú trên tài khoản WeChat chính thức liên quan V3.1, DeepSeek nói rằng mô hình AI này được thiết kế “đặc biệt cho các chip nội địa sắp đến”. Tuy nhiên, công ty không nêu rõ nhà cung cấp các chip này, cũng không cho biết chúng sẽ được sử dụng trong huấn luyện hay suy luận AI.

Trong một tài liệu kỹ thuật, DeepSeek giải thích V3.1 được huấn luyện “bằng định dạng dữ liệu UE8M0 FP8 scale để đảm bảo khả năng tương thích với các định dạng dữ liệu vi mô”.

UE8M0 FP8 scale là định dạng dữ liệu số 8-bit đặc biệt, được thiết kế để huấn luyện AI nhanh hơn, tiêu tốn ít bộ nhớ hơn, đồng thời có thể tương thích với các chip và định dạng dữ liệu tối ưu hóa hiệu suất.

FP8 (floating-point 8) là định dạng dữ liệu 8-bit, giảm độ chính xác nhằm tăng tốc độ huấn luyện và suy luận AI nhờ sử dụng ít bộ nhớ và băng thông hơn. UE8M0, biến thể với 8 bit cho số mũ và 0 bit cho phần định trị, có thể nâng cao hiệu suất huấn luyện hơn nữa và từ đó giảm yêu cầu phần cứng, khi có khả năng cắt giảm tới 75% mức sử dụng bộ nhớ.

Phần định trị là thuật ngữ trong tin học và toán học, dùng để chỉ phần có nghĩa của một số dấu phẩy động. Nó chứa các chữ số quan trọng của số đó, không bao gồm vị trí của dấu phẩy.

Hãy tưởng tượng một số dấu phẩy động được biểu diễn dưới dạng khoa học, ví dụ 123.45 có thể viết lại là 1.2345×10². Trong ví dụ này, 1.2345 là phần định trị, 10 là cơ số, 2 là số mũ.

Thông tin trên gợi ý rằng Trung Quốc đã đạt tiến bộ quan trọng trong việc xây dựng một hệ thống AI tự chủ hoàn toàn bằng công nghệ nội địa - bước phát triển có thể giúp nước này giảm thiểu tác động từ các hạn chế xuất khẩu chip từ Mỹ.

Việc DeepSeek sử dụng các định dạng này, nếu kết hợp với chip nội địa Trung Quốc, có thể tạo ra bước đột phá mới trong phối hợp giữa phần cứng và phần mềm.

Huawei, Cambricon Technologies hay Moore Threads cung cấp chip AI thế hệ mới cho DeepSeek?

Bài đăng ngắn gọn trên WeChat của DeepSeek làm dấy lên cuộc thảo luận trực tuyến về việc nhà cung cấp chip AI nào sẽ tạo nên bước đột phá trong bối cảnh các hạn chế công nghệ từ Mỹ vẫn tiếp diễn.

Những cái tên được nhắc đến gồm Huawei, Cambricon Technologies, Moore Threads, Hygon Information Technology và MetaX Integrated Circuits.

Ngoài việc không nêu tên nhà cung cấp, DeepSeek cũng không chỉ rõ những chip AI mới sẽ được sử dụng để làm gì, huấn luyện mô hình hay suy luận (giai đoạn mà AI áp dụng những gì đã học vào thực tiễn).

“Cũng có khả năng V3.1 sẽ hỗ trợ nhiều loại chip AI, không chỉ chip Huawei hay một công ty khác”, Liu Jie, kỹ sư tại một hãng phát triển GPU (bộ xử lý đồ họa) có trụ sở ở thành phố Thượng Hải, dự đoán.

Những lời đồn đoán trên phản ánh không chỉ niềm tin ngày càng lớn vào các chip AI được thiết kế và sản xuất trong nước, mà còn cho thấy ngành công nghiệp bán dẫn Trung Quốc từng bước vượt qua các lệnh trừng phạt công nghệ của Mỹ.

“Kiến trúc FP8 được thiết kế đặc biệt để phù hợp với logic phần cứng của chip Trung Quốc, cho phép mô hình AI chạy mượt trên phần cứng này”, Su Lian Jye, nhà phân tích chính tại công ty nghiên cứu Omdia, nhận định.

Su Lian Jye bổ sung rằng các chip Trung Quốc hiện có khả năng hỗ trợ FP8 gồm sản phẩm của Huawei HiSilicon, Cambricon Technologies, MetaX và Moore Threads.

Hãng Trung Quốc nào thay Nvidia cung cấp chip AI thế hệ mới cho DeepSeek (2) — Chip AI của Huawei dự kiến sẽ có thêm nhiều người dùng khi Trung Quốc

Trong một bài đăng trên WeChat hôm 23.8, viện nghiên cứu Zhitan AI (Trung Quốc) cho biết chip Huawei 910D và Siyuan 690 của Cambricon Technologies có thể sẽ được sử dụng cho DeepSeek V3.1.

Những đánh giá đó đã làm dấy lên suy đoán rằng một số nhà thiết kế chip nội địa có thể giành thị phần trong nước từ Nvidia (Mỹ), vốn đang phải đối mặt với sự giám sát chặt chẽ hơn từ các cơ quan quản lý Trung Quốc.

Giới chức nước này gần đây bày tỏ lo ngại về việc chip H20, vừa được Mỹ cho phép bán trở lại cho khách hàng Trung Quốc sau một thời gian tạm dừng, có thể gây rủi ro an ninh mạng, điều mà Nvidia bác bỏ.

Thậm chí một số cơ quan Trung Quốc như Cục Quản lý Không gian mạng (CAC), Ủy ban Cải cách và Phát triển Quốc gia (NDRC) và Bộ Công nghiệp và Công nghệ Thông tin (MIIT) tìm cách hạn chế doanh nghiệp công nghệ trong nước mua chip AI Nvidia, theo hai nguồn tin của FT.

"DeepSeek gặp thách thức khi dùng chip AI thế hệ mới của Trung Quốc"

Dẫu vậy, Su Lian Jye dự báo DeepSeek sẽ tiếp tục gặp thách thức với chip AI thế hệ mới của Trung Quốc trong ngắn hạn.

“Đội ngũ DeepSeek luôn sử dụng chip Nvidia để phát triển mô hình của mình. Vì vậy, không có gì ngạc nhiên khi quá trình chuyển đổi sang chip AI Trung Quốc đã gặp phải những thách thức về tính ổn định, tốc độ kết nối và hệ sinh thái phần mềm”, Su Lian Jye nhận định.

Gần đây, trang FT đưa tin DeepSeek phải hoãn phát hành mô hình suy luận R2 vì cố dùng chip AI Ascend của Huawei thay Nvidia.

Theo FT, DeepSeek gặp phải các vấn đề kỹ thuật kéo dài trong quá trình huấn luyện R2 bằng chip AI Ascend. Điều đó buộc công ty phải dùng chip AI Nvidia cho giai đoạn huấn luyện và chip Huawei ở giai đoạn suy luận, các nguồn tin cho biết.

Huawei và các hãng chip Trung Quốc tìm cách thách thức Nvidia

Huawei (có trụ sở ở thành phố Thâm Quyến) đã tăng tốc xây dựng hệ sinh thái phần cứng AI hoàn chỉnh nhằm thách thức Nvidia ở thị trường Trung Quốc. Đầu năm nay, Huawei đã ra mắt hệ thống máy tính CloudMatrix 384, gồm 384 chip AI Ascend 910C và 192 CPU máy chủ Kunpeng, được kết nối qua một bus thống nhất mang lại băng thông siêu cao và độ trễ thấp.

Moore Threads, nhà sản xuất GPU tại thủ đô Bắc Kinh, đến nay là công ty duy nhất công khai tuyên bố rằng chip của họ có thể được dùng cho định dạng FP8. Wang Hua, Phó chủ tịch Moore Threads, phát biểu tại Hội nghị Trí tuệ Nhân tạo Thế giới (WAIC) vào tháng 7 rằng công ty đang tăng cường đầu tư vào kiến trúc này.

Cambricon (cũng có trụ sở ở Bắc Kinh) đã sản xuất được hàng loạt chip Siyuan 690 phục vụ huấn luyện AI vào năm 2024.

Huawei và Moore Threads đã gấp rút điều chỉnh chip của họ nhằm vận hành một số mô hình AI Trung Quốc, trong đó có DeepSeek, cố lấp vào khoảng trống do Nvidia và AMD để lại khi Mỹ siết chặt kiểm soát xuất khẩu.

Một số công ty khởi nghiệp hạ tầng AI Trung Quốc, gồm cả SiliconFlow, đã chuyển sang sử dụng chip Ascend của Huawei để vận hành mô hình DeepSeek. Nghiên cứu chung giữa SiliconFlow và Huawei công bố hồi tháng 6 khẳng định rằng kiến trúc trung tâm dữ liệu Cloud Matrix 384 của Huawei, kết hợp với chip Ascend, có thể chạy mô hình DeepSeek R1 hiệu quả hơn cả hệ thống dùng chip Nvidia H800.

Theo nghiên cứu gần đây của ngân hàng đầu tư Morgan Stanley (Mỹ), các dịch vụ suy luận AI được vận hành trên hệ thống Huawei Cloud Matrix 384 rất hiệu quả về mặt kinh tế, mang lại biên lợi nhuận 47,9% cho nhà cung cấp. Trong khi đó, các dịch vụ suy luận AI được vận hành trên Nvidia GB200 NVL72 mang lại biên lợi nhuận biên lợi nhuận đến 77,6%, cao nhất trong số 8 hệ thống được thử nghiệm.

Nvidia GB200 NVL72 là hệ thống máy chủ AI thế hệ mới, được thiết kế để xử lý các mô hình ngôn ngữ lớn với hàng nghìn tỉ tham số, phục vụ cho cả huấn luyện và suy luận AI thời gian thực. Đây là một phần của nền tảng Nvidia Blackwell, kết hợp giữa CPU Grace và GPU Blackwell, tạo thành siêu chip hiệu suất cao.

Giá cổ phiếu Cambricon, Hygon và SMIC tăng vọt

Những đồn đoán về chip AI thế hệ mới của Trung Quốc đã thổi bùng tâm lý lạc quan từ nhà đầu tư.

Cổ phiếu niêm yết tại Thượng Hải của Cambricon Technologies và Hygon Information Technology đồng loạt tăng 20% hôm 22.8.

Hygon là công ty bán dẫn Trung Quốc chuyên thiết kế và sản xuất chip cho máy chủ và các ứng dụng điện toán hiệu năng cao.

Cổ phiếu của SMIC (hãng sản xuất chip theo hợp đồng lớn nhất Trung Quốc) cũng tăng 10,1% lên 56,90 đô la Hồng Kông tại sàn giao dịch Hồng Kông ngày 22.8. SMIC là công ty sản xuất chip Ascend và Kirin cho Huawei.