DeepSeek V4 tạo cơn sốt chip AI Huawei ở Trung Quốc, Big Tech tranh nhau mua
Nhu cầu với dòng Huawei Ascend 950 tăng vọt sau khi mô hình DeepSeek V4 ra mắt hôm 24/4 và tương thích với chip AI mới của gã khổng lồ công nghệ Trung Quốc.
Các công ty internet lớn nhất Trung Quốc, gồm ByteDance, Tencent và Alibaba, đang liên hệ với Huawei để đặt hàng chip mới Ascend 950, theo các nguồn tin của Reuters.
Các công ty chuyên về điện toán đám mây và dịch vụ cho thuê GPU (bộ xử lý đồ họa) cũng đang chạy đua để đặt hàng Ascend 950, hai nguồn tin của Reuters cho biết, nhưng không tiết lộ tên cụ thể.
Dù có hiệu năng vượt trội so với Nvidia H20, Ascend 950PR (phiên bản thuộc dòng Ascend 950) vẫn kém hơn H200, chip AI tiên tiến hơn của Nvidia đang vướng vào tình trạng pháp lý chưa rõ ràng.
H20 từng là chip AI mạnh nhất mà Nvidia được phép bán tại Trung Quốc trước khi bị chặn nhập khẩu năm ngoái. Trong khi đó, Nvidia H200 dù được Mỹ phê duyệt xuất khẩu nhưng vẫn chưa thể vào thị trường Trung Quốc do hai bên chưa thống nhất điều kiện thương mại, tạo cơ hội cho Huawei mở rộng thị phần chip AI.
Ascend 950PR được xem là bước đột phá của Huawei sau nhiều năm gặp khó khăn trong việc giành đơn hàng lớn từ các gã khổng lồ công nghệ (Big Tech) Trung Quốc. Theo Reuters, các bài thử nghiệm Ascend 950PR trong năm nay diễn ra thuận lợi, với ByteDance và Alibaba dự kiến đặt hàng sau khi nhận mẫu vào tháng 1.
Huawei, ByteDance, Alibaba và Tencent từ chối bình luận về thông tin trên.
Cuộc đua giành Ascend 950PR cho thấy việc DeepSeek ra mắt mô hình V4 tuần trước đã thúc đẩy mạnh nhu cầu chip AI nội địa, trong bối cảnh Mỹ tiếp tục hạn chế xuất khẩu chip tiên tiến nhất của Nvidia. Đây cũng là sự thừa nhận về hiệu năng ngày càng tăng của chip Huawei.

DeepSeek V4 tạo cơn sốt chip Huawei Ascend 950 ở Trung Quốc
Việc DeepSeek tối ưu hóa V4 cho chip Huawei đánh dấu bước chuyển chiến lược, giảm phụ thuộc vào chip Mỹ và hướng nhiều hơn tới công nghệ AI nội địa. Đây là ưu tiên của Trung Quốc trong tham vọng dẫn đầu công nghệ.
Tuần trước, Huawei cho biết cơ sở hạ tầng siêu nút Ascend của hãng, được xây dựng trên dòng chip Ascend 950, sẽ hỗ trợ đầy đủ DeepSeek V4. Toàn bộ dòng sản phẩm siêu nút Ascend đã được điều chỉnh để phục vụ quá trình suy luận V4. Suy luận đề cập đến quy trình sử dụng mô hình AI đã được huấn luyện để trả lời các truy vấn và thực hiện các tác vụ.
Siêu nút là nút tính toán có hiệu năng đặc biệt cao trong mạng máy tính hoặc hệ thống điện toán. Trong lĩnh vực điện toán hiệu năng cao hay AI, siêu nút thường là khối phần cứng lớn, bên trong chứa nhiều bộ xử lý tăng tốc (GPU, NPU) cùng bộ nhớ dung lượng lớn và các liên kết truyền dữ liệu tốc độ cực cao. Siêu nút có thể đứng độc lập để xử lý khối lượng điện toán khổng lồ, hoặc đóng vai trò đầu mối kết nối trong cụm máy tính siêu nút.
GPU là loại vi mạch chuyên dùng để xử lý và tăng tốc các phép tính liên quan đến hình ảnh, video và đồ họa 3D. Ban đầu GPU được thiết kế để phục vụ hiển thị hình ảnh trong máy tính, máy chơi game hay các thiết bị di động. Tuy nhiên, nhờ khả năng thực hiện đồng thời hàng nghìn phép tính song song, GPU ngày nay còn được sử dụng rộng rãi trong những công việc đòi hỏi hiệu năng tính toán rất lớn, như huấn luyện và suy luận AI; xử lý dữ liệu khoa học, mô phỏng vật lý, dự báo khí hậu; kết xuất video và hình ảnh chất lượng cao.
NPU (bộ xử lý thần kinh) được thiết kế chuyên biệt để tăng tốc các tác vụ mạng nơ-ron nhân tạo, như huấn luyện hoặc suy luận mô hình AI. NPU có cấu trúc phần cứng tối ưu cho các phép nhân - cộng ma trận, xử lý song song quy mô lớn, nhờ đó tiêu thụ điện ít hơn và nhanh hơn so với CPU hoặc GPU trong các công việc liên quan đến AI.
Trong các nhà sản xuất chip Trung Quốc, dòng Ascend 950 của Huawei, đặc biệt là 950PR, là chip nội địa duy nhất có thể xử lý các phép tính AI bằng dạng số được nén gọn hơn. Nhờ đó, Ascend 950 có thể thực hiện nhiều phép tính hơn mỗi giây và giảm chi phí vận hành.
Nhu cầu với DeepSeek V4 tăng mạnh trên các nền tảng đám mây
Để đáp ứng nhu cầu, Alibaba Cloud đã đưa V4 lên ngay trong ngày phát hành (24/4), cung cấp cả hai phiên bản V4 Pro và V4 Flash với mức giá tương đương giá chính thức của DeepSeek.
Tencent Cloud cũng ra mắt dịch vụ thử nghiệm V4 trên nền tảng TokenHub cùng ngày, triển khai mô hình AI mới của DeepSeek trên cả máy chủ nội địa và cổng quốc tế tại Singapore để phục vụ người dùng toàn cầu.
Việc các nền tảng đám mây triển khai nhanh chóng khiến hàng triệu người dùng và nhà phát triển có thể truy cập V4, làm tăng mạnh số lượng truy vấn AI cần xử lý, kéo theo nhu cầu lớn hơn với chip nền tảng.
V4 của DeepSeek gồm hai phiên bản: V4 Pro với 1.600 tỉ tham số và V4 Flash với 284 tỉ tham số, cả hai đều hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token. Cả V4 Pro và V4 Flash được phát hành dưới dạng mã nguồn mở theo giấy phép MIT, cho phép doanh nghiệp tự do sử dụng, chỉnh sửa và thương mại hóa.
Áp lực nguồn cung Ascend 950
DeepSeek, hiện giảm giá 75% cho mô hình AI mới đến ngày 5/5, cho biết giá V4 Pro có thể giảm mạnh trong nửa cuối năm 2026 khi Ascend 950 của Huawei được sản xuất hàng loạt.
Tuy nhiên, Huawei thừa nhận rằng tình trạng hạn chế nguồn cung sẽ còn kéo dài cho đến khi sản lượng Ascend 950 được mở rộng, phản ánh sự thiếu hụt chip AI nội địa cao cấp.
Sản lượng Ascend 950 dự kiến vẫn không đáp ứng đủ nhu cầu, do các hạn chế xuất khẩu của Mỹ với thiết bị sản xuất chip tiên tiến. Điều này khiến Trung Quốc khó tiếp cận công nghệ sản xuất chip hàng đầu lâu nay.
Theo nguồn tin của Reuters, Huawei dự kiến sản xuất khoảng 750.000 Ascend 950PR trong năm 2026. Huawei bắt đầu sản xuất hàng loạt chip AI này từ tháng 4 và triển khai giao hàng quy mô lớn từ nửa cuối năm 2026.