AI & Blockchain

OpenAI: DeepSeek sao chép năng lực AI của Mỹ một cách tinh vi

Sơn Vân • 13/02/2026 10:11

OpenAI cảnh báo rằng DeepSeek đã nhắm vào công ty AI của Mỹ để chưng cất thông tin và huấn luyện mô hình riêng, theo bản ghi nhớ mà Reuters thấy.

Chưng cất là kỹ thuật học máy trong đó một mô hình AI nhỏ hơn, đơn giản hơn (gọi là mô hình học sinh) được huấn luyện để bắt chước hiệu suất của mô hình lớn hơn, phức tạp hơn (gọi là mô hình giáo viên).

Cách hoạt động của chưng cất

Mô hình giáo viên: Một mô hình AI lớn, mạnh mẽ được huấn luyện trước trên một lượng dữ liệu lớn.

Mô hình học sinh: Một mô hình nhỏ hơn được huấn luyện bằng cách học lại từ đầu ra của mô hình giáo viên thay vì chỉ dựa vào dữ liệu gốc.

Chuyển giao kiến thức: Mô hình học sinh học cách đưa ra các dự đoán tương tự như mô hình giáo viên nhưng với ít tài nguyên tính toán hơn.

Lợi ích của chưng cất

- Tăng hiệu suất: Giúp tạo ra các mô hình nhỏ gọn hơn nhưng vẫn duy trì độ chính xác cao.

- Tiết kiệm tài nguyên: Giúp AI chạy nhanh hơn trên các thiết bị có tài nguyên hạn chế như smartphone, IoT (internet vạn vật).

- Bảo mật và tối ưu hóa: Có thể dùng để tạo ra các bản sao tối ưu hóa của mô hình AI mà không cần truy cập trực tiếp vào mô hình gốc.

Trong bản ghi nhớ gửi Ủy ban Đặc biệt về Cạnh tranh Chiến lược giữa Mỹ và Trung Quốc tại Hạ viện, OpenAI cho biết: “Chúng tôi đã quan sát thấy các tài khoản liên quan đến nhân viên DeepSeek phát triển các phương thức nhằm vượt qua các hạn chế của OpenAI và truy cập các mô hình thông qua các bộ định tuyến bên thứ ba được che giấu nguồn gốc, cùng những cách khác nhằm ẩn danh nguồn truy cập”.

“Chúng tôi cũng biết rằng nhân viên DeepSeek đã phát triển mã để truy cập các mô hình AI của Mỹ và thu thập đầu ra phục vụ cho quá trình chưng cất theo cách lập trình tự động”, trích bản ghi nhớ.

DeepSeek và công ty mẹ High-Flyer chưa phản hồi về chuyện này.

OpenAI DeepSeek sao chép năng lực AI của Mỹ bằng phương pháp tinh vi — OpenAI cảnh báo rằng DeepSeek đã nhắm vào công ty AI của Mỹ để chưng cất thông tin và huấn luyện mô hình riêng - Ảnh: Bloomberg

OpenAI bắt đầu nêu quan ngại về hành vi này ngay sau khi DeepSeek phát hành mô hình suy luận R1 đầu năm ngoái, đồng thời mở cuộc điều tra cùng đối tác Microsoft để xem liệu công ty khởi nghiệp AI Trung Quốc có thu thập dữ liệu một cách trái phép hay không, Bloomberg đưa tin trước đó.

Trước Tết Nguyên đán 2025, DeepSeek tung ra R1 có hiệu năng cao ngang sản phẩm Mỹ như của OpenAI, Google, Anthropic nhưng chi phí huấn luyện thấp hơn rất nhiều. Động thái đó đã làm dấy lên lo ngại tại Mỹ rằng Trung Quốc có thể bắt kịp trong cuộc đua AI bất chấp việc bị hạn chế mua chip hiệu năng cao từ Nvidia.

R1 đã kích hoạt đợt bán tháo cổ phiếu công nghệ trị giá khoảng 1.000 tỉ USD trên thị trường toàn cầu. Riêng Nvidia, công ty Mỹ chuyên cung cấp chip tiên tiến đắt đỏ để huấn luyện các mô hình AI, mất gần 600 tỉ USD vốn hóa thị trường chỉ trong một ngày 27.1.2025.

Mối đe dọa kinh doanh với các công ty Mỹ

Theo OpenAI, hoạt động chưng cất, phần lớn liên quan đến Trung Quốc và đôi khi là Nga, vẫn tiếp diễn và ngày càng tinh vi bất chấp các nỗ lực trấn áp những người dùng vi phạm điều khoản dịch vụ của hãng. Công ty khởi nghiệp AI hàng đầu thế giới cho biết đã quan sát thấy các hoạt động này trực tiếp trên nền tảng của mình.

Vì DeepSeek và nhiều mô hình AI Trung Quốc khác không thu phí thuê bao hàng tháng, sự phổ biến của phương pháp chưng cất có thể trở thành mối đe dọa kinh doanh với các công ty Mỹ như OpenAI và Anthropic - vốn đã đầu tư hàng tỉ USD vào hạ tầng AI và thu phí các dịch vụ cao cấp. Hành vi chưng cất mô hình có thể làm suy giảm lợi thế mà Mỹ đang có trước Trung Quốc trong lĩnh vực AI.

OpenAI cũng nhấn mạnh các rủi ro an ninh quốc gia khác liên quan đến bước tiến của DeepSeek, gồm cả việc chatbot thuộc công ty này kiểm duyệt kết quả về những chủ đề bị chính phủ Trung Quốc coi là nhạy cảm. Theo OpenAI, khi các khả năng được sao chép thông qua chưng cất, các biện pháp bảo vệ thường bị bỏ qua, làm gia tăng nguy cơ các mô hình AI bị lạm dụng trong những lĩnh vực rủi ro cao như sinh học hoặc hóa học.

Dân biểu John Moolenaar, Chủ tịch đảng Cộng hòa của Ủy ban Hạ viện về Trung Quốc, tuyên bố: “Đây là một phần trong chiến lược của Trung Quốc: đánh cắp, sao chép và loại bỏ đối thủ”. Ông cho rằng các công ty Trung Quốc sẽ tiếp tục chưng cất và khai thác mô hình AI của Mỹ vì lợi ích riêng, giống cách họ “sao chép OpenAI để xây dựng DeepSeek”.

Bản ghi nhớ của OpenAI cho thấy những nỗ lực ngăn chặn hành vi chắt lọc của công ty vẫn chưa giải quyết được vấn đề. Theo kết quả rà soát nội bộ, các tài khoản có liên quan đến nhân viên DeepSeek đã tìm cách vượt qua các biện pháp bảo vệ hiện có bằng cách truy cập mô hình AI thông qua các bộ định tuyến bên thứ ba nhằm che giấu nguồn truy cập của mình.

Theo OpenAI, nhân viên DeepSeek cũng đã phát triển mã để truy cập các mô hình AI của Mỹ và thu thập đầu ra theo cách lập trình tự động. “Cha đẻ ChatGPT” cũng đề cập đến các mạng lưới nhà phân phối trái phép dịch vụ của OpenAI, được thiết kế để né tránh các cơ chế kiểm soát của hãng.

David Sacks, cố vấn AI của Nhà Trắng, trước đó từng cảnh báo về chiến thuật chưng cất của Trung Quốc. Ông nói với Fox News năm ngoái rằng DeepSeek đang “vắt kiệt giá trị” từ các chip cũ, đồng thời cho biết có bằng chứng đáng kể cho thấy DeepSeek đã chưng cất kiến thức từ các mô hình AI của OpenAI.

Cảnh báo từ OpenAI được đưa ra trong bối cảnh nhiều nghị sĩ Mỹ lo ngại rằng việc tiếp cận được chip AI tiên tiến có thể thúc đẩy nhanh hơn nữa tiến bộ của DeepSeek. Cuối năm ngoái, Tổng thống Donald Trump đã nới lỏng các hạn chế về chip và cho phép Nvidia bán H200, loại GPU (bộ xử lý đồ họa) mạnh thứ hai của hãng, cho Trung Quốc với điều kiện chính phủ Mỹ nhận về 25% doanh thu.

Ngay sau khi R1 được công bố, giới chức Mỹ đã mở cuộc điều tra về việc liệu DeepSeek có lách các biện pháp kiểm soát xuất khẩu của Mỹ bằng cách mua chip Nvidia thông qua Singapore hay không. Hồ sơ gần đây do Ủy ban Hạ viện về Trung Quốc thu thập cho thấy Nvidia đã cung cấp hỗ trợ kỹ thuật để giúp DeepSeek cải thiện và thiết kế R1.

Hồi tháng 9.2025, DeepSeek gây sốc khi tiết lộ R1 có chi phí huấn luyện chỉ 294.000 USD và sử dụng 512 GPU Nvidia H800. Đây không phải là loại chip AI hàng đầu của Nvidia, ban đầu được phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.

Trong khi mô hình AI nền tảng DeepSeek V3, trình làng hồi tháng 12.2024, chỉ cần 2,8 triệu giờ GPU H800 để huấn luyện đầy đủ.

“Nên coi DeepSeek là hồi chuông cảnh tỉnh về nguy cơ bán chip bán dẫn tiên tiến cho Trung Quốc. Chỉ với các chip Nvidia kém mạnh hơn, Trung Quốc đã phát triển những mô hình mã nguồn mở tiên tiến nhất thế giới. Tôi rùng mình khi nghĩ đến việc họ có thể làm gì với phần cứng cao cấp hơn như chip H200”, Michael McCaul, Dân biểu đảng Cộng hòa từng lãnh đạo một ủy ban Hạ viện giám sát kiểm soát xuất khẩu, phát biểu năm ngoái sau quyết định của ông Trump liên quan đến H200.

Trong năm qua, DeepSeek chỉ tung ra các bản nâng cấp nhỏ cho R1, trong khi các đối thủ tại Mỹ và Trung Quốc liên tục giới thiệu hàng loạt mô hình AI mới.

Cách đây vài ngày, DeepSeek cập nhật mô hình chủ lực của mình trước Tết Nguyên đán, bổ sung khả năng hỗ trợ cửa sổ ngữ cảnh lớn hơn với kiến thức được cập nhật mới hơn, qua đó làm gia tăng kỳ vọng về bản phát hành lớn tiếp theo. Kể từ ngày 11.2, công ty có trụ sở ở thành phố Hàng Châu đã mở rộng cửa sổ ngữ cảnh từ 128.000 token lên hơn 1 triệu token, mức tăng gần gấp 10 lần, được kỳ vọng sẽ cải thiện khả năng xử lý truy vấn của người dùng.

Cửa sổ ngữ cảnh lớn hơn đồng nghĩa với việc mô hình AI có thể ghi nhớ và xử lý nhiều thông tin hơn trong một cuộc trò chuyện hoặc tác vụ duy nhất, cho phép thực hiện suy luận phức tạp hơn hoặc làm việc hiệu quả hơn với dữ liệu và mã nguồn.

Bản cập nhật này cũng đẩy mốc dữ liệu kiến thức của mô hình AI DeepSeek từ tháng 7.2024 lên tháng 5.2025, bổ sung gần 1 năm thông tin mới vào hệ thống và cho phép người dùng tiếp cận dữ liệu cập nhật hơn.

DeepSeek không công bố bản cập nhật này trên các tài khoản mạng xã hội của mình và cũng không phản hồi khi trang SCMP đề nghị bình luận. Vì thế, chưa rõ đây là phiên bản mô hình AI nào.

Việc công ty khởi nghiệp có trụ sở tại Hàng Châu nâng cấp mô hình AI diễn ra trong bối cảnh xuất hiện nhiều đồn đoán về bản phát hành lớn tiếp theo, được cho là DeepSeek V4.