AI & Blockchain

Anthropic phơi bày cách 3 công ty Trung Quốc huấn luyện AI, Elon Musk phản ứng

Sơn Vân • 25/02/2026 20:25

Anthropic tiết lộ DeepSeek, Moonshot AI, MiniMax đã sử dụng Claude trái phép để cải thiện năng lực mô hình AI riêng.

Việc Anthropic (Mỹ) tiết lộ ba công ty AI nổi tiếng Trung Quốc chưng cất mô hình Claude đã phơi bày một kỹ thuật huấn luyện AI được sử dụng rộng rãi, đồng thời châm ngòi cho cuộc tranh luận gay gắt về ranh giới được chấp nhận của phương pháp này.

Hôm 23.2, Anthropic cho biết trong một bài đăng trên blog rằng DeepSeek, Moonshot AI và MiniMax AI đã sử dụng khoảng 24.000 tài khoản gian lận để tạo ra hơn 16 triệu lượt trao đổi với các mô hình Claude của công ty khởi nghiệp AI Mỹ nổi tiếng.

Theo Anthropic, hoạt động này cấu thành hành vi chưng cất trái phép Claude - một kỹ thuật chuyển giao khả năng từ mô hình lớn hơn sang mô hình nhỏ hơn.

“Các chiến dịch này đang gia tăng cả về cường độ lẫn mức độ tinh vi. Không còn nhiều thời gian để can thiệp và mối đe dọa vượt ra ngoài bất kỳ công ty hay khu vực nào. Việc giải quyết vấn đề này sẽ đòi hỏi hành động nhanh chóng, phối hợp giữa các công ty trong ngành, các nhà hoạch định chính sách và cộng đồng AI toàn cầu”, Anthropic cho biết.

Tuyên bố của Anthropic đã làm dấy lên trở lại cáo buộc nhắm vào các công ty AI Trung Quốc về việc sử dụng kỹ thuật chưng cất. Đây là vấn đề ngày càng được chú ý khi các mô hình AI mã nguồn mở của Trung Quốc cải thiện năng lực rất nhanh.

Trong phát triển AI, chưng cất (tên đầy đủ là chưng cất tri thức) được sử dụng rộng rãi để huấn luyện các mô hình AI nhỏ hơn bằng cách sử dụng đầu ra của các hệ thống lớn hơn.

Khái niệm chưng cất AI đã tồn tại nhiều năm. Năm 2015, ba nhà nghiên cứu, trong đó có Geoffrey Hinton - nhà khoa học được mệnh danh là “cha đẻ AI”, công bố đăng bài viết có tiêu đề Distilling the Knowledge in a Neural Network (Chưng cất tri thức trong mạng nơ-ron), cho thấy cách tri thức từ mô hình AI lớn có thể được chuyển sang mô hình nhỏ hơn, dễ triển khai hơn.

Anthropic tiết lộ DeepSeek đã tạo ra hơn 150.000 cuộc hội thoại tập trung vào khả năng suy luận của Claude, trong khi Moonshot AI và MiniMax lần lượt tạo ra khoảng 3,4 triệu và 13 triệu cuộc hội thoại, nhắm vào lập trình và các chức năng khác.

Ba công ty AI Trung Quốc chưa trả lời ngay khi được đề nghị bình luận về vấn đề trên.

Anthropic cho biết DeepSeek, MiniMax và Moonshot AI đã “dùng Claude trái phép để cải thiện các mô hình riêng”, thông qua quy trình chưng cất - Ảnh: MTG — Anthropic cho biết DeepSeek, MiniMax và Moonshot AI đã dùng Claude trái phép để cải thiện các mô hình riêng thông qua quy trình chưng cất - Ảnh: MTG

Zhang Yu, nhà nghiên cứu tại Moonshot AI, đã chia sẻ lại bài đăng của Anthropic trên mạng xã hội X kèm biểu tượng cảm xúc đảo mắt.

Tháng trước, một cuộc thảo luận trên diễn đàn Reddit (Mỹ) đã diễn ra sau khi Moonshot AI phát hành mô hình mới nhất Kimi K2.5. Moonshot AI được hỏi liệu Kimi K2.5 có “chưng cất nhiều” từ Claude của Anthropic hay không, sau khi mô hình AI này đôi khi tự nhận mình là Claude.

Yang Zhilin, nhà sáng lập và Giám đốc điều hành Moonshot AI, cho rằng việc nhận diện sai này là do “dữ liệu lập trình từ internet” đã đi vào hệ thống của họ. Yang Zhilin còn tuyên bố Kimi K2.5 vượt qua Claude trên nhiều tiêu chuẩn đánh giá AI.

Anthropic không phải là công ty Mỹ duy nhất bày tỏ lo ngại về vấn đề này.

Đầu tháng 2, OpenAI cho biết trong một bản ghi nhớ gửi Ủy ban đặc biệt của Hạ viện Mỹ về Trung Quốc rằng DeepSeek đã sử dụng kỹ thuật chưng cất liên quan đến các sản phẩm của Mỹ để huấn luyện mô hình thế hệ tiếp theo. Đây là lần thứ hai OpenAI chỉ trích DeepSeek, sau khi cáo buộc công ty khởi nghiệp AI Trung Quốc này chưng cất mô hình của họ vào tháng 1.2025 để tạo ra R1.

R1 là mô hình suy luận gây tiếng vang năm ngoái khi có hiệu suất ngang các sản phẩm Mỹ như của OpenAI, Google và Anthropic nhưng được DeepSeek huấn luyện với chi phí thấp hơn rất nhiều.

Hồi tháng 9.2025, DeepSeek gây sốc khi tiết lộ R1 có chi phí huấn luyện chỉ 294.000 USD và sử dụng 512 GPU Nvidia H800. Đây không phải là loại chip AI hàng đầu của Nvidia, ban đầu được phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.

Dù DeepSeek chưa công bố dữ liệu huấn luyện, các nhà nghiên cứu tại công ty này nói với đồng nghiệp trong ngành rằng R1 không sao chép các ví dụ suy luận do mô hình của OpenAI tạo ra, theo bài viết đăng trên tạp chí Nature vào tháng 9.2025.

Giống như Yang Zhilin, các nhà nghiên cứu DeepSeek cho rằng R1 được huấn luyện trên dữ liệu web, khiến nó dễ bị ảnh hưởng bởi nội dung do AI tạo ra.

Một số chuyên gia trong ngành cho rằng việc chưng cất như vậy khá phổ biến. “Tôi không thể nghĩ ra cách nào khác để các tác giả có thể chứng minh rằng họ không chưng cất từ GPT của OpenAI”, Huan Sun, phó giáo sư khoa học máy tính và kỹ thuật tại Đại học Bang Ohio (Mỹ), bình luận.

Elon Musk: “Anthropic đã đánh cắp dữ liệu huấn luyện ở quy mô khổng lồ”

Anthropic cho biết bản thân kỹ thuật chưng cất không phải là bất hợp pháp. Tuy nhiên, Anthropic nhấn mạnh rằng điều khoản dịch vụ của họ cấm các đối thủ sử dụng Claude để chưng cất, đồng thời hạn chế quyền truy cập từ Trung Quốc vì lý do an ninh quốc gia.

Điều đáng nhắc đến là Anthropic cũng bị một số người trong cộng đồng công nghệ chỉ trích, làm bùng lại tranh luận về nguồn dữ liệu huấn luyện và kỹ thuật chưng cất.

Elon Musk, Giám đốc điều hành xAI – công ty khởi nghiệp phát triển mô hình Grok, cáo buộc Anthropic đã huấn luyện Claude bằng tài liệu có bản quyền mà không được phép.

“Anthropic đã đánh cắp dữ liệu huấn luyện ở quy mô khổng lồ và phải trả các khoản dàn xếp trị giá hàng tỉ USD cho hành vi này. Đây là sự thật không thể chối cãi”, Elon Musk viết trên tài khoản X cá nhân hôm 24.2.

Anthropic chưa phản hồi về phát biểu của Elon Musk.

Anthropic phơi bày cách 3 công ty Trung Quốc huấn luyện AI, Elon Musk phản ứng — Elon Musk cho rằng Anthropic đã đánh cắp dữ liệu huấn luyện AI ở quy mô khổng lồ - Ảnh: MTG

Anthropic từng đối mặt với các cáo buộc sử dụng tài liệu có bản quyền để huấn luyện mô hình AI của mình. Vào tháng 1, tờ The Washington Post tiết lộ chi tiết về một dự án nội bộ của Anthropic có tên là Project Panama, được mô tả là “nỗ lực quét toàn bộ sách trên thế giới một cách triệt để”.

Năm ngoái, Anthropic đã đồng ý chi 1,5 tỉ USD để dàn xếp vụ kiện tập thể do các tác giả và nhà xuất bản của một số cuốn sách khởi kiện. Trong thỏa thuận dàn xếp này, công ty đứng sau Claude không thừa nhận bất kỳ hành vi sai trái nào.

Cáo buộc của Anthropic với DeepSeek, Moonshot AI và MiniMax được đưa ra trong bối cảnh nhà đầu tư rất quan tâm đến các công ty AI Trung Quốc.

Cổ phiếu của MiniMax hôm 24.2 tăng gần 5% lên 880 đô la Hồng Kông, tăng 155% so với giá lúc niêm yết vào tháng 1.

Cổ phiếu của Zhipu AI, công ty Trung Quốc từng bị cư dân mạng cáo buộc chưng cất các mô hình Mỹ, tăng 12% lên 628 đô la Hồng Kông cùng ngày 24.2, gần gấp ba kể từ khi niêm yết hồi tháng trước.

Sơn Vân