AI & Blockchain

Mỹ lo Claude Fable 5 và Mythos 5 bị tình báo quân sự Trung Quốc, Nga khai thác

Sơn Vân • 16/06/2026 11:53

Bộ trưởng Thương mại Mỹ Howard Lutnick cho biết đã ra quyết định hạn chế Claude Fable 5 và Mythos 5 vì lo ngại hai mô hình AI mới nhất của Anthropic có thể bị cơ quan tình báo quân sự Trung Quốc, Nga hoặc những quốc gia đối địch sử dụng.

Ông Howard Lutnick đã nêu rõ mối lo ngại này trong lá thư gửi Dario Amodei - Giám đốc điều hành Anthropic hôm 12/6, theo hãng tin Reuters. Trong thư, Bộ Thương mại Mỹ yêu cầu công ty ngừng cung cấp hai mô hình AI này cho mọi công dân nước ngoài và mọi điểm đến bên ngoài nước Mỹ.

Một quan chức chính quyền Trump cho biết các chuyên gia kỹ thuật cấp cao của Anthropic đã gặp đại diện Bộ Thương mại Mỹ tại Washington hôm 15/6 để tìm giải pháp cho vụ việc.

Vấn đề hiện có ý nghĩa rất lớn với cả hai bên. Chính phủ Mỹ muốn nhận được cam kết rằng Claude Fable 5 và Claude Mythos 5 không thể bị sử dụng để gây hại cho nước Mỹ. Trong khi đó, Anthropic đang tìm cách khôi phục quyền truy cập vào hai mô hình AI cao cấp nhất của mình sau khi phải ngừng cung cấp chúng cho toàn bộ người dùng hôm 12/6.

Theo một nguồn tin của Reuters, ông Howard Lutnick đang trực tiếp tham gia đàm phán và thường xuyên trao đổi với Anthropic nhằm tìm kiếm một thỏa thuận. Ông và Dario Amodei đều dự kiến tham dự hội nghị G7 tại Evian-les-Bains (Pháp), nơi hai bên có thể tiếp tục thảo luận.

Giám đốc An ninh mạng Quốc gia Mỹ Sean Cairncross cũng tham gia cuộc họp với Anthropic hôm 15/6 tại Bộ Thương mại, theo Reuters.

Một người thân cận với Anthropic cho biết đội ngũ kỹ thuật của công ty gần như ngày nào cũng trao đổi với các quan chức Mỹ kể từ khi chính quyền Trump liên hệ với họ hôm 12/6.

Sau khi nhận được thư từ Howard Lutnick, Anthropic đã vô hiệu hóa quyền truy cập vào Claude Fable 5 và Claude Mythos 5 trên phạm vi toàn cầu.

Anthropic cho biết chính phủ Mỹ tin rằng có thể tồn tại một phương pháp jailbreak để vượt qua lớp bảo vệ an toàn của Claude Fable 5. Nếu thành công, người dùng có thể sử dụng mô hình AI này để tìm kiếm lỗ hổng bảo mật trong phần mềm.

Tuy nhiên, Anthropic khẳng định phương pháp jailbreak đó chỉ giúp phát hiện một số lỗ hổng bảo mật nhỏ mà nhiều mô hình AI công khai khác cũng có thể tìm thấy.

Jailbreak là kỹ thuật hoặc cách đặt câu hỏi đặc biệt để lách các quy tắc an toàn của mô hình AI, khiến nó tiết lộ thông tin nhạy cảm, nội dung bị hạn chế, hoặc hoạt động ngoài phạm vi được thiết kế ban đầu.

Mối quan hệ giữa Anthropic và chính quyền Trump được cho là đã xấu đi từ đầu năm nay sau khi công ty từ chối cho quân đội Mỹ sử dụng các mô hình AI của mình trong hoạt động giám sát người dân trong nước quy mô lớn và hệ thống vũ khí hoàn toàn tự động. Sau đó, chính phủ Mỹ đã đưa Anthropic vào danh sách rủi ro chuỗi cung ứng.

Mỹ lo Claude Fable 5 và Mythos 5 bị tình báo quân sự Trung Quốc, Nga khai thác — Mỹ hạn chế Claude Fable 5 và Mythos 5 vì lo ngại hai mô hình AI mới nhất của Anthropic có thể bị cơ quan tình báo quân sự Trung Quốc, Nga hoặc những quốc gia đối địch sử dụng. Ảnh: SV

Hơn 80 lãnh đạo và chuyên gia an ninh mạng kêu gọi Mỹ gỡ hạn chế với Claude Fable 5 và Mythos 5

Lá thư của Bộ trưởng Thương mại Mỹ cũng nêu rõ việc xuất khẩu Claude Fable 5 và Claude Mythos 5, hoặc chuyển giao cho công dân nước ngoài ngay cả khi họ đang ở Mỹ, sẽ phải xin giấy phép đặc biệt. Bộ Thương mại Mỹ cảnh báo việc không tuân thủ có thể dẫn tới các hình phạt dân sự và hình sự.

Tuy nhiên, nhiều chuyên gia về kiểm soát xuất khẩu cho rằng AI thực tế không được "xuất khẩu" theo cách truyền thống. Thay vào đó, người dùng truy cập các mô hình AI thông qua Internet từ xa, trong khi các quy định hiện hành về xuất khẩu chưa thực sự điều chỉnh theo hình thức này. Điều đó làm dấy lên câu hỏi liệu Bộ Thương mại Mỹ có đủ cơ sở pháp lý để áp đặt các hạn chế như vậy hay không.

Bộ Thương mại Mỹ chưa phản hồi các câu hỏi liên quan đến thẩm quyền pháp lý của quyết định này. Cả Bộ Thương mại Mỹ và Anthropic từ chối bình luận về cuộc họp hôm 15/6.

Trong khi đó, hơn 80 lãnh đạo và chuyên gia an ninh mạng đã ký vào một bức thư ngỏ gửi Bộ trưởng Howard Lutnick và Giám đốc An ninh mạng Quốc gia Sean Cairncross để bày tỏ sự ủng hộ với Anthropic.

Trong thư, các lãnh đạo an ninh mạng tại nhiều tập đoàn lớn, gồm cả Nvidia và Adobe, đã kêu gọi chính quyền Trump dỡ bỏ các hạn chế đang áp dụng với hai mô hình AI mới nhất của Anthropic.

Lá thư cho rằng Claude Fable 5 và Claude Mythos 5 không phải là những công cụ duy nhất có khả năng tìm lỗi bảo mật và biến lỗ hổng thành phương tiện khai thác. Những mô hình AI của đối thủ, trong đó có Kimi 2.7 của Moonshot AI (Trung Quốc), cũng có năng lực tương tự.

“Claude Mythos gần như chắc chắn là mô hình tốt nhất hiện nay để tìm lỗi bảo mật và lỗi mã nguồn, nhưng chỉ là một bước tiến mang tính gia tăng so với các mô hình AI khác đã được công khai”, ông Joshua Saxe, Giám đốc công nghệ tại hãng bảo mật AI Abundant Security và là một trong những người ký thư, nói trong cuộc phỏng vấn.

Lệnh cấm của Mỹ được đưa ra sau khi các nhà nghiên cứu tại Amazon phát hiện một lỗ hổng dạng jailbreak tiềm tàng trong Claude Fable 5. Theo nguồn tin của trang FT, lỗ hổng này có thể giúp người dùng vượt qua các cơ chế an toàn của AI để khai thác thông tin về những điểm yếu bảo mật trong phần mềm. Amazon đã chia sẻ phát hiện này với Anthropic trước tiên.

Andy Jassy, Giám đốc điều hành Amazon, đã trao đổi về vấn đề trên với các quan chức Mỹ hôm 12/6. Tuy nhiên, FT cho biết ông chủ yếu bày tỏ những lo ngại rộng hơn về năng lực của các mô hình AI tiên tiến, chứ không chỉ nhắm riêng vào Anthropic. Amazon hiện đã đầu tư khoảng 13 tỉ USD vào Anthropic.

"Không hiếm khi các chính phủ tìm kiếm ý kiến tư vấn của chúng tôi về các rủi ro an ninh tiềm tàng. Tuy nhiên, chúng tôi không tiết lộ nội dung các cuộc trao đổi", Amazon chia sẻ.

Điều đáng chú ý là Claude Fable 5 đã được các cơ quan thuộc Bộ Thương mại Mỹ đánh giá và xem xét về mặt an toàn chỉ vài ngày trước khi Anthropic phát hành.

Anthropic phản đối việc chính quyền Trump nhắm riêng vào các mô hình của mình, cho rằng khả năng bị jailbreak không phải chỉ xuất hiện ở Claude Fable 5 hay Mythos 5. Theo công ty, những lỗ hổng tương tự cũng tồn tại ở các mô hình AI cạnh tranh, gồm cả của OpenAI.

“Phản ứng thái quá của chính phủ”

Các chuyên gia an ninh cho biết việc khắc phục hoàn toàn dạng lỗ hổng này có thể mất nhiều tuần nghiên cứu và phát triển, nhưng vẫn không có gì đảm bảo rằng các lỗ hổng mới sẽ không tiếp tục xuất hiện. Theo một nguồn tin của FT, Anthropic đang hợp tác chặt chẽ với chính phủ Mỹ để tìm tiếng nói chung và xác định các bước tiếp theo.

Theo Anthropic, chính phủ Mỹ tin rằng có thể vượt qua lớp bảo vệ được thiết kế để ngăn Claude Fable 5 bị dùng vào việc tìm lỗ hổng phần mềm. Tuy nhiên, Anthropic lập luận rằng chỉ vì có nguy cơ bị jailbreak trong một phạm vi hẹp thì không nên cắt quyền truy cập vào một mô hình AI đang được hàng trăm triệu người sử dụng.

Lá thư cũng nhấn mạnh quan điểm này, cho rằng Anthropic đã xây dựng các lớp bảo vệ vững chắc. Việc rút lại các năng lực này có thể trở nên “nguy hiểm”, nhất là khi các mô hình mã nguồn mở của Trung Quốc chỉ đi sau những mô hình tốt nhất của Mỹ vài tháng.

Lá thư cũng cho rằng Trung Quốc nhiều khả năng đã tiếp cận những năng lực vượt xa những gì công khai bên ngoài.

“Mọi quy định đều cần dựa trên bằng chứng, được định nghĩa rõ ràng và áp dụng nhất quán. Song trong trường hợp này, không tiêu chuẩn nào trong số đó được tuân thủ”, Alex Stamos - người khác ký vào lá thư và hiện là Giám đốc sản phẩm tại Corridor - bình luận

“Đây là phản ứng thái quá của chính phủ”, ông nói thêm. Theo Alex Stamos, dựa trên những cuộc trao đổi của ông với các bên liên quan, Anthropic và bên thứ ba phát hiện lỗ hổng đang bất đồng về mức độ nghiêm trọng của vấn đề.

Corridor là công ty khởi nghiệp về an ninh mạng và AI của Mỹ, chuyên phát triển các công cụ giúp phát hiện lỗ hổng bảo mật trong phần mềm. Công ty tập trung vào việc giúp các nhà phát triển viết mã an toàn hơn ngay từ đầu, thay vì chờ đến khi sản phẩm hoàn thiện mới kiểm tra bảo mật.

Tuần trước, hãng an ninh mạng CrowdStrike (Mỹ) cho biết các nhóm hacker có liên hệ với Trung Quốc là mối đe dọa gián điệp lớn nhất với các hãng công nghệ trong năm qua.

CrowdStrike cảnh báo các cuộc tấn công mạng từ những thực thể có liên hệ với Trung Quốc đang gia tăng, với mục tiêu đánh cắp công nghệ AI nhằm thu hẹp khoảng cách với Mỹ.

Anthropic: Claude Fable 5 vượt trội Opus 4.8, GPT-5.5 và Gemini 3.1 Pro

Tuần trước, Anthropic cho biết Claude Fable 5 đạt "hiệu suất vượt trội" trong các nhiệm vụ liên quan đến kỹ thuật phần mềm và công việc tri thức. Ở một số bài đánh giá chuẩn, Claude Fable 5 đạt điểm số cao hơn 10% so với Claude Opus 4.8, mô hình AI khác được Anthropic giới thiệu vào cuối tháng trước.

Theo Anthropic, Claude Fable 5 vượt trội GPT-5.5 và Gemini 3.1 Pro ở phần lớn bài kiểm tra quan trọng, đặc biệt trong lập trình, an ninh mạng, công việc tri thức và suy luận phức tạp.

Theo Dianne Penn - phụ trách quản lý sản phẩm nghiên cứu tại Anthropic, Claude Fable 5 là bước nhảy vọt đáng kể về năng lực, vì vậy công ty buộc phải bổ sung các cơ chế bảo vệ nhằm ngăn chặn việc sử dụng sai mục đích. Chẳng hạn, nếu người dùng hỏi cách sản xuất ricin - loại độc tố cực mạnh, Claude Fable 5 sẽ không trực tiếp trả lời mà chuyển yêu cầu sang Claude Opus 4.8 để cung cấp phản hồi an toàn hơn.

"Chúng tôi rất thận trọng trong việc xây dựng các bộ phân loại mới và các lớp bảo vệ an toàn mới cho lần ra mắt này", Dianne Penn nói.

Claude Mythos 5 là phiên bản sử dụng cùng công nghệ cốt lõi với Claude Fable 5, nhưng một số giới hạn an toàn đã được nới lỏng trong những lĩnh vực nhất định.

Sơn Vân