Anthropic lao đao vì Mỹ đóng băng Claude Fable 5 và Mythos 5: 'Chính phủ đánh giá sai'
Lệnh kiểm soát xuất khẩu với Claude Fable 5 và Claude Mythos 5 của Anthropic làm dấy lên nghi vấn về cách Mỹ sẽ giám sát những hệ thống AI tiên tiến nhất.
Cuối tuần trước, chính quyền Trump buộc Anthropic phải ngừng cung cấp Claude Fable 5 và Claude Mythos 5 chỉ vài ngày sau khi công ty Mỹ phát hành hai mô hình AI tiên tiến nhất ra công chúng. Điều đó đã khiến toàn ngành AI bất ngờ, đồng thời đặt ra nhiều câu hỏi về cách Mỹ quản lý công nghệ này.
Hôm 12/6, Bộ Thương mại Mỹ áp đặt các biện pháp kiểm soát xuất khẩu với hai mô hình AI mới nhất của Anthropic là Claude Fable 5 và Mythos 5. Quy định đó cấm người nước ngoài sử dụng hai mô hình AI này, đồng thời khiến Anthropic phải tạm ngừng cung cấp chúng cho toàn bộ người dùng trong thời gian xử lý vấn đề.
Theo nguồn tin của trang FT, Anthropic chỉ có 90 phút để tuân thủ yêu cầu, đồng thời không được cung cấp thông tin chi tiết về những lo ngại từ chính phủ Mỹ trước khi lệnh được ban hành.
Cuối tuần qua, Anthropic đã điều động một nhóm kỹ thuật cấp cao tới Washington nhằm giảm thiểu tác động của sự việc.
Lệnh cấm được đưa ra sau khi các nhà nghiên cứu tại Amazon phát hiện một lỗ hổng dạng jailbreak tiềm tàng trong Claude Fable 5. Theo một nguồn tin am hiểu sự việc, lỗ hổng này có thể giúp người dùng vượt qua các cơ chế an toàn của AI để khai thác thông tin về những điểm yếu bảo mật trong phần mềm. Amazon đã chia sẻ phát hiện này với Anthropic trước tiên.
Jailbreak là kỹ thuật hoặc cách đặt câu hỏi đặc biệt để lách các quy tắc an toàn của mô hình AI, khiến nó tiết lộ thông tin nhạy cảm, nội dung bị hạn chế, hoặc hoạt động ngoài phạm vi được thiết kế ban đầu.
Andy Jassy, Giám đốc điều hành Amazon, đã trao đổi về vấn đề trên với các quan chức Mỹ hôm 12/6. Tuy nhiên, FT cho biết ông chủ yếu bày tỏ những lo ngại rộng hơn về năng lực của các mô hình AI tiên tiến, chứ không chỉ nhắm riêng vào Anthropic. Amazon hiện đã đầu tư khoảng 13 tỉ USD vào Anthropic.
"Không hiếm khi các chính phủ tìm kiếm ý kiến tư vấn của chúng tôi về các rủi ro an ninh tiềm tàng. Tuy nhiên, chúng tôi không tiết lộ nội dung các cuộc trao đổi", Amazon chia sẻ.
Điều đáng chú ý là Claude Fable 5 đã được các cơ quan thuộc chính Bộ Thương mại Mỹ kiểm tra và phê duyệt chỉ vài ngày trước khi được Anthropic phát hành.
Anthropic phản đối việc chính quyền Trump nhắm riêng vào các mô hình của mình, cho rằng khả năng bị jailbreak không phải chỉ xuất hiện ở Claude Fable 5 hay Mythos 5. Theo công ty, những lỗ hổng tương tự cũng tồn tại ở các mô hình AI cạnh tranh, gồm cả của OpenAI.
Các chuyên gia an ninh cho biết việc khắc phục hoàn toàn dạng lỗ hổng này có thể mất nhiều tuần nghiên cứu và phát triển, nhưng vẫn không có gì đảm bảo rằng các lỗ hổng mới sẽ không tiếp tục xuất hiện. Theo một nguồn tin của FT, Anthropic đang hợp tác chặt chẽ với chính phủ Mỹ để tìm tiếng nói chung và xác định các bước tiếp theo.

Phép thử đầu tiên cho cách chính quyền Trump quản lý AI
Vụ việc đang trở thành một phép thử quan trọng về cách chính quyền Trump sẽ giám sát các mô hình AI ngày càng mạnh hơn.
Nhiều lãnh đạo doanh nghiệp và nhà nghiên cứu cho rằng việc sử dụng công cụ kiểm soát xuất khẩu để xử lý vấn đề liên quan đến an toàn mô hình có thể tạo ra sự bất ổn lớn cho quá trình triển khai các hệ thống AI tiên tiến.
Bà Helen Toner, cựu thành viên hội đồng quản trị OpenAI và hiện là Giám đốc điều hành tạm quyền của Trung tâm An ninh và Công nghệ Mới nổi thuộc Đại học Georgetown, nhận định: "Giới nghiên cứu gần như đều đồng thuận rằng không thể loại bỏ hoàn toàn các hình thức jailbreak trong các mô hình AI này. Đây không phải là vấn đề có thể giải quyết triệt để bằng một công thức chính xác. Chính phủ nên hiểu rằng các mô hình AI của OpenAI hay Google cũng có những lỗ hổng tương tự".
Tuy nhiên, lệnh đóng băng từ chính phủ Mỹ hiện chỉ áp dụng với Anthropic, còn các mô hình AI hàng đầu của OpenAI vẫn được hoạt động dù được cho là sở hữu năng lực tương đương.
Sự can thiệp này đặc biệt đáng chú ý vì Dario Amodei, Giám đốc điều hành Anthropic, là một trong những lãnh đạo lên tiếng mạnh mẽ nhất về các nguy cơ mà AI tiên tiến có thể gây ra.
Claude Mythos 5 đã thể hiện khả năng vượt qua một số hệ thống phòng thủ mạng hiện nay. Trước khi phát hành rộng rãi tuần trước, Anthropic đã phối hợp với chính phủ Mỹ để triển khai thử nghiệm Claud Mythos 5 theo lộ trình có kiểm soát trước khi mở rộng quyền truy cập.
Mâu thuẫn âm ỉ giữa Anthropic và chính quyền Trump
Lệnh cấm xuất hiện sau hàng loạt bất đồng công khai giữa lãnh đạo Anthropic và một số quan chức chính quyền Trump về các vấn đề như quy định AI, sử dụng AI cho giám sát trong nước và vũ khí tự động sát thương.
Lầu Năm Góc từng liệt kê Anthropic vào danh sách rủi ro với chuỗi cung ứng an ninh quốc gia và hai bên đang theo đuổi các vụ kiện liên quan đến quyết định này.
Chính quyền Trump khẳng định động thái mới hoàn toàn dựa trên lý do an ninh quốc gia và không liên quan tới các tranh chấp nói trên. Một quan chức Mỹ cho biết nếu Anthropic khắc phục được lỗ hổng jailbreak thì bế tắc hiện nay có thể được giải quyết.
Tuy nhiên, Bộ trưởng Quốc phòng Pete Hegseth lại liên hệ vụ việc với những chỉ trích trước đây nhắm vào Anthropic. Trên mạng xã hội X, ông viết rằng Bộ Quốc phòng Mỹ từng "đuổi Anthropic ra khỏi tòa nhà mãi mãi" và cho rằng "mỗi ngày trôi qua đều chứng minh đó là quyết định đúng đắn".
Dẫu vậy, các quan chức Mỹ và lãnh đạo doanh nghiệp xác nhận rằng Lầu Năm Góc cùng nhiều cơ quan liên bang khác vẫn đang sử dụng các mô hình AI tiên tiến nhất của Anthropic.
Châu Âu lo ngại tác động lan rộng
Ủy ban châu Âu cho biết đang đánh giá tác động của lệnh cấm với công dân EU, sau khi mới được tiếp cận các mô hình mới nhất của Anthropic.
Cơ quan này nhận định: "Những mô hình AI này mang lại nhiều lợi ích đáng kể, đặc biệt trong lĩnh vực phòng thủ mạng, nhưng đồng thời cũng đặt ra các mối lo ngại nghiêm trọng về an ninh mạng cần được giải quyết".
Ủy ban châu Âu nhấn mạnh đây là thách thức chung của toàn cầu, không phải vấn đề riêng của một quốc gia hay công ty, và cho rằng các biện pháp ứng phó không nên mang tính phân biệt đối xử với các đối tác.
Helen Toner nhận xét rằng công cụ kiểm soát xuất khẩu mà chính quyền Mỹ đang sử dụng là "rất không phù hợp" với mục tiêu họ muốn đạt được.
"Nó ngăn các chính phủ đồng minh sử dụng công nghệ này, trong khi đây lại là thời điểm các đồng minh cần AI để tăng cường phòng thủ mạng", bà nói.
"Chính quyền Trump đánh giá sai vấn đề"
Trước đó, Nhà Trắng từng phát đi tín hiệu rằng sẽ áp dụng cách tiếp cận ít can thiệp hơn với các mô hình AI tiên tiến. Sắc lệnh hành pháp được ông Trump ký đầu tháng 6 thậm chí không bao gồm cả cơ chế cho phép chính phủ ngăn chặn việc phát hành một mô hình AI.
Theo một nguồn tin thân cận với OpenAI, các công ty AI hàng đầu đã hợp tác với chính phủ để thực hiện sắc lệnh này.
Những ngày gần đây, ngành AI còn đang tìm cách đảm bảo các nhà nghiên cứu mang quốc tịch nước ngoài vẫn có thể tiếp tục tham gia phát triển các mô hình tiên tiến nhất. Tuy nhiên, chỉ thị nhằm vào Anthropic hiện đã cấm hoạt động này.
Katie Moussouris, Giám đốc điều hành công ty an ninh mạng Luta Security, cho rằng các lỗ hổng mà Amazon phát hiện không phải điều bất thường. Theo bà, các mô hình AI cạnh tranh với Anthropic như GPT-5.5 của OpenAI cũng có thể bị jailbreak.
Katie Moussouris đã được Anthropic chia sẻ báo cáo của Amazon.
Bà nhấn mạnh rằng các "hàng rào bảo vệ" của mô hình AI thực tế vẫn đang hoạt động đúng như thiết kế. "Chính quyền Trump đã đánh giá sai vấn đề", Katie Moussouris kết luận.
Nhà Trắng từ chối bình luận về vụ việc.
Anthropic: Claude Fable 5 vượt trội Opus 4.8, GPT-5.5 và Gemini 3.1 Pro
Anthropic cho biết Claude Fable 5 đạt "hiệu suất vượt trội" trong các nhiệm vụ liên quan đến kỹ thuật phần mềm và công việc tri thức. Ở một số bài đánh giá chuẩn, Claude Fable 5 đạt điểm số cao hơn 10% so với Claude Opus 4.8, mô hình AI khác được Anthropic giới thiệu vào cuối tháng trước.
Theo Anthropic, Claude Fable 5 vượt trội GPT-5.5 và Gemini 3.1 Pro ở phần lớn bài kiểm tra quan trọng, đặc biệt trong lập trình, an ninh mạng, công việc tri thức và suy luận phức tạp.
Theo Dianne Penn - phụ trách quản lý sản phẩm nghiên cứu tại Anthropic, Claude Fable 5 là bước nhảy vọt đáng kể về năng lực, vì vậy công ty buộc phải bổ sung các cơ chế bảo vệ nhằm ngăn chặn việc sử dụng sai mục đích. Chẳng hạn, nếu người dùng hỏi cách sản xuất ricin - loại độc tố cực mạnh, Claude Fable 5 sẽ không trực tiếp trả lời mà chuyển yêu cầu sang Claude Opus 4.8 để cung cấp phản hồi an toàn hơn.
"Chúng tôi rất thận trọng trong việc xây dựng các bộ phân loại mới và các lớp bảo vệ an toàn mới cho lần ra mắt này", Dianne Penn nói.
Claude Mythos 5 là phiên bản sử dụng cùng công nghệ cốt lõi với Claude Fable 5, nhưng một số giới hạn an toàn đã được nới lỏng trong những lĩnh vực nhất định.