Hé lộ khả năng mô hình AI Claude Mythos ra mắt sớm trên toàn cầu
Mô hình AI Claude Mythos của Anthropic có thể đang chuẩn bị cho màn ra mắt chính thức dựa trên những thông tin rò rỉ mới nhất.
Các chuyên gia công nghệ đã phát hiện ra nhiều dấu vết của mô hình AI Claude Mythos được nhúng sâu bên trong mã nguồn và các nền tảng đám mây lớn. Sự kiện này báo hiệu rằng công ty khởi nghiệp Anthropic dường như đang đẩy nhanh tiến độ để đưa công cụ quét lỗ hổng bảo mật tối tân của mình tiếp cận rộng rãi hơn với người dùng thông qua các giao diện phần mềm quen thuộc.

Dấu vết rò rỉ mô hình AI Claude Mythos trên hệ thống và sự lột xác của nền tảng bảo mật
Theo một báo cáo phân tích vừa được trang Testing Catalog công bố, các đoạn mã tham chiếu đến một mô hình mang tên "claude-mythos-1-preview" đã bất ngờ xuất hiện bên trong mã nguồn gốc của Anthropic và trên giao diện người dùng của nền tảng Claude Security. Sự hiện diện của các đoạn mã này là minh chứng rõ ràng cho thấy công ty công nghệ Mỹ đang âm thầm tích hợp sức mạnh của Mythos vào hệ sinh thái hiện tại. Động thái này mở ra khả năng siêu mô hình bảo mật này sẽ sớm được cấp quyền truy cập chung thông qua các công cụ hỗ trợ như Claude Code và Claude Security.
Báo cáo này cũng chỉ ra rằng những tàn tích hoạt động của mô hình mới đã nổi lên trên các hệ thống máy chủ đám mây khổng lồ như Google Cloud và AWS thông qua chương trình khám phá lỗ hổng bảo mật. Đáng chú ý, một số người dùng nội bộ và chuyên gia thử nghiệm cho biết họ đã có thể nhìn thấy sự hiện diện trực tiếp của mô hình Mythos 1 ngay trong giao diện trò chuyện tiêu chuẩn của Claude. Điều này cho thấy hệ thống đã vượt qua giai đoạn thử nghiệm đóng và đang bước vào những khâu tinh chỉnh cuối cùng trước khi chính thức trình làng giới công nghệ.
Song song với việc thử nghiệm mô hình lõi, Anthropic cũng đang tiến hành đại tu toàn diện bảng điều khiển của Claude Security. Giao diện quản lý mới này được thiết kế lại để cung cấp một cái nhìn trực quan và chi tiết hơn về tình trạng an ninh hệ thống. Các tính năng mới bao gồm khả năng hiển thị các lỗ hổng vừa được phát hiện, hệ thống biểu đồ theo dõi dữ liệu lịch sử trong chu kỳ bảy ngày và ba mươi ngày, cùng với các kết quả phân loại mức độ ưu tiên chuyên sâu. Bảng điều khiển này hứa hẹn sẽ trở thành một trung tâm chỉ huy đắc lực, giúp các kỹ sư phần mềm nhanh chóng khoanh vùng và xử lý các rủi ro bảo mật trước khi chúng bị khai thác.
Quyền năng của Claude Mythos và bài toán kiểm soát rủi ro an ninh mạng
Claude Mythos hiện được giới chuyên gia đánh giá là mô hình trí tuệ nhân tạo có sức mạnh lớn nhất mà Anthropic từng chế tạo. Kể từ khi được công bố lần đầu tiên vào tháng 4, hệ thống này đã được vinh danh là mô hình tiên phong đạt đến đẳng cấp siêu việt, có khả năng vượt qua hầu hết con người trong việc tìm kiếm và khai thác các điểm yếu phần mềm, ngoại trừ những chuyên gia bảo mật xuất sắc nhất. Mặc dù sở hữu quyền năng to lớn, ban lãnh đạo Anthropic từng kiên quyết từ chối phát hành mô hình này ra công chúng do những e ngại sâu sắc về khả năng công nghệ bị lợi dụng vào mục đích xấu.
Đại diện công ty từng nhấn mạnh rằng các mô hình sở hữu khả năng tấn công an ninh mạng cấp cao luôn mang theo rủi ro sử dụng kép vô cùng nguy hiểm. Chính vì vậy, chiến lược ban đầu của họ là giới thiệu công nghệ này một cách từ từ và bắt buộc phải đi kèm với các biện pháp bảo vệ vững chắc. Sức mạnh của phiên bản thử nghiệm Claude Mythos Preview đã được chứng minh qua việc hệ thống này tự động phát hiện ra hàng nghìn lỗ hổng có mức độ nghiêm trọng cao trên khắp các hệ điều hành, trình duyệt web và các dự án phần mềm mã nguồn mở. Trong một bài đăng trên blog gần đây, Anthropic tiết lộ thêm rằng kể từ khi chia sẻ mô hình này với các đối tác chiến lược vào tháng 4, hệ thống đã được sử dụng để tìm ra hơn 10 nghìn lỗ hổng có mức độ nghiêm trọng từ cao đến rất cao trên những phần mềm quan trọng bậc nhất thế giới.
Sự xuất hiện của trí tuệ nhân tạo đang làm thay đổi hoàn toàn tư duy về quy trình bảo mật thông tin. Phía công ty chia sẻ rằng trước đây, sự tiến bộ trong an ninh phần mềm bị giới hạn bởi tốc độ con người tìm ra các lỗ hổng mới. Giờ đây, giới hạn đó lại nằm ở việc các kỹ sư có thể xác minh, công bố và vá một số lượng khổng lồ các điểm yếu do AI tìm ra nhanh đến mức nào. Anthropic luôn nhấn mạnh rằng dòng mô hình Mythos giúp giảm đáng kể thời gian và chi phí cần thiết để tìm kiếm và khai thác các điểm yếu bảo mật. Họ cũng xác nhận rằng một khi phát triển đầy đủ các cơ chế an toàn theo đúng yêu cầu, công ty sẽ lập tức phát hành rộng rãi dòng mô hình này đến tay người tiêu dùng toàn cầu.
Vào thời điểm hiện tại, hãng công nghệ này thừa nhận chưa có bất kỳ công ty nào, kể cả chính họ, phát triển được các biện pháp bảo vệ đủ mạnh để ngăn chặn những mô hình loại này bị lạm dụng và gây ra hậu quả nghiêm trọng. Đó là nguyên nhân chính khiến công chúng vẫn chưa thể chính thức trải nghiệm Mythos. Đây cũng là lý do Anthropic khởi xướng Dự án Glasswing.
Họ tin rằng nếu một mô hình có khả năng tương đương bị một bên thứ ba tung ra thị trường mà không có các lớp bảo vệ, việc khai thác phần mềm lỗi sẽ trở nên cực kỳ rẻ và dễ dàng đối với gần như bất kỳ ai trên thế giới. Tuy nhiên, sự thay đổi trong lập trường của công ty cùng với những báo cáo rò rỉ gần đây đang ngầm ám chỉ rằng siêu mô hình này có thể sẽ chính thức cập bến sớm hơn rất nhiều so với dự đoán của thị trường.