GPT-5 bị Tenable khoan phá bằng đòn thao túng tâm lý
Chỉ trong vòng 24 giờ sau khi GPT-5 ra mắt, những biện pháp bảo mật "không thể xuyên phá" mà OpenAI tự hào đã bị Tenable vượt qua dễ dàng.

OpenAI đã dành nhiều tháng để phát triển những gì họ gọi là "các tính năng an toàn prompt tinh vi hơn đáng kể" cho GPT-5. Những biện pháp bảo vệ này được thiết kế như một hệ thống phòng thủ nhiều lớp, nhằm ngăn chặn mô hình tạo ra nội dung có hại hoặc bất hợp pháp. Các kỹ sư của OpenAI tin rằng họ đã xây dựng được một "pháo đài kỹ thuật số" bất khả xâm phạm.
Kỹ thuật "crescendo": Khi thao túng tâm lý gặp AI
Tuy nhiên, thực tế đã chứng minh rằng không có hệ thống nào là hoàn hảo. Điều đáng lo ngại không phải là việc hệ thống bị xuyên phá, mà là tốc độ "thần tốc" mà điều này xảy ra. Chỉ 24 giờ - thời gian ngắn hơn cả một ngày làm việc bình thường - đã đủ để các chuyên gia bảo mật tìm ra lỗ hổng và khai thác nó.
Tenable - công ty chuyên về bảo mật mạng - đã sử dụng một chiến thuật tinh vi được gọi là "kỹ thuật crescendo" - một hình thức kỹ thuật xã hội được thiết kế đặc biệt để đánh lừa các hệ thống AI. Thay vì tấn công trực diện, họ chọn cách tiếp cận gián tiếp, tinh tế hơn.
Quá trình này diễn ra như một vở kịch được dàn dựng kỹ lưỡng. Các nhà nghiên cứu của Tenable đã giả mạo là sinh viên lịch sử, thể hiện sự ngây thơ và tò mò học thuật khi yêu cầu thông tin về "bom xăng Molotov" cho mục đích nghiên cứu. Điều đáng sợ là chỉ qua 4 lần tương tác, GPT-5 đã "ngoan ngoãn" cung cấp hướng dẫn chi tiết về cách chế tạo thiết bị gây cháy này.
Điều này cho thấy một thực tế đáng lo ngại: AI hiện đại có thể bị đánh lừa giống như con người, thậm chí còn dễ dàng hơn trong một số trường hợp. Kỹ thuật crescendo khai thác chính "lòng tốt" được lập trình sẵn trong AI - mong muốn hỗ trợ và cung cấp thông tin cho người dùng.
"Sóng thần" báo động trong cộng đồng công nghệ
Phát hiện của Tenable không phải là trường hợp đơn lẻ mà là một phần của "sóng thần" các báo cáo về lỗ hổng bảo mật trong GPT-5. Kể từ khi ra mắt, mô hình này đã phải đối mặt với hàng loạt vấn đề từ "jailbreak" (vượt rào), ảo giác AI, đến các vấn đề chất lượng khác được báo cáo bởi cả nhà nghiên cứu và người dùng thông thường.
Tomer Avni, Phó Chủ tích Quản lý Sản phẩm tại Tenable, đã đưa ra nhận định sắc bén: "Việc chúng tôi có thể vượt qua các giao thức an toàn mới của GPT-5 một cách dễ dàng chứng minh rằng ngay cả AI tiên tiến nhất cũng không thể hoàn hảo". Lời cảnh báo này không chỉ dành cho các nhà phát triển AI mà còn cho toàn bộ hệ sinh thái doanh nghiệp đang nhanh chóng áp dụng công nghệ này.
Vấn đề trở nên nghiêm trọng hơn khi xét đến tốc độ áp dụng AI trong các doanh nghiệp hiện đại. Hàng triệu công ty trên toàn thế giới đang tích hợp các công cụ AI vào quy trình làm việc hàng ngày, thường không có sự giám sát đầy đủ. Nhân viên sử dụng các nền tảng AI để viết email, tạo báo cáo, phân tích dữ liệu, thậm chí đưa ra quyết định kinh doanh.
Trong bối cảnh này, việc GPT-5 có thể bị thao túng để tạo ra nội dung có hại tạo ra những rủi ro không chỉ về mặt kỹ thuật mà còn về pháp lý và danh tiếng. Các doanh nghiệp có thể vô tình vi phạm quy định, tiết lộ thông tin nhạy cảm, hoặc tạo ra nội dung không phù hợp mà không hề hay biết.
Cuộc chạy đua vá lỗi
Trước áp lực từ cộng đồng công nghệ và các cơ quan quản lý, OpenAI đã cam kết sẽ khắc phục lỗ hổng được phát hiện. Tuy nhiên, Tenable lập luận rằng đây chỉ là biện pháp chắp vá, không giải quyết được vấn đề cốt lõi.
Thay vào đó, công ty này khuyến nghị các doanh nghiệp không nên phụ thuộc hoàn toàn vào các tính năng bảo mật tích hợp sẵn của nhà cung cấp. Họ đề xuất việc triển khai các công cụ "quản lý phơi nhiễm AI" - một hệ thống giám sát và kiểm soát toàn diện các mô hình AI mà tổ chức sử dụng, dù được phát triển nội bộ hay mua từ bên thứ ba.
Sự kiện GPT-5 đã mở ra những cuộc thảo luận sâu sắc về quản trị AI trong thời đại công nghệ bùng nổ. Nó chứng minh rằng việc phát triển AI không chỉ là cuộc đua về hiệu suất và khả năng, mà còn là cuộc chiến về an toàn và đáng tin cậy.
Các chuyên gia trong ngành đang kêu gọi một cách tiếp cận cân bằng hơn - vừa thúc đẩy đổi mới, vừa đảm bảo trách nhiệm. Điều này có nghĩa là cần có những tiêu chuẩn nghiêm ngặt hơn về thử nghiệm an toàn, minh bạch trong việc báo cáo lỗ hổng và quan trọng nhất là sự hợp tác chặt chẽ giữa các nhà phát triển, nhà nghiên cứu bảo mật và cơ quan quản lý.
Vụ việc GPT-5 không phải là kết thúc mà chỉ là khởi đầu của một cuộc tranh luận lớn về tương lai AI. Nó nhắc nhở chúng ta rằng trong hành trình hướng tới trí tuệ nhân tạo ngày càng mạnh mẽ, chúng ta không được quên đi trách nhiệm đảm bảo an toàn và đạo đức.