AI & Blockchain

AI khiến các chương trình săn lỗi bảo mật hỗn loạn vì báo cáo giả từ hacker

Sơn Vân • 18/05/2026 05:36

Các chương trình săn lỗi bảo mật nhận thưởng (bug bounty) đang chứng kiến số lượng báo cáo giả mạo do AI tạo ra tăng vọt.

Các công ty trả tiền cho hacker để tìm lỗ hổng trong phần mềm đang bị ngập trong những báo cáo chất lượng thấp do AI tạo ra, đến mức một số phải tạm dừng hoàn toàn chương trình này.

Các doanh nghiệp vận hành chương trình bug bounty từ lâu đã dựa vào những chuyên gia bảo mật độc lập để phát hiện lỗ hổng. Tuy nhiên, sự bùng nổ của các công cụ AI khiến họ choáng ngợp với lượng lớn báo cáo sai hoặc vô nghĩa.

Bugcrowd cho biết số lượng báo cáo lỗi bảo mật mà công ty nhận được đã tăng hơn 4 lần chỉ trong ba tuần của tháng 3. Điều đáng nói là phần lớn các báo cáo này đều là sai hoặc không có giá trị.

Bugcrowd đang nhận báo cáo lỗi bảo mật cho các khách hàng như OpenAI, T-Mobile và Motorola.

Curl, công cụ phổ biến dùng để truyền dữ liệu qua Internet, đã tạm dừng chương trình thưởng tiền cho người tìm lỗi bảo mật từ tháng 1. Lý do là số lượng báo cáo rác do AI tạo ra tăng bùng nổ và chất lượng ngày càng thấp.

AI làm thay đổi chương trình săn lỗi bảo mật

Các chuyên gia an ninh mạng cho rằng AI tạo sinh đang làm thay đổi cách vận hành của các chương trình bug bounty. AI giúp những nhà nghiên cứu giàu kinh nghiệm tìm lỗ hổng nhanh hơn, nhưng đồng thời cũng khiến bất kỳ ai cũng có thể dễ dàng tạo và gửi báo cáo lỗi. Điều này dẫn đến làn sóng báo cáo tự động hoặc sai lệch mà các công ty phải tốn nhiều công sức để sàng lọc.

Ross McKerchar, Giám đốc an ninh thông tin của hãng Sophos, nói rằng sự gia tăng mạnh của các báo cáo AI kém chất lượng đang “nhanh chóng trở thành vấn đề lớn”.

“Chương trình bug bounty sẽ không biến mất, nhưng chắc chắn phải thay đổi”, ông nói.

Bug bounty trở nên phổ biến từ đầu những năm 2000, với một số chương trình thưởng tới hàng trăm nghìn USD cho các phát hiện lớn. Chương trình của Google đã chi tổng cộng 17 triệu USD trong năm 2025, tăng từ 7,5 triệu USD vào năm 2021. Khoản thưởng cá nhân lớn nhất của Google là 605.000 USD vào năm 2022 cho người phát hiện lỗ hổng trong hệ điều hành Android.

Ross McKerchar cho biết làn sóng báo cáo chất lượng thấp đến từ cả những người mới thử săn lỗi bảo mật lần đầu lẫn các nhà nghiên cứu hiện tại. “Họ đôi khi bị các tác tử AI dẫn sai hướng”, Ross McKerchar nói.

Theo ông, còn có một nhóm thứ ba gồm các nhà phát triển AI giàu kinh nghiệm, đã tạo ra các hệ thống tự động quét và gửi báo cáo từ đầu đến cuối, gây ra “tình trạng hỗn loạn hoàn toàn”.

Daniel Stenberg, người tạo ra Curl, viết trên blog rằng “dòng rác AI không bao giờ dứt gây áp lực tinh thần nghiêm trọng lên đội ngũ quản lý và đôi khi khiến họ mất rất nhiều thời gian để chứng minh các báo cáo đó là sai”.

AI khiến các chương trình săn lỗi bảo mật hỗn loạn vì báo cáo giả từ hacker1 — Infographic: SV.

“Các báo cáo lỗi chất lượng thấp tăng mạnh”

Hãng phần mềm Nextcloud cũng đã tạm dừng chương trình bug bounty vào tháng 4 vì “các báo cáo lỗi chất lượng thấp tăng mạnh”. Nextcloud hy vọng sẽ khởi động lại chương trình sau khi tìm được cách lọc báo cáo hiệu quả hơn.

Sự gia tăng các báo cáo lỗi bảo mật do AI tạo ra diễn ra khi Anthropic giới thiệu mô hình Claude Mythos có năng lực an ninh mạng tiên tiến vào tháng 4.

Theo Anthropic, Claude Mythos có tính tự chủ cực cao và khả năng suy luận tinh vi, tương đương chuyên gia nghiên cứu bảo mật cấp cao. Nó có thể phát hiện hàng chục nghìn lỗ hổng bảo mật mà ngay cả những chuyên gia săn lỗi hàng đầu cũng khó tìm ra.

Trong quá trình thử nghiệm của Anthropic, Claude Mythos đã phát hiện lỗi trong “mọi hệ điều hành và trình duyệt web lớn”, gồm cả những lỗ hổng tồn tại hàng chục năm mà các cuộc kiểm tra bảo mật do con người thực hiện trước đó không phát hiện ra.

Thay vì phát hành công khai, Anthropic cung cấp phiên bản Claude Mythos Preview cho nhóm 11 tổ chức chọn lọc trong khuôn khổ Dự án Glasswing của Anthropic, gồm Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, Linux Foundation, Microsoft, Nvidia, Palo Alto Networks, JPMorgan Chase.

Anthropic tiết lộ đã mở rộng quyền truy cập Claude Mythos Preview cho khoảng 40 tổ chức khác chịu trách nhiệm về hạ tầng phần mềm quan trọng. Theo Anthropic, mục tiêu lâu dài của công ty là giúp người dùng có thể triển khai các mô hình AI mạnh mẽ như Claude Mythos một cách an toàn và trên quy mô lớn, kể cả cho các mục đích ngoài an ninh mạng.

Theo trang Axios, Cơ quan An ninh Quốc gia Mỹ (NSA) cùng nhiều cơ quan chính phủ khác cũng đã bắt đầu sử dụng Claude Mythos Preview.

Đầu tháng 5, ông Emil Michael, Giám đốc công nghệ Bộ Quốc phòng Mỹ, nói rằng Claude Mythos là “khoảnh khắc an ninh quốc gia riêng biệt”.

Hôm 8/5, Mozilla cho biết Claude Mythos đã giúp tổ chức này sửa 423 lỗi bảo mật Firefox chỉ trong tháng 4, tăng mạnh so với mức trung bình chỉ vài chục lỗi mỗi tháng trước đây.

Cụ thể hơn, Mozilla - tổ chức phi lợi nhuận đứng sau trình duyệt Firefox - cho biết Claude Mythos đã phát hiện ra hàng trăm lỗ hổng bảo mật, gồm cả 1 lỗi tồn tại suốt 20 năm.

Theo Mozilla, 1 lỗi trong số đó “không được phát hiện suốt nhiều năm bởi các fuzzing”, tức công cụ kiểm thử bảo mật chuyên tìm lỗi phần mềm.

Nhìn chung, Mozilla cho biết nỗ lực với sự hỗ trợ từ AI đã góp phần sửa chữa 423 lỗi bảo mật trong các bản cập nhật Firefox tháng 4. Trong số đó có 271 lỗi được công ty xác định trực tiếp nhờ Claude Mythos Preview.

Đó là sự thay đổi lớn so với các bản cập nhật hằng tháng trước đây của Mozilla. Mozilla cho biết chỉ sửa được 25 lỗi bảo mật vào tháng 1 và 76 lỗi trong tháng 3.

Kiểm tra danh tính nghiêm ngặt hơn

Các công ty vận hành bug bounty hiện bắt đầu áp dụng quy trình kiểm tra danh tính nghiêm ngặt hơn, đồng thời phát triển các tác tử AI để tự động phân loại báo cáo.

HackerOne, nền tảng tiếp nhận báo cáo lỗi bảo mật cho các khách hàng như Goldman Sachs, Google và Bộ Quốc phòng Mỹ, nói đã bổ sung các công cụ xác minh mới dạng tác tử AI trong năm nay. Mục tiêu là giúp các tổ chức xử lý lượng lớn báo cáo lỗ hổng bảo mật, đặc biệt là do các mô hình AI như Claude Mythos tạo ra.

HackerOne cho biết số lượng báo cáo lỗi bảo mật đã tăng 76% trong năm 2026 tính đến tháng 3. Tuy nhiên, tỷ lệ báo cáo phát hiện lỗ hổng thật trong năm qua vẫn ở mức 25% .

Kara Sprague, Giám đốc điều hành HackerOne, nói đã thấy nhiều báo cáo chất lượng cao hơn nhờ sự hỗ trợ của AI trong vài tuần gần. Bà nói việc các báo cáo do AI tạo ra ngày càng nhiều không phải là lý do để loại bỏ hoàn toàn chúng, vì hacker đang dùng công nghệ này để phát hiện được nhiều lỗ hổng hơn trước.

Dave Gerry, Giám đốc điều hành Bugcrowd, cũng cho rằng các mô hình AI như Claude Mythos sẽ hỗ trợ thợ săn lỗi bảo mật chứ không thay thế họ.

“AI sẽ giúp ích trong rất nhiều việc, nhưng sẽ không bao giờ thay thế được sự sáng tạo của con người”, ông nhấn mạnh.

Sơn Vân