Phát hiện hàng triệu ứng dụng AI Android rò rỉ dữ liệu nhạy cảm
Một nghiên cứu an ninh mạng mới đây cho thấy hàng chục nghìn ứng dụng AI trên Android đang để lộ khóa truy cập, dữ liệu người dùng và hạ tầng đám mây. Quy mô rò rỉ lên tới hàng trăm triệu tệp tin, đặt ra cảnh báo nghiêm trọng về an toàn thông tin trên Google Play.
72% ứng dụng AI Android chứa “secret” được nhúng trực tiếp trong mã
Theo Techradar, báo cáo của nhóm nghiên cứu Cybernews mới đây cho biết, hơn 1,8 triệu ứng dụng Android trên Google Play Store đã được phân tích, tập trung vào các ứng dụng tự quảng bá có tích hợp trí tuệ nhân tạo. Từ tập dữ liệu ban đầu, các chuyên gia xác định 38.630 ứng dụng AI Android và tiến hành kiểm tra mã nguồn nội bộ nhằm phát hiện khóa truy cập, thông tin xác thực và tham chiếu tới các dịch vụ đám mây.

Kết quả cho thấy tình trạng xử lý dữ liệu kém an toàn không còn là vấn đề cá biệt, mà mang tính hệ thống trên diện rộng.
Báo cáo chỉ ra rằng gần 72% ứng dụng AI Android được phân tích có ít nhất một khóa bảo mật được hardcode trực tiếp vào mã nguồn. Trung bình, mỗi ứng dụng bị ảnh hưởng để lộ khoảng 5,1 thông tin nhạy cảm.
Tổng cộng, nhóm nghiên cứu phát hiện 197.092 khóa truy cập và thông tin xác thực duy nhất. Đây là dấu hiệu cho thấy các cảnh báo về lập trình an toàn đã tồn tại nhiều năm nhưng vẫn chưa được cộng đồng phát triển ứng dụng tuân thủ nghiêm túc.
Hạ tầng Google Cloud chiếm tỷ lệ rò rỉ cao nhất, Firebase bị khai thác hàng loạt
Hơn 81% số thông tin bị lộ có liên quan trực tiếp tới hệ sinh thái Google Cloud, bao gồm API key, project ID, Firebase database và storage bucket.
Trong số 26.424 điểm truy cập Google Cloud được phát hiện, khoảng hai phần ba trỏ tới hạ tầng đã ngừng hoạt động. Tuy nhiên, vẫn còn 8.545 bucket lưu trữ tồn tại và yêu cầu xác thực, trong đó hàng trăm bucket bị cấu hình sai, cho phép truy cập công khai.
Các chuyên gia ước tính những bucket này có thể làm lộ hơn 200 triệu tệp dữ liệu, với tổng dung lượng gần 730TB, bao gồm hình ảnh, tài liệu, dữ liệu người dùng và thông tin nội bộ của ứng dụng.
Nghiên cứu cũng phát hiện 285 cơ sở dữ liệu Firebase hoàn toàn không có lớp xác thực, khiến ít nhất 1,1GB dữ liệu người dùng bị lộ.
Đáng chú ý, 42% trong số các cơ sở dữ liệu bị lộ có chứa bảng dữ liệu được gắn nhãn “proof of concept”, cho thấy đã từng bị hacker truy cập và thử nghiệm xâm nhập. Một số hệ thống còn xuất hiện tài khoản quản trị được tạo bằng email mang dấu hiệu của tin tặc, khẳng định việc khai thác không chỉ tồn tại trên lý thuyết.
Dù đã có dấu hiệu bị xâm nhập, nhiều cơ sở dữ liệu vẫn không được vá lỗi, phản ánh tình trạng giám sát an ninh yếu kém của nhà phát triển.
Khóa API AI bị lộ không nhiều, nhưng hệ thống thanh toán là mối nguy lớn
Trái với lo ngại ban đầu, số lượng khóa API của các mô hình ngôn ngữ lớn như OpenAI, Google Gemini hay Claude bị lộ tương đối ít. Trong đa số trường hợp, các khóa này chỉ cho phép gửi yêu cầu mới, không truy cập được lịch sử hội thoại hay dữ liệu cũ.
Tuy nhiên, một số trường hợp nghiêm trọng hơn liên quan đến hạ tầng thanh toán. Báo cáo cho biết nhiều khóa Stripe bí mật bị lộ, có khả năng cho phép kẻ tấn công kiểm soát toàn bộ hệ thống thanh toán của ứng dụng.
Ngoài ra, nhiều thông tin đăng nhập khác liên quan tới nền tảng phân tích dữ liệu, hệ thống liên lạc và quản lý khách hàng cũng bị phát hiện, mở ra nguy cơ giả mạo ứng dụng hoặc đánh cắp dữ liệu trên diện rộng.
Kiểm duyệt kho ứng dụng không đủ để ngăn rủi ro hệ thống
Cybernews nhấn mạnh rằng các lỗ hổng này không thể được khắc phục bằng những biện pháp đơn giản như cài đặt phần mềm diệt virus hay tường lửa sau khi dữ liệu đã bị lộ.
Quy mô dữ liệu bị phơi bày cùng số lượng ứng dụng đã từng bị xâm nhập cho thấy quy trình kiểm duyệt ứng dụng hiện tại của các kho ứng dụng, bao gồm Google Play, vẫn chưa đủ mạnh để kiểm soát rủi ro bảo mật mang tính hệ thống.
Các chuyên gia khuyến nghị nhà phát triển cần loại bỏ hardcode secrets, áp dụng cơ chế quản lý khóa tập trung, mã hóa dữ liệu và tăng cường giám sát truy cập đám mây. Trong khi đó, người dùng được khuyên hạn chế cấp quyền không cần thiết và cẩn trọng khi cài đặt các ứng dụng AI chưa rõ nguồn gốc.