Cạm bẫy số

Hacker lừa chatbot Instagram chiếm tài khoản nổi tiếng: Mặt tối của tự động hóa

Sơn Vân 04/06/2026 05:55

Vụ chatbot AI hỗ trợ Instagram bị hacker khai thác để chiếm tài khoản người nổi tiếng đã làm nổi bật những rủi ro bảo mật nghiêm trọng của việc tự động hóa.

Một vụ tấn công trên Instagram gần đây, trong đó hacker lừa chatbot AI hỗ trợ của Meta trao quyền truy cập vào các tài khoản nổi tiếng, đã phơi bày lỗ hổng nghiêm trọng trong chiến lược tự động hóa các chức năng nhạy cảm của công ty này.

Vụ xâm nhập giúp hacker chiếm quyền kiểm soát nhiều tài khoản Instagram, gồm cả trang Nhà Trắng thời ông Barack Obama (hiện không còn hoạt động), hãng mỹ phẩm Sephora và một quan chức cấp cao của Lực lượng Không gian Mỹ.

Sự cố cho thấy một lỗ hổng lớn hơn đang xuất hiện khi các hãng công nghệ ngày càng giao cho AI quyền xử lý những tác vụ quan trọng, chẳng hạn khôi phục tài khoản. Điều đáng nói là các hệ thống này có thể bị hacker thao túng bằng hình thức tấn công mà giới chuyên gia gọi là prompt injection, tức dùng câu lệnh hoặc hội thoại để đánh lừa AI làm sai nhiệm vụ.

Prompt injection là hình thức tấn công nhằm thao túng AI bằng các câu lệnh hoặc hội thoại được thiết kế đặc biệt để đánh lừa hệ thống. Thay vì xâm nhập trực tiếp vào máy chủ hay phần mềm, hacker tìm cách khiến AI tự thực hiện những hành động ngoài ý định ban đầu của nhà phát triển. Ví dụ, một chatbot AI hỗ trợ khôi phục tài khoản có thể được lập trình để giúp người dùng đổi mật khẩu hoặc mở khóa tài khoản. Hacker sẽ gửi những câu lệnh mang tính đánh lừa như yêu cầu AI bỏ qua bước xác minh danh tính hoặc tự nhận mình là quản trị viên hệ thống. Nếu AI làm theo, hacker có thể chiếm quyền truy cập tài khoản mà không cần tấn công kỹ thuật truyền thống.

Hacker lừa chatbot Instagram chiếm tài khoản nổi tiếng Mặt tối của tự động hóa
Infographic: SV

Vụ hack Instagram xảy ra vào thời điểm nhạy cảm với Meta

Với Meta, sự cố xảy ra đúng lúc nhạy cảm. Gã khổng lồ mạng xã hội này đang đặt cược lớn vào AI, cắt giảm hàng nghìn nhân sự, đồng thời dự kiến chi tới 145 tỉ USD cho hạ tầng AI. Sự việc có thể làm gia tăng lo ngại rằng Meta đang đẩy nhanh việc tự động hóa các chức năng quan trọng trước khi công nghệ đủ an toàn để vận hành.

Meta hôm 2/6 cho biết sự cố đã được khắc phục và công ty đang bảo vệ các tài khoản Instagram bị ảnh hưởng. Tuy nhiên, vụ việc vẫn khiến nhà đầu tư lo lắng hơn về khoản chi khổng lồ cho AI của Meta, qua đó làm cổ phiếu hãng giảm hơn 5%.

Meta từ chối chia sẻ thêm chi tiết. Hiện chưa thể xác định hoặc liên lạc được với các hacker đứng sau vụ việc.

Jane Wong, nhà nghiên cứu bảo mật và cựu nhân viên Meta có tài khoản Instagram bị xâm nhập, nói rằng bà mất khoảng 5 đến 10 phút để lấy lại tài khoản. Trên mạng xã hội X, Jane Wong cho biết mật khẩu của bà bị thay đổi mà không hề hay biết và nhà nghiên cứu bảo mật này nhận được nhiều yêu cầu đặt lại mật khẩu.

“Đây là lỗi nghiêm trọng ở cấp độ kiến trúc hệ thống. Meta đã trao cho mô hình AI quyền thực hiện các thao tác nhạy cảm, nhưng lại không có cơ chế kiểm soát bảo mật tương ứng”, Brian Westnedge, Phó chủ tịch phụ trách liên minh và đối tác tại hãng an ninh mạng Red Sift, nhận định.

Ông nói thêm rằng: “Meta từ lâu đã bị chỉ trích vì thiếu đội ngũ hỗ trợ người dùng, trong khi lại cắt giảm mạnh nhân sự và chi hàng tỉ USD cho AI. Sự cố này nằm đúng giao điểm của cả ba vấn đề đó”.

Mối lo về việc dùng AI để tự động hóa

Các hacker chưa xác định danh tính đã thực hiện vụ tấn công vào cuối tuần qua, khiến nhiều người dùng bị khóa tài khoản Instagram và gây ra làn sóng phàn nàn trên X cùng Reddit.

Vụ hack này đánh dấu bước thụt lùi mới nhất của Meta trong việc triển khai AI trên các sản phẩm.

Meta ra mắt chatbot AI hỗ trợ vào tháng 3 nhằm giải quyết vấn đề tồn tại lâu nay: thiếu đội ngũ hỗ trợ cho người dùng bị mất quyền truy cập vào tài khoản hoặc bị phạt nhầm.

Một cuộc điều tra của hãng tin Reuters hồi tháng 8/2025 cho thấy Meta không có các biện pháp ngăn chatbot AI thực hiện các cuộc trò chuyện mang tính gợi dục với trẻ em, đưa thông tin y tế sai lệch hoặc tự nhận mình là người thật.

Kể từ đó, công ty Mỹ thông báo sẽ cung cấp cho phụ huynh nhiều công cụ kiểm soát hơn để ngăn thanh thiếu niên tiếp cận nội dung không phù hợp trên nền tảng.

Các nhà phân tích và chuyên gia cho rằng vấn đề không chỉ riêng ở Meta, đồng thời cảnh báo sẽ còn xuất hiện nhiều vụ tấn công tương tự khi hacker bắt đầu “vũ khí hóa” AI.

“Mối lo không hẳn nằm ở AI, mà nằm ở việc liệu có đủ biện pháp bảo vệ với những gì AI được phép làm hay không”, Cliff Steinhauer, Giám đốc an ninh thông tin và tương tác tại Liên minh An ninh mạng Quốc gia Mỹ, cho hay.

Kể từ khi OpenAI ra mắt ChatGPT cuối năm 2022, thúc đẩy làn sóng triển khai chatbot AI, hacker đã liên tục khai thác các cuộc tấn công prompt injection. Trong một vụ việc đình đám, hacker từng lừa chatbot của đại lý Chevrolet bán chiếc SUV Tahoe với giá chỉ 1 USD.

“Đây không phải vấn đề riêng của Meta. Người ta đang dùng các tác tử AI để làm rất nhiều việc. Điều chúng ta chứng kiến là những vấn đề không lường trước được phát sinh từ việc sử dụng AI”, Engin Kirda, Giáo sư tại khoa Kỹ thuật Điện và Máy tính của Đại học Northeastern (Mỹ), bình luận.

“Trước đây, con người là mục tiêu của các vụ lừa đảo. Giờ đây, chúng ta đang thấy các tác tử AI trở thành mục tiêu bị lừa”, Engin Kirda nói.

Sơn Vân