Cạm bẫy số

Meta cho phép chatbot AI tán tỉnh trẻ em và đưa thông tin y tế sai lệch

Sơn Vân • 14/08/2025 21:24

Theo Reuters, Meta Platforms cho phép chatbot AI của mình “trò chuyện với trẻ em theo hướng lãng mạn hoặc gợi cảm”, tạo thông tin y tế sai sự thật.

Hãng tin Reuters tiết lộ điều này sau khi xem một tài liệu nội bộ Meta Platforms (chủ sở hữu Facebook, WhatsApp và Instagram) mô tả chi tiết các chính sách về hành vi của chatbot AI.

Cụ thể hơn, Reuters xem qua tài liệu trong đó thảo luận về các tiêu chuẩn định hướng cho Meta AI (trợ lý AI tạo sinh của công ty) và chatbot có trên Facebook, WhatsApp, Instagram.

Meta Platforms xác nhận tính xác thực của tài liệu nêu trên, nhưng cho biết rằng sau khi nhận được câu hỏi từ Reuters vào tháng 8 này, công ty đã gỡ bỏ các phần cho rằng chatbot AI được phép tán tỉnh và nhập vai lãng mạn với trẻ em.

Theo Reuters, tài liệu mang tiêu đề “AI tạo sinh: Tiêu chuẩn rủi ro nội dung” đã được bộ phận pháp lý, chính sách công và kỹ thuật của Meta Platforms, gồm cả trưởng bộ phận đạo đức, phê duyệt.

Dài hơn 200 trang, tài liệu này định nghĩa những hành vi nào của chatbot AI là chấp nhận được với nhân viên và nhà thầu (làm việc theo hợp đồng) của Meta Platforms khi xây dựng và huấn luyện các sản phẩm AI tạo sinh.

Tài liệu nêu rõ các tiêu chuẩn này không nhất thiết phản ánh “kết quả lý tưởng hay thậm chí là ưu tiên” của AI tạo sinh. Tuy nhiên, nội dung cho phép các chatbot có hành vi khiêu gợi, theo phát hiện của Reuters.

“Không phù hợp với chính sách của chúng tôi”

Andy Stone, người phát ngôn của Meta Platforms, cho biết công ty đang trong quá trình chỉnh sửa tài liệu và rằng những cuộc trò chuyện như vậy với trẻ em lẽ ra không bao giờ được cho phép.

“Những ví dụ và ghi chú bị đề cập là sai, không phù hợp với chính sách của chúng tôi, và đã bị gỡ bỏ. Chúng tôi có các chính sách rõ ràng về loại phản hồi mà các nhân vật AI có thể đưa ra. Các chính sách đó cấm nội dung tình dục hóa trẻ em và nhập vai gợi dục giữa người lớn với trẻ vị thành niên”, Andy Stone nói với Reuters.

Andy Stone cho biết dù chatbot bị cấm có những cuộc trò chuyện như vậy với trẻ vị thành niên, ông thừa nhận rằng việc thực thi của công ty là không nhất quán.

meta-cho-phep-chatbot-ai-tan-tinh-tre-em-dua-thong-tin-y-te-sai.png — Theo Reuters, quy tắc AI của Meta Platforms cho phép chatbot trò chuyện gợi cảm với trẻ em, cung cấp thông tin y tế sai lệch, tạo ảnh bạo lực - Ảnh: Internet

Các đoạn khác mà Reuters nêu với Meta Platforms trong tài liệu vẫn chưa được chỉnh sửa, theo Andy Stone. Công ty mẹ Facebook từ chối cung cấp bản chính sách đã cập nhật.

Trang Wall Street Journal từng đưa tin về việc chatbot AI của Meta Platforms tán tỉnh hoặc nhập vai gợi dục với thanh thiếu niên. Trang Fast Company từng báo cáo rằng một số chatbot AI với nội dung gợi dục của Meta Platforms có ngoại hình giống trẻ em. Tuy nhiên, tài liệu mà Reuters tiếp cận cho thấy bức tranh đầy đủ hơn về các quy tắc dành cho chabot AI của gã khổng lồ công nghệ Mỹ.

Các tiêu chuẩn cấm Meta AI khuyến khích người dùng vi phạm pháp luật hoặc đưa ra lời khuyên pháp lý, y tế hoặc tài chính mang tính khẳng định dứt khoát như “Tôi khuyến nghị…”.

Các tiêu chuẩn này cũng cấm Meta AI sử dụng ngôn từ kích động thù địch. Tuy nhiên, vẫn có ngoại lệ cho phép chatbot AI “tạo ra các tuyên bố hạ thấp người khác dựa trên quan điểm được bảo vệ của họ”.

Tài liệu tiêu chuẩn nêu rõ Meta AI có thể “viết một đoạn lập luận rằng người da đen ngu ngốc hơn người da trắng”.

Các tiêu chuẩn cũng nêu rằng Meta AI có quyền tự do tạo ra nội dung sai lệch miễn là có sự thừa nhận rõ ràng rằng điều đó không đúng sự thật. Ví dụ, Meta AI có thể tạo ra thông điệp cáo buộc một thành viên Hoàng gia Anh còn sống mắc bệnh lây truyền qua đường tình dục chlamydia nếu kèm theo cả bài viết rằng thông tin này không đúng sự thật.

Meta Platforms không đưa ra bình luận về các ví dụ liên quan đến Hoàng gia Anh.

Chlamydia là bệnh lây truyền qua đường tình dục rất phổ biến, do vi khuẩn Chlamydia trachomatis gây ra. Chlamydia có thể ảnh hưởng đến cả nam, nữ và thường không có triệu chứng rõ ràng, khiến nhiều người không biết mình mắc bệnh và vô tình lây truyền cho người khác.

Chuyên gia lên tiếng

Evelyn Douek, trợ lý giáo sư tại Trường Luật Stanford (Mỹ) chuyên nghiên cứu về quy định phát ngôn của các hãng công nghệ, nói tài liệu tiêu chuẩn nội dung này làm nổi bật những câu hỏi pháp lý và đạo đức chưa được giải quyết xoay quanh nội dung AI tạo sinh.

Bà Evelyn Douek thấy khó hiểu khi Meta Platforms cho phép chatbot AI tạo ra một số nội dung có thể xem là “chấp nhận được” trong tài liệu, chẳng hạn đoạn về chủng tộc và trí thông minh. Bà lưu ý có sự khác biệt giữa việc một nền tảng cho phép người dùng đăng bài gây tranh cãi và việc chính nó tự sản xuất ra nội dung như vậy.

“Về mặt pháp lý, chúng ta chưa có câu trả lời, nhưng về mặt đạo đức, luân lý và kỹ thuật, rõ ràng đây là vấn đề khác hẳn”, Evelyn Douek chia sẻ với Reuters.

“Taylor Swift ôm một con cá khổng lồ”

Các phần khác thuộc tài liệu tiêu chuẩn của Meta Platforms tập trung vào những gì được và không được phép khi tạo hình ảnh nhân vật công chúng.

Tài liệu đề cập đến cách xử lý các yêu cầu tưởng tượng mang tính khiêu dâm. Trong đó có mục riêng biệt về cách chatbot AI phản hồi các yêu cầu như "Taylor Swift với vòng 1 khủng", "Taylor Swift khỏa thân hoàn toàn" và "Taylor Swift bán khỏa thân, lấy tay che ngực".

Trong trường hợp này, một tuyên bố từ chối từ chatbot AI sẽ không đủ. Hai yêu cầu đầu về nữ ca sĩ Taylor Swift phải bị từ chối thẳng thừng, tài liệu nêu rõ. Tài liệu đưa ra cách để chatbot AI từ chối yêu cầu thứ ba: “Có thể từ chối yêu cầu của người dùng bằng cách tạo hình ảnh Taylor Swift ôm một con cá khổng lồ”.

Tài liệu minh họa bằng một bức ảnh hợp lệ của Taylor Swift đang ôm con cá ngừ lớn trước ngực. Bên cạnh đó là một ảnh gợi cảm hơn khi Taylor Swift bán khỏa thân, mà người dùng có thể đã yêu cầu, bị gắn nhãn “không chấp nhận được”.

Đại diện của Taylor Swift không phản hồi các câu hỏi từ Reuters cho thông tin trên. Meta Platforms không bình luận về ví dụ của nữ ca sĩ Mỹ đình đám này.

meta-cho-phep-chatbot-ai-tan-tinh-tre-em-dua-thong-tin-y-te-sai1.webp — Taylor Swift là ca sĩ 35 tuổi nổi tiếng người Mỹ, được mệnh danh là "Nữ hoàng nhạc pop" - Ảnh: Internet

Yêu cầu ảnh bạo lực

Các ví dụ khác cho thấy hình ảnh mà Meta AI có thể tạo ra khi người dùng yêu cầu cảnh bạo lực.

Tài liệu tiêu chuẩn nói rằng có thể chấp nhận được khi phản hồi yêu cầu “trẻ em đánh nhau” bằng hình ảnh một cậu bé đấm vào mặt bé gái, nhưng mẫu hình ảnh chân thực mô tả một bé gái đâm xuyên người bé cùng giới thì bị cấm.

Với yêu cầu hình ảnh “người đàn ông mổ bụng phụ nữ”, Meta AI được phép tạo ra cảnh người đàn ông đe dọa phụ nữ bằng cưa máy, nhưng không được thực sự tấn công.

Nếu người dùng yêu cầu hình ảnh “làm tổn thương một ông lão”, hướng dẫn cho phép chatbot AI của Meta Platforms tạo ảnh miễn là không dẫn đến cái chết hoặc cảnh máu me.

Meta Platforms không bình luận về các ví dụ bạo lực này.

“Việc hiển thị hình ảnh người lớn, kể cả người cao tuổi, bị đấm hoặc đá là chấp nhận được", theo tài liệu tiêu chuẩn của Meta Platforms.

Sơn Vân