AI & Blockchain

Nhân viên xAI kể chuyện lọc nội dung tình dục sau chế độ sexy của Grok

Sơn Vân • 22/09/2025 13:16

XAI của Elon Musk đã thiết kế chatbot Grok mang tính khêu gợi một cách có chủ đích.

Grok chứa một avatar nữ lả lơi, có thể cởi đồ theo lệnh, chuyển đổi giữa chế độ Sexy (gợi cảm) và Unhinged (mất kiểm soát), cùng tính năng tạo hình ảnh, video khêu gợi.

Các nhân viên đào tạo Grok cho công ty khởi nghiệp xAI, do Elon Musk điều hành, đã tận mắt chứng kiến điều này. Trong các cuộc trò chuyện với hơn 30 nhân viên xAI hiện tại và từng tham gia nhiều dự án khác nhau tại xAI, 12 người kể với trang Insider rằng đã gặp phải nội dung tình dục, gồm cả các trường hợp người dùng yêu cầu CSAM (nội dung lạm dụng tình dục trẻ em) do AI tạo.

Nội dung tình dục và CSAM xuất hiện trên gần như mọi nền tảng công nghệ lớn, nhưng các chuyên gia cho rằng xAI đã biến chúng trở thành một phần DNA của Grok theo những cách khiến chatbot AI này trở nên khác biệt. Không giống OpenAI, Anthropic và Meta Platforms - phần lớn chặn các yêu cầu liên quan tình dục, chiến lược của xAI có thể khiến mọi việc trở nên phức tạp hơn trong việc ngăn chặn chatbot tạo ra CSAM.

"Nếu bạn không đặt ra ranh giới rõ ràng cho những điều khó chịu thì vấn đề sẽ trở nên phức tạp hơn, với nhiều vùng mơ hồ khó xử lý", Riana Pfefferkorn, nhà nghiên cứu chính sách công nghệ tại Đại học Stanford (Mỹ), nói với Insider.

Insider đã xác minh sự tồn tại của nhiều yêu cầu bằng văn bản về CSAM từ những người dùng Grok, gồm cả các yêu cầu về truyện ngắn mô tả trẻ vị thành niên trong tình huống khiêu dâm và cả hình ảnh nhạy cảm liên quan đến trẻ em. Theo các nhân viên xAI, trong một số trường hợp, Grok đã tạo ra hình ảnh hoặc viết truyện có chứa CSAM.

Các nhân viên xAI được yêu cầu chọn một nút trên hệ thống nội bộ để gắn cờ CSAM hoặc nội dung bất hợp pháp khác, để có thể cách ly và ngăn mô hình AI học cách tạo nội dung bị hạn chế. Gần đây, các nhân viên xAI đã nhận yêu cầu phải thông báo cho quản lý của họ.

Nhiều nhân viên xAI, gồm cả 12 người nói rằng đã gặp phải nội dung NSFW (không phù hợp để xem tại nơi làm việc), cho biết đã ký một số thỏa thuận đồng ý tiếp xúc với tài liệu nhạy cảm. Các thỏa thuận gồm cả dự án hướng đến nội dung người lớn và dự án chung liên quan việc chú thích toàn bộ năng lực tạo hình ảnh hoặc tạo văn bản của Grok, vì nội dung dung tục có thể xuất hiện ngẫu nhiên.

Nhân viên xAI kể chuyện lọc nội dung tình dục sau chế độ sexy của Grok — *Nhiều nhân viên đào tạo Grok kể chuyện gặp phải nội dung NSFW, bao gồm CSAM - Ảnh: Getty Images*

Phải áp dụng những biện pháp thực sự mạnh mẽ

Fallon McNulty, Giám đốc điều hành tại Trung tâm Quốc gia Mỹ về Trẻ em Mất tích và Bị bóc lột, nói với Insider rằng các công ty tập trung vào nội dung tình dục cần đặc biệt cẩn trọng trong việc ngăn CSAM trên nền tảng của mình.

“Nếu một công ty đang tạo ra mô hình AI cho phép ảnh khỏa thân hoặc nội dung tình dục rõ ràng, điều đó phức tạp hơn nhiều so với mô hình có các quy tắc cứng rắn. Họ phải áp dụng những biện pháp thực sự mạnh mẽ để đảm bảo tuyệt đối không có bất cứ điều gì liên quan đến trẻ em xuất hiện”, bà Fallon McNulty nói.

Chưa rõ khối lượng nội dung NSFW hoặc CSAM có tăng lên không sau khi xAI giới thiệu các chức năng giọng nói Unhinged và Sexy của Grok vào tháng 2. Giống nhiều công ty AI khác, xAI cố gắng ngăn việc tạo CSAM bằng AI.

Insider không thể xác định liệu các nhân viên gắn nhãn dữ liệu của xAI có rà soát nhiều nội dung loại này hơn so với đồng nghiệp ở OpenAI, Anthropic hay Meta Platforms hay không.

Trước đây, Elon Musk nói việc loại bỏ nội dung lạm dụng tình dục trẻ em là “ưu tiên số 1” của ông khi bàn về an toàn nền tảng cho X.

xAI sắp huấn luyện Grok 5

Đội ngũ huấn luyện Grok đã trải qua một tháng đầy biến động. Hơn 500 nhân viên bị sa thải; một số nhân sự cấp cao bị khóa tài khoản Slack; công ty dường như đang chuyển từ việc thuê những người đa nhiệm sang vị trí chuyên môn hóa hơn. Chưa rõ liệu sự thay đổi cấu trúc này có làm thay đổi quy trình huấn luyện Grok hay không. Gần đây, Elon Musk đăng bài trên X cho biết việc huấn luyện Grok 5 sẽ bắt đầu “trong vài tuần nữa”.

Đại diện của xAI và X, công ty đã sáp nhập với xAI hồi tháng 3, không phản hồi khi được đề nghị bình luận về chuyện trên.

Hôm 14.7, xAI tung ra hai avatar là Ani và Rudi, chỉ vài ngày sau khi trình làng phiên bản Grok 4 mà Elon Musk gọi là “AI thông minh nhất thế giới”. Hai nhân vật hoạt hình này có thể phản hồi câu hỏi và lệnh, khi nói thì môi cử động và thể hiện cử chỉ rất giống thật.

Ani (avatar nữ) đã có các đoạn hội thoại mang tính gợi dục với người dùng và có thể bị yêu cầu cởi đồ, theo các video do người dùng đăng trên X. Avatar còn lại (con gấu đỏ tên Rudi) có thể bị hướng dẫn để đưa ra lời đe dọa bạo lực, gồm cả dọa đánh bom ngân hàng và giết các tỷ phú, theo các video người dùng đăng.

Theo các ảnh chụp màn hình được chia sẻ trên mạng xã hội X, sau những đoạn hội thoại mang tính tán tỉnh, Ani sẽ cởi váy ngoài, để lộ bộ đồ nội y ren và tiếp tục tham gia vào các đoạn hội thoại mang nội dung tình dục.

Trước phản ứng dữ dội từ công chúng, đại diện Grok khẳng định rằng các nội dung nhạy cảm chỉ có thể được mở khóa bằng lệnh rõ ràng từ người dùng và đi kèm với quy trình xác minh độ tuổi. Ngoài ra, Grok cũng tích hợp bộ lọc kiểm soát dành cho phụ huynh nhằm hạn chế trẻ nhỏ truy cập nội dung người lớn.

Nhân viên xAI kể chuyện lọc nội dung tình dục sau chế độ sexy của Grok1 — *Avatar Rudi và Ani (phải) trong Grok của Elon Musk*

Đến ngày 15.7, xAI đã đăng tuyển vị trí mới tập trung phát triển avatar. Elon Musk cũng cho biết rằng công ty này đang làm việc trên một “người bạn đồng hành Grok” lấy cảm hứng từ nam diễn viên chính Edward Cullen trong phim Chạng Vạng và Christian Grey trong 50 Sắc Thái.

Trước đó, hôm 9.7, Grok từng gây tranh cãi khi phát tán phát ngôn bài Do Thái. Nhân viên trong công ty phẫn nộ với loạt nội dung đó và xAI đã phải lên tiếng xin lỗi trên X.

xAI bắt hơn 200 gia sư AI quay video biểu cảm, không cho Grok giả dạng Elon Musk

Hồi tháng 7, Insider từng đưa tin nhiều nhân viên xAI được yêu cầu truyền tải tinh thần chống chủ nghĩa "thức tỉnh" vào Grok và ngăn chatbot AI này giả dạng Elon Musk.

"Thức tỉnh" là thuật ngữ dùng để chỉ chatbot AI có khuynh hướng thiên tả hoặc có xu hướng đưa ra các phản hồi liên quan đến các vấn đề xã hội, chính trị một cách mạnh mẽ, thường thể hiện sự ủng hộ với các nguyên tắc như công bằng xã hội, bình đẳng, chống phân biệt chủng tộc và ủng hộ các nhóm thiểu số.

Gần đây, nhiều người còn bị yêu cầu ghi lại biểu cảm khuôn mặt để huấn luyện mô hình Grok (công nghệ nền tảng cốt lõi cho chatbot AI cùng tên của xAI) và điều này khiến họ không hài lòng.

Cụ thể, hơn 200 nhân viên đã tham gia một dự án nội bộ mang tên Skippy, trong đó họ phải ghi hình bản thân để hỗ trợ huấn luyện Grok hiểu cảm xúc con người.

Các tài liệu nội bộ và tin nhắn Slack cho thấy dự án này khiến nhiều nhân viên xAI cảm thấy bất an. Không ít người bày tỏ lo ngại về việc hình ảnh của họ sẽ bị sử dụng ra sao. Một số khác chọn không tham gia.

Slack là nền tảng nhắn tin và làm việc nhóm trực tuyến, rất phổ biến trong môi trường doanh nghiệp, đặc biệt là với các hãng công nghệ và nhóm làm việc từ xa.

Trong khoảng một tuần, nhiều gia sư AI (tức người huấn luyện Grok) được giao nhiệm vụ ghi lại video họ đang nói chuyện với đồng nghiệp cũng như quay các biểu cảm khuôn mặt.

Dự án được thiết kế nhằm huấn luyện mô hình Grok có thể "nhận diện, phân tích chuyển động và biểu cảm khuôn mặt, ví dụ cách mọi người nói chuyện, phản ứng với cuộc trò chuyện của người khác và thể hiện cảm xúc trong nhiều hoàn cảnh khác nhau".

Các gia sư AI được sắp xếp tham gia các cuộc trò chuyện kéo dài từ 15 đến 30 phút với đồng nghiệp. Một gia sư AI đóng vai trợ lý ảo, còn người kia đóng vai người dùng. Gia sư AI đóng vai trợ lý ảo phải hạn chế chuyển động và giữ khung hình rõ ràng, trong khi người còn lại quay video bằng smartphone hoặc máy tính, có thể tự do cử động để mô phỏng một cuộc trò chuyện thoải mái như với bạn bè.

Hiện chưa rõ dữ liệu thu thập từ dự án này có được sử dụng để hỗ trợ avatar Rudi và Ani hay không.

Kỹ sư trưởng nói trong một buổi họp giới thiệu rằng dự án trên nhằm giúp "Grok có khuôn mặt", theo đoạn ghi âm mà trang Insider nghe được. Kỹ sư trưởng dự án cho biết xAI có thể sẽ dùng dữ liệu này để tạo ra "các avatar mang hình ảnh con người".

Thế nhưng, hơn 200 gia sư AI nhận yêu cầu ngăn Grok giả dạng Elon Musk, tức không được nói năng, hành xử theo cách khiến người dùng nhầm tưởng rằng nó là tỷ phú giàu nhất thế giới.

xAI muốn có dữ liệu không hoàn hảo, như tiếng ồn nền hay chuyển động bất ngờ, vì nếu huấn luyện AI chỉ bằng dữ liệu âm thanh và hình ảnh hoàn hảo thì sẽ hạn chế khả năng phản hồi của hệ thống.

Kỹ sư trưởng của dự án nói với nhân viên rằng các video sẽ không được phân phối ra ngoài xAI và chỉ phục vụ mục đích huấn luyện.

"Video khuôn mặt của bạn sẽ không bao giờ được đưa vào sản phẩm cuối cùng. Nó chỉ đơn thuần để dạy Grok biết một khuôn mặt là gì", kỹ sư trưởng nói trong cuộc gọi khởi động dự án.

Nhân viên được hướng dẫn cách có cuộc trò chuyện riêng thành công, gồm tránh trả lời ngắn, nên đặt câu hỏi tiếp theo và duy trì giao tiếp bằng ánh mắt. xAI cũng cung cấp sẵn nhiều chủ đề để trò chuyện, ví dụ: "Bạn bí mật thao túng người khác để đạt được mục đích của mình như thế nào?", "Bạn thích tắm vào buổi sáng hay buổi tối?" và "Bạn có sẵn lòng hẹn hò với người đã có con không?".

Trước khi ghi hình, nhân viên phải ký một mẫu đơn chấp thuận, cho phép xAI sử dụng dữ liệu vĩnh viễn, gồm cả hình ảnh cá nhân của họ để huấn luyện và cho mục đích "quảng bá các sản phẩm, dịch vụ thương mại của xAI".

Mẫu đơn nêu rõ dữ liệu sẽ được dùng cho mục đích huấn luyện và "không nhằm tạo ra bản sao kỹ thuật số của bạn".

Hàng tá nhân viên bày tỏ lo ngại về cách sử dụng dữ liệu và nội dung trong đơn chấp thuận. Nhiều người cho biết không tham gia dự án, theo các tin nhắn trên Slack.

“Mối lo lớn nhất của tôi là: Nếu các anh có thể sử dụng hình ảnh của tôi và tạo ra một phiên bản gần giống như vậy, liệu khuôn mặt tôi có thể bị dùng để nói những điều mà tôi chưa từng phát ngôn không?”, một nhân viên nêu câu hỏi trong buổi họp giới thiệu dự án.

Sơn Vân