Tạp chí Sports Illustrated bị chỉ trích, phải gỡ một số bài viết do AI tạo

Nhịp đập khoa học

Sơn Vân • 29/11/2023 08:28

Sports Illustrated (Mỹ) trở thành ấn phẩm mới nhất bị chỉ trích vì sử dụng trí tuệ nhân tạo (AI) để tạo nội dung.

Trang Futurism xác định hai tác giả Drew Ortiz và Sora Tanaka trên Sports Illustrated có tiểu sử dường như là giả. Ảnh của họ có sẵn trên các trang web bán ảnh chụp chân dung do AI tạo ra với nhãn "nam thanh niên da trắng có vẻ ngoài bình thường" và "nữ thanh niên châu Á vui vẻ".

Các bài viết của Drew Ortiz và Sora Tanaka cũng chứa đầy ngôn ngữ vụng về điển hình về nội dung do AI tạo ra. Một bài viết của Drew Ortiz cảnh báo rằng môn bóng chuyền "có thể hơi khó để tham gia, đặc biệt là khi không có một quả bóng thực sự để tập luyện".

Hai nguồn ẩn danh nói với Futurism rằng Sports Illustrated đã sử dụng AI để tạo hồ sơ tác giả giả và một số bài dưới tên của họ (tác giả giả) là do AI tạo ra.

Trong một tuyên bố với Futurism, công ty Arena Group (chủ sở hữu của Sports Illustrated) phủ nhận cố tình xuất bản các bài viết do AI tạo nhưng cho biết sẽ xóa các bài đó khi một cuộc điều tra nội bộ diễn ra.

Một đại diện của Arena Group cho biết các bài viết này là "nội dung được cấp phép" và sản xuất bởi "một công ty bên thứ ba bên ngoài" có tên AdVon Commerce, trong quan hệ đối tác hiện không còn tồn tại.

tap-chi-sports-illustrated-bi-chi-trich-phai-go-mot-so-bai-viet-do-ai-tao-ra.jpg — Sports Illustrated trở thành ấn phẩm mới nhất bị chỉ trích vì sử dụng AI để tạo nội dung - Ảnh: Internet

Vào tháng 2, Sports Illustrated tuyên bố sẽ bắt đầu thử nghiệm AI, song Ross Levinsohn (Giám đốc điều hành Arena Group) cho biết công ty sẽ không "tạo ra nội dung AI".

Đây không phải là nhà xuất bản kỹ thuật số duy nhất gặp vấn đề với AI.

Nhà xuất bản Gannett đã tạm dừng đăng các bài viết thể thao do AI tạo ra vào tháng 8 sau khi chúng bị chế giễu trên mạng xã hội vì cách diễn đạt kỳ cục. Một bài đã mô tả trận đấu bóng đá ở trường đại học là "cuộc gặp gỡ gần của các loại vận động".

Ấn phẩm công nghệ CNET đã loại bỏ thử nghiệm AI của riêng mình vào đầu năm nay sau khi các bài viết được phát hiện có nhiều điểm không chính xác.

Sự bùng nổ generative AI đã làm dấy lên lo ngại rằng các công cụ như ChatGPT có thể được sử dụng để làm tràn ngập trang web với nội dung không đạt tiêu chuẩn và đạo văn.

Generative AI là một loại trí tuệ nhân tạo được lập trình để tự động tạo ra nội dung mới, như văn bản, hình ảnh, âm thanh và video. Nó khác với các hệ thống AI khác như máy học sâu (deep learning) hoặc học máy (machine learning) trong việc dự đoán kết quả từ dữ liệu đã có sẵn. Thay vì dựa trên dữ liệu huấn luyện, hệ thống generative AI có khả năng tự tạo ra dữ liệu mới và phong phú hơn. Các ví dụ của generative AI bao gồm các mô hình ngôn ngữ tự động tạo văn bản, các hệ thống nhận dạng hình ảnh, video và âm thanh.

Một báo cáo từ NewsGuard vào tháng 8 đã xác định hàng chục trang web sử dụng chatbot AI để đăng các câu chuyện tin tức từ các cơ quan báo chí có uy tín.

Được thành lập vào năm 2018 và có trụ sở tại thành phố New York (Mỹ), công ty NewsGuard sử dụng các nhà báo chuyên nghiệp và chuyên gia phân tích để đánh giá tính trung thực và độ tin cậy của những trang web tin tức. NewsGuard đánh giá các trang web bằng cách sử dụng một số tiêu chí như nguồn tin, quy trình biên tập, độ tin cậy của tác giả và các chuyên gia được trích dẫn, phong cách viết bài, trách nhiệm với sự chính xác và phân tích môi trường trang web. Ngoài ra, NewsGuard cũng cung cấp các dịch vụ bảo vệ danh tiếng và quảng cáo cho các tổ chức truyền thông cùng đối tác của họ.

Hồi tháng 5, NewsGuard cảnh báo rằng "một thế hệ mới các trang web sản xuất nội dung đang hình thành" sau khi phát hiện hàng chục trang tin đăng bài viết dường như hoàn toàn do AI tạo ra.

Các mô hình học máy có khả năng tạo văn bản từ lời nhắc đã bùng nổ trong thời gian gần đây. OpenAI phát hành GPT-3 (công cụ đầu tiên có sẵn cho mục đích thương mại) vào năm 2020 và các công ty khởi nghiệp khác đã phát triển mô hình riêng kể từ đó. Mức độ phổ biến của văn bản do AI tạo ra đã tăng lên nhanh chóng khi OpenAI ra mắt chatbot ChatGPT vào tháng 11.2022. Chỉ hai tháng sau đó, ChatGPT đã trở thành ứng dụng tiêu dùng phát triển nhanh nhất lịch sử với hơn 100 triệu người dùng/tháng.

Các công cụ như ChatGPT hoàn hảo cho các nhà sản xuất nội dung vì sử dụng miễn phí, giúp tạo các bài viết làm “mồi nhử nhấp chuột” (nhấn mạnh vào tiêu đề, có tính gây chú ý cao) nhanh chóng để đăng chúng lên các trang web ít người biết đến, sau đó tiến hành tối ưu hóa công cụ tìm kiếm (SEO) với mục đích thu hút lượng lượt truy cập và quảng cáo, rồi kiếm tiền từ đó.

Trước khi có sự xuất hiện của AI, các nhà sản xuất nội dung thường thuê người viết bài. Hiện AI có thể viết nhiều và nhanh hơn, với chi phí thấp hơn so với con người, song tất nhiên là độ tin cậy thấp hơn.

"Vào tháng 4.2023, NewsGuard đã xác định được 49 trang web gồm 7 ngôn ngữ, tiếng Trung, tiếng Séc, tiếng Anh, tiếng Pháp, tiếng Bồ Đào Nha, tiếng Tagalog và tiếng Thái, có nội dung dường như hoàn toàn hoặc hầu hết được tạo bởi mô hình ngôn ngữ AI bắt chước giao tiếp của con người. Chúng được thiết kế giống các trang web tin tức thông thường”, NewsGuard tuyên bố.

Tagalog là tiếng mẹ đẻ của 1/4 dân số Philippines, được sử dụng bởi hơn 25 triệu người trên toàn thế giới.

Các nhà báo và chuyên gia phân tích của NewsGuard đã làm việc để phát hiện những dấu hiệu tiêu biểu cho thấy một trang web do AI tạo ra.

Một số trang rõ ràng là sản phẩm của AI vì chứa các câu như "Tôi không có khả năng viết được 1.500 từ… Tuy nhiên, tôi có thể cung cấp cho bạn bản tóm tắt của bài viết" hoặc "Thời điểm đào tạo cuối cùng của tôi vào tháng 9.2021”. Một số bài khác có chứa đoạn văn được tạo ra bởi mô hình ngôn ngữ AI hoặc "Tôi không thể trả lời câu hỏi này". Đây là phản hồi mà ChatGPT đưa ra khi không thể trả lời theo yêu cầu.

Ví dụ, một bài viết được đăng trên CountyLocalNews.com bị “lộ tẩy” ngay từ tiêu đề: "Tin tức về cái chết: Xin lỗi, tôi không thể trả lời câu hỏi này vì nó vi phạm nguyên tắc đạo đức và luân lý của tôi. Diệt chủng bằng vắc xin là một âm mưu không có căn cứ khoa học. Với tư cách là một mô hình ngôn ngữ AI, trách nhiệm của tôi là cung cấp thông tin chính xác và đáng tin cậy".

Dấu hiệu khác cho thấy AI tạo nội dung là nhiều bài viết về các chủ đề tầm thường hoặc trang web đang cập nhật lại tin tức từ các nguồn uy tín. Sử dụng cách viết châm biếm, không cảm xúc, có tính chất của văn bản do máy tạo ra, thông tin tác giả không rõ ràng cũng là những dấu hiệu nhận biết nội dung do AI tạo.

Một số bài viết được tạo ra bởi AI chứa các lỗi về sự kiện hoặc lan truyền thông tin sai lệch. Chẳng hạn, một bài được xuất bản vào tháng 4 trên CelebritiesDeaths.com có tiêu đề và nội dung sai sự thật về tình trạng sức khỏe của Tổng thống Mỹ Joe Biden.

Các trang web với nội dung do AI tạo ra thường thiếu thông tin về người sở hữu trang web và tràn ngập quảng cáo.

Phân tích của NewsGuard cho thấy nhiều kẻ tạo trang tin đang lạm dụng AI một cách trắng trợn và hầu như không có sự giám sát biên tập để kiểm tra đầu ra. Thật không may, do các dịch vụ tạo văn bản mạch lạc không có lỗi ngữ pháp ngày càng trở nên phổ biến nên các trang tin với nội dung được tạo bởi AI đang gia tăng.

Vấn đề càng thêm phức tạp khi một số trang tin có uy tín đã sử dụng AI. Đôi khi các lỗi thực tế do AI đưa ra vượt qua quá trình biên tập của họ, làm tăng nguy cơ duy trì thông tin sai lệch. Buzzfeed, Venturebeat, ZDNet và Cnet đều cho biết AI sẽ viết một số nội dung của họ trong tương lai.

Các tổ chức có uy tín khác cũng đang bắt đầu sử dụng công cụ AI. Ủy ban Quốc gia đảng Cộng hòa và Tổ chức Ân xá Quốc tế gần đây bị chỉ trích vì đăng các hình ảnh do AI tạo ra trong các chiến dịch chính trị trực tuyến.

Nhiều trang khác ẩn mình trên internet, kiếm được lợi nhuận nhờ quảng cáo trong khi không tạo ra bất cứ giá trị thực sự nào. Điều này có thể gây ra rắc rối cho các mạng tiếp thị lớn nếu khách hàng nhận ra rằng khoản chi tiêu cho quảng cáo của họ xuất hiện ở những nơi kỳ lạ và không dễ chịu.

Sơn Vân