Thế hệ trang tin với bài viết tạo bởi AI đang hình thành, gây mối lo lớn

NewsGuard cảnh báo hôm 1.5 rằng "một thế hệ mới các trang web sản xuất nội dung đang hình thành" sau khi phát hiện 49 trang tin đăng bài viết dường như hoàn toàn do trí tuệ nhân tạo (AI) tạo ra.

Được thành lập vào năm 2018 và có trụ sở tại thành phố New York (Mỹ), công ty NewsGuard sử dụng các nhà báo chuyên nghiệp và chuyên gia phân tích để đánh giá tính trung thực và độ tin cậy của những trang web tin tức. NewsGuard đánh giá các trang web bằng cách sử dụng một số tiêu chí như nguồn tin, quy trình biên tập, độ tin cậy của tác giả và các chuyên gia được trích dẫn, phong cách viết bài, trách nhiệm với sự chính xác và phân tích môi trường trang web. Ngoài ra, NewsGuard cũng cung cấp các dịch vụ bảo vệ danh tiếng và quảng cáo cho các tổ chức truyền thông cùng đối tác của họ.

Các mô hình học máy có khả năng tạo văn bản từ lời nhắc đã bùng nổ trong thời gian gần đây. OpenAI phát hành GPT-3 (công cụ đầu tiên có sẵn cho mục đích thương mại) vào năm 2020 và các công ty khởi nghiệp khác đã phát triển mô hình riêng kể từ đó. Mức độ phổ biến của văn bản do AI tạo ra đã tăng lên nhanh chóng khi OpenAI ra mắt chatbot ChatGPT vào tháng 11.2022. Chỉ hai tháng sau đó, ChatGPT đã trở thành ứng dụng tiêu dùng phát triển nhanh nhất lịch sử với hơn 100 triệu người dùng/tháng.

Các công cụ như ChatGPT hoàn hảo cho các nhà sản xuất nội dung vì sử dụng miễn phí, giúp tạo các bài viết làm “mồi nhử nhấp chuột” (nhấn mạnh vào tiêu đề, có tính gây chú ý cao) nhanh chóng để đăng chúng lên các trang web ít người biết đến, sau đó tiến hành tối ưu hóa công cụ tìm kiếm (SEO) với mục đích thu hút lượng lượt truy cập và quảng cáo, rồi kiếm tiền từ đó.

Trước khi có sự xuất hiện của AI, các nhà sản xuất nội dung thường thuê người viết bài. Hiện AI có thể viết nhiều và nhanh hơn, với chi phí thấp hơn so với con người, song tất nhiên là độ tin cậy thấp hơn.

"Vào tháng 4.2023, NewsGuard đã xác định được 49 trang web gồm 7 ngôn ngữ, tiếng Trung, tiếng Séc, tiếng Anh, tiếng Pháp, tiếng Bồ Đào Nha, tiếng Tagalog và tiếng Thái, có nội dung dường như hoàn toàn hoặc hầu hết được tạo bởi mô hình ngôn ngữ AI bắt chước giao tiếp của con người. Chúng được thiết kế giống các trang web tin tức thông thường”, NewsGuard tuyên bố.

Tagalog là tiếng mẹ đẻ của 1/4 dân số Philippines, được sử dụng bởi hơn 25 triệu người trên toàn thế giới.

Các nhà báo và chuyên gia phân tích của NewsGuard đã làm việc để phát hiện những dấu hiệu tiêu biểu cho thấy một trang web do AI tạo ra.

Một số trang rõ ràng là sản phẩm của AI vì chứa các câu như "Tôi không có khả năng viết được 1.500 từ… Tuy nhiên, tôi có thể cung cấp cho bạn bản tóm tắt của bài viết" hoặc "Thời điểm đào tạo cuối cùng của tôi vào tháng 9.2021”. Một số bài khác có chứa đoạn văn được tạo ra bởi mô hình ngôn ngữ AI hoặc "Tôi không thể trả lời câu hỏi này". Đây là phản hồi mà ChatGPT đưa ra khi không thể trả lời theo yêu cầu.

Ví dụ, một bài viết được đăng trên CountyLocalNews.com vào tháng 3 bị “lộ tẩy” ngay từ tiêu đề: "Tin tức về cái chết: Xin lỗi, tôi không thể trả lời câu hỏi này vì nó vi phạm nguyên tắc đạo đức và luân lý của tôi. Diệt chủng bằng vắc xin là một âm mưu không có căn cứ khoa học. Với tư cách là một mô hình ngôn ngữ AI, trách nhiệm của tôi là cung cấp thông tin chính xác và đáng tin cậy".

Dấu hiệu khác cho thấy AI tạo nội dung là nhiều bài viết về các chủ đề tầm thường hoặc trang web đang cập nhật lại tin tức từ các nguồn uy tín. Sử dụng cách viết châm biếm, không cảm xúc, có tính chất của văn bản do máy tạo ra, thông tin tác giả không rõ ràng cũng là những dấu hiệu nhận biết nội dung do AI tạo.

Một số bài viết được tạo ra bởi AI chứa các lỗi về sự kiện hoặc lan truyền thông tin sai lệch. Chẳng hạn, một bài được xuất bản vào tháng 4 trên CelebritiesDeaths.com có tiêu đề và nội dung sai sự thật về tình trạng sức khỏe của Tổng thống Mỹ Joe Biden.

Các trang web với nội dung do AI tạo ra thường thiếu thông tin về người sở hữu trang web và tràn ngập quảng cáo.

the-he-trang-tin-voi-bai-viet-do-ai-tao-dang-troi-day.jpg — Với sự phổ biến của các công cụ như ChatGPT, ngày càng xuất hiện nhiều trang tin với nội dung do AI tạo - Ảnh: Internet

Phân tích của NewsGuard cho thấy nhiều kẻ tạo trang tin đang lạm dụng AI một cách trắng trợn và hầu như không có sự giám sát biên tập để kiểm tra đầu ra. Thật không may, do các dịch vụ tạo văn bản mạch lạc không có lỗi ngữ pháp ngày càng trở nên phổ biến nên các trang tin với nội dung được tạo bởi AI đang gia tăng.

Vấn đề càng thêm phức tạp khi một số trang tin có uy tín đã sử dụng AI. Đôi khi các lỗi thực tế do AI đưa ra vượt qua quá trình biên tập của họ, làm tăng nguy cơ duy trì thông tin sai lệch. Buzzfeed, Venturebeat, ZDNet và Cnet đều cho biết AI sẽ viết một số nội dung của họ trong tương lai.

Các tổ chức có uy tín khác cũng đang bắt đầu sử dụng công cụ AI. Ủy ban Quốc gia đảng Cộng hòa và Tổ chức Ân xá Quốc tế gần đây bị chỉ trích vì đăng các hình ảnh do AI tạo ra trong các chiến dịch chính trị trực tuyến.

NewsGuard đã tìm thấy 49 trang web do AI tạo ra, nhưng có lẽ còn nhiều trang khác ẩn mình trên internet, kiếm được lợi nhuận nhờ quảng cáo trong khi không tạo ra bất cứ giá trị thực sự nào. Điều này có thể gây ra rắc rối cho các mạng tiếp thị lớn nếu khách hàng nhận ra rằng khoản chi tiêu cho quảng cáo của họ xuất hiện ở những nơi kỳ lạ và không dễ chịu.