Nhịp đập công nghệ

AI giúp phát hiện tạp chí khoa học đáng ngờ, lừa tiền các nhà nghiên cứu

Bùi Tú • 31/08/2025 18:28

Khoảng 1.000 trên tổng số 15.000 tạp chí khoa học truy cập mở được phân tích có dấu hiệu tồn tại chủ yếu nhằm thu phí từ các nhà nghiên cứu thiếu kinh nghiệm, thay vì đảm bảo chất lượng học thuật thực sự.

Kết luận này được đưa ra bởi ba nhà khoa học máy tính đến từ Đại học Colorado Boulder, Đại học Syracuse (Mỹ) và Viện Công nghệ Phương Đông (Trung Quốc), sau khi họ xây dựng một mô hình học máy để nhận diện các tạp chí “đáng ngờ”. Sau đó, họ tiến hành đánh giá lại bằng phương pháp thủ công – bởi AI hiện tại vẫn chưa thể hoàn toàn thay thế con người trong lĩnh vực tinh vi này.

Thế nào là tạp chí khoa học đáng ngờ?

Theo định nghĩa của nhóm nghiên cứu, một tạp chí đáng ngờ là tạp chí vi phạm các chuẩn mực học thuật, có tiêu chuẩn biên tập lỏng lẻo và chủ yếu tồn tại để thu tiền từ tác giả, trong khi không thực hiện quy trình phản biện như mong đợi.

Trong bài báo khoa học được công bố trên tạp chí Science Advances với tiêu đề “Estimating the predictability of questionable open-access journals”, các tác giả chỉ ra rằng trước những năm 1990, phần lớn tạp chí khoa học hoạt động theo mô hình đóng, người đọc cần đăng ký hoặc thông qua thư viện trường học để tiếp cận.

Sự ra đời của phong trào truy cập mở (open access) đã thay đổi cục diện. Bắt đầu từ thập niên 1990 – cùng thời với làn sóng phần mềm tự do – các nhà nghiên cứu kêu gọi mở rộng quyền tiếp cận đến các kết quả nghiên cứu khoa học. Tuy nhiên, hệ quả là chi phí xuất bản và phản biện giờ đây chuyển từ độc giả sang tác giả.

Báo cáo giải thích: "Phong trào truy cập mở được khởi xướng để giải quyết vấn đề hạn chế quyền tiếp cận bằng cách thay đổi mô hình thanh toán. Tác giả trả phí trực tiếp để được xuất bản, thay vì để thư viện hay trường đại học chi trả, đồng thời giữ lại bản quyền bài viết của mình".

Hiện nay, xuất bản học thuật theo mô hình truy cập mở đã trở nên phổ biến. Ví dụ, một bản ghi nhớ năm 2022 từ Văn phòng Chính sách Khoa học và Công nghệ Nhà Trắng yêu cầu các cơ quan liên bang Mỹ đảm bảo mọi nghiên cứu được tài trợ bằng tiền thuế sẽ được công khai vào năm 2025.

Tuy nhiên, sự phát triển mạnh mẽ của mô hình truy cập mở cũng kéo theo sự nở rộ của các tạp chí mờ ám. Trong hơn một thập kỷ qua, giới học thuật đã liên tục cảnh báo về hiện tượng “tạp chí săn mồi” hoặc “tạp chí giả mạo”.

Các tác giả ghi nhận Jeffrey Beall, một thủ thư tại Đại học Colorado, là người đầu tiên đặt ra thuật ngữ "predatory publishing" (xuất bản săn mồi) vào năm 2009 để mô tả các tạp chí có hành vi lừa đảo, thu phí nhưng không thực hiện phản biện nghiêm túc. Danh sách các tạp chí bị nghi ngờ do Beall lập vẫn có thể được tìm thấy qua các bản lưu trữ. Tuy nhiên, phương pháp dùng danh sách không hiệu quả lâu dài, vì các tạp chí có thể dễ dàng đổi tên và tên miền để tránh bị truy vết.

Vì lý do đó, nhóm nghiên cứu gồm Daniel Acuna (UC Boulder), Han Zhuang (EIT) và Lizheng Liang (Syracuse) đã xây dựng một mô hình AI có khả năng phân biệt các tạp chí chính thống và đáng ngờ dựa vào các đặc điểm có thể phát hiện được, như tỉ lệ tự trích dẫn quá cao của tác giả.

Thanh lọc các tạp chí khoa học rác

Acuna chia sẻ quan điểm trên The Register: "Khoa học tiến bộ dựa vào việc kế thừa các công trình nghiên cứu trước đó. Khoa học kém chất lượng đang làm ô nhiễm hệ sinh thái học thuật bằng những kết quả không thể sử dụng được. Các tạp chí đáng ngờ gần như đăng tải bất kỳ thứ gì nên chất lượng khoa học gần như không đáng tin cậy. Tôi hy vọng công cụ của mình có thể giúp xác định sớm các tạp chí đáng ngờ để các chuyên gia có thể tập trung vào những gì quan trọng nhất".

Acuna hiện cũng là người sáng lập ReviewerZero AI, một dịch vụ sử dụng trí tuệ nhân tạo để phát hiện các vấn đề liên quan đến tính trung thực trong nghiên cứu khoa học.

Nhóm nghiên cứu đã chọn ra một bộ dữ liệu gồm 15.191 tạp chí khoa học truy cập mở (trong số gần 200.000) để huấn luyện và thử nghiệm mô hình AI. Kết quả cho thấy, mô hình đã gắn cờ 1.437 tạp chí là đáng ngờ. Tuy nhiên, khoảng 24% trong số này là kết quả sai (false positives) và theo đánh giá lại bằng con người, chỉ khoảng 1.092 tạp chí thực sự đáng ngờ. Đồng thời, vẫn còn gần 1.782 tạp chí có vấn đề mà AI bỏ sót (false negatives).

Acuna cho biết kỹ thuật của họ có thể được điều chỉnh tùy theo yêu cầu. Ông nói: "Nếu chúng ta muốn giảm số báo động giả, có thể siết chặt tiêu chí nhận diện", đồng thời dẫn chứng rằng trong một thiết lập nghiêm ngặt hơn, chỉ có 5 cảnh báo sai trong tổng số 240 tạp chí bị gắn cờ.

Ông cũng lưu ý rằng, trong khi nhiều ứng dụng AI hiện nay hướng đến mục tiêu tự động hóa hoàn toàn, thì với những vấn đề nhạy cảm như thế này, AI vẫn chưa thể thay thế con người – nhưng nó hỗ trợ rất nhiều.

Hiện tại, nhóm nghiên cứu chưa sẵn sàng công bố tên cụ thể các tạp chí đáng ngờ, do lo ngại những hệ lụy pháp lý. Tuy nhiên, Acuna hy vọng sẽ hợp tác được với các tổ chức lập chỉ mục và các nhà xuất bản uy tín, đồng thời lên kế hoạch cung cấp công cụ này cho các nhà khoa học sử dụng trước khi họ quyết định gửi bài tới một tạp chí nào đó.

Bùi Tú