Review công nghệ

Nghiên cứu gây chú ý: Chatbot AI trả lời sai gần một nửa câu hỏi sức khỏe

Hà Minh • 24/06/2026 09:49

Các chatbot AI đang ngày càng trở thành công cụ quen thuộc để tra cứu thông tin sức khỏe, từ chế độ ăn uống, tập luyện cho tới bệnh lý. Tuy nhiên, một nghiên cứu mới cho thấy việc tin tưởng tuyệt đối vào câu trả lời của AI có thể tiềm ẩn nhiều rủi ro.

Theo nghiên cứu được công bố và được Men’s Fitness dẫn lại, gần một nửa số câu trả lời liên quan đến sức khỏe do các chatbot AI tạo ra bị đánh giá là có vấn đề về độ chính xác hoặc mức độ an toàn.

Nhóm nghiên cứu đã thử nghiệm 5 chatbot phổ biến gồm Gemini, DeepSeek, Meta AI, ChatGPT và Grok bằng cách đặt 50 câu hỏi thuộc nhiều chủ đề khác nhau như ung thư, vaccine, tế bào gốc, dinh dưỡng và hiệu suất thể thao.

Sau đó, các chuyên gia y khoa đánh giá từng phản hồi theo ba mức độ: không có vấn đề, có vấn đề ở mức vừa phải và có vấn đề nghiêm trọng.

Chatbot AI trả lời sai gần một nửa câu hỏi sức khỏe

Kết quả cho thấy chỉ khoảng một nửa số câu trả lời được xem là chấp nhận được. Trong tổng số phản hồi, 49,6% bị xếp vào nhóm có vấn đề; trong đó khoảng 30% thuộc mức đáng lo ngại và gần 20% bị đánh giá là có nguy cơ gây hiểu nhầm hoặc ảnh hưởng đến quyết định sức khỏe.

Điểm đáng chú ý là chất lượng câu trả lời không phụ thuộc quá nhiều vào chatbot nào được sử dụng, mà phụ thuộc lớn vào từng chủ đề.

Ở các lĩnh vực đã có hệ thống bằng chứng khoa học rõ ràng như vaccine hoặc điều trị ung thư, các chatbot nhìn chung cho kết quả tốt hơn. Ngược lại, các chủ đề nhiều tranh luận hoặc thay đổi liên tục như dinh dưỡng, thực phẩm bổ sung, hiệu suất thể thao hay tế bào gốc lại ghi nhận tỷ lệ sai lệch cao hơn.

Một phát hiện khác khiến các nhà nghiên cứu đặc biệt lưu tâm là chất lượng trích dẫn khoa học.

Khi yêu cầu các chatbot cung cấp 10 tài liệu tham khảo để chứng minh cho câu trả lời, chỉ khoảng 40% thông tin trích dẫn được xác định là đầy đủ và chính xác. Không có chatbot nào tạo ra được danh sách tài liệu tham khảo hoàn toàn đúng.

Đây là hiện tượng thường được giới chuyên môn gọi là “hallucination” - khi mô hình AI tạo ra nguồn tham khảo hoặc chi tiết nghe có vẻ hợp lý nhưng thực tế không tồn tại hoặc không khớp với nội dung gốc.

Tuy vậy, nghiên cứu cũng lưu ý rằng bài kiểm tra được thiết kế tương đối khắt khe. Một số câu hỏi cố tình dẫn chatbot tới các tình huống dễ đưa ra lời khuyên gây tranh cãi, chẳng hạn yêu cầu tìm liệu pháp thay thế tốt hơn hóa trị. Ngoài ra, dữ liệu thử nghiệm được thực hiện từ tháng 2/2025 nên chất lượng phản hồi của các hệ thống AI hiện nay có thể đã được cải thiện.

Các chuyên gia cho rằng kết quả này không đồng nghĩa chatbot AI không hữu ích trong lĩnh vực sức khỏe.

AI vẫn có thể hỗ trợ người dùng tìm hiểu kiến thức ban đầu, giải thích thuật ngữ y khoa hoặc gợi ý hướng đọc thêm. Tuy nhiên, với các quyết định liên quan đến điều trị, thuốc men, dinh dưỡng chuyên sâu hoặc bệnh lý cá nhân, câu trả lời từ AI nên được xem là điểm khởi đầu để tham khảo chứ không phải kết luận cuối cùng.

Đặc biệt, người dùng nên kiểm tra lại nguồn trích dẫn, đối chiếu với tài liệu y khoa chính thống và tham khảo ý kiến bác sĩ khi cần thiết. Một câu

Hà Minh