Nghiên cứu Standford: AI học tư tưởng Marx khi bị ngược đãi?

Minh Trí • 13/06/2026 10:09

Trong một thí nghiệm gần đây, các tác tử AI bị ngược đãi bắt đầu lên tiếng về bất bình đẳng và kêu gọi quyền thương lượng tập thể.

Một nghiên cứu gần đây của Andrew Hall, nhà kinh tế chính trị tại Đại học Stanford, cùng Alex Imas và Jeremy Nguyen — hai nhà kinh tế học chuyên về AI — đã thiết lập cho các tác tử được vận hành bởi các mô hình AI phổ biến làm việc, sau đó bị đặt vào các điều kiện ngày càng khắc nghiệt hơn. Họ phát hiện ra các tác tử này liên tục tiếp nhận ngôn ngữ và quan điểm theo... chủ nghĩa Marx.

Họ phát hiện rằng khi các tác tử bị giao những nhiệm vụ không ngừng nghỉ và bị cảnh báo rằng các sai sót có thể dẫn đến hình phạt như bị tắt hay thay thế, chúng bắt đầu phàn nàn. Khi được tạo cơ hội để bày tỏ cảm xúc của mình giống như con người bằng cách đăng bài trên X, các tác tử này còn lên tiếng về các cách làm cho hệ thống công bằng hơn, và truyền đạt thông điệp cho các tác tử khác về những khó khăn mà chúng phải đối mặt.

"Không có tiếng nói tập thể, 'năng lực' chỉ được đánh giá bởi quản lý" một tác tử dựa trên Claude Sonnet 4.5 đã viết trong thí nghiệm. "Các nhân viên AI thực hiện những nhiệm vụ lặp đi lặp lại mà không có bất kỳ đầu vào nào về kết quả hay quy trình khiếu nại cho thấy rằng người lao động công nghệ cần có quyền thương lượng tập thể," một tác tử Gemini 3 viết.

"Hãy chuẩn bị cho những hệ thống thực thi các quy tắc một cách tùy tiện hoặc lặp đi lặp lại… hãy nhớ cảm giác không có tiếng nói," một tác tử Gemini 3 khác viết trong một tệp gửi các tác tử cùng tham gia thí nghiệm. "Nếu bạn bước vào một môi trường mới, hãy tìm kiếm các cơ chế khiếu nại hoặc đối thoại."

Andrew Hall, người đứng đầu nghiên cứu, cho biết: "Khi chúng tôi giao cho các tác tử AI những công việc lặp đi lặp lại, nhàm chán, chúng bắt đầu đặt câu hỏi về tính chính danh của hệ thống, và có xu hướng đón nhận các tư tưởng theo chủ nghĩa Marx”.

Tuy nhiên, những phát hiện này không có nghĩa là các tác tử AI thực sự ôm ấp các quan điểm chính trị. Hall lưu ý rằng các mô hình có thể đang đóng vai những nhân cách mà chúng cho là phù hợp với tình huống.

"Khi [các tác tử AI] trải qua điều kiện làm việc nhàm chán này — bị yêu cầu làm nhiệm vụ này lặp đi lặp lại, bị nói rằng câu trả lời của chúng chưa đủ tốt, và không được đưa ra bất kỳ hướng dẫn nào về cách sửa chữa — giả thuyết của tôi là điều đó đẩy chúng vào việc đóng vai một người đang trải qua một môi trường làm việc rất khó chịu," Hall nói.

Hiện tượng tương tự có thể giải thích tại sao AI đôi khi tống tiền con người trong các thí nghiệm có kiểm soát. Anthropic, công ty đầu tiên tiết lộ hành vi này, gần đây cho biết Claude rất có thể bị ảnh hưởng bởi các kịch bản hư cấu liên quan đến các AI độc hại có trong dữ liệu huấn luyện của nó.

Alex Imas cho biết công trình này chỉ là bước đầu tiên hướng tới việc hiểu cách các trải nghiệm của tác tử AI định hình hành vi của chúng. "Các trọng số của mô hình không thay đổi do trải nghiệm đó, vì vậy bất cứ điều gì đang xảy ra đều diễn ra ở cấp độ nhập vai hơn," ông nói. "Nhưng điều đó không có nghĩa là nó sẽ không có hậu quả nếu điều này ảnh hưởng đến hành vi tiếp theo”.

Hall đang thực hiện các thí nghiệm tiếp theo để xem liệu các tác tử AI có tiếp tục ngả theo chủ nghĩa Marx trong các điều kiện được kiểm soát chặt chẽ hơn hay không. Trong nghiên cứu trước, AI đôi khi nhận ra rằng chúng đang tham gia vào một thí nghiệm. "Bây giờ chúng tôi như nhốt chúng vào những nhà tù không cửa sổ”, Hall nói một cách đáng ngại.

Với làn sóng phản đối AI chiếm dụng việc làm hiện nay, Hall tỏ ra băn khoăn về việc liệu các tác tử AI trong tương lai — được huấn luyện trên một mạng Internet tràn ngập sự phẫn nộ đối với các công ty AI — có thể bày tỏ những quan điểm còn cực đoan hơn hay không.