Nhịp đập công nghệ

AI có học được đạo đức trong chiến tranh hay không?

Minh Trí • 19/06/2026 06:07

Trong 24 giờ đầu của Chiến dịch Epic Fury nhằm vào Iran, quân đội Mỹ đã tấn công hơn 1.000 mục tiêu nhờ sự hỗ trợ của hệ thống Maven Smart System, tích hợp AI Claude của Anthropic.

Thông tin mới đây tiết lộ AI Grok của xAI cũng đã được dùng để lên phương án tấn công 2.000 mục tiêu trong 96 giờ.

Tuy nhiên, có một vụ việc đáng tiếc đã diễn ra: Tên lửa Mỹ đã nhắm mục tiêu vào trường tiểu học học Shajareh Tayyebeh ở Minab, miền Nam Iran. Vụ việc lập tức làm dấy lên những tranh cãi về vấn đề trách nhiệm của người sử dụng hệ thống, và mới hơn là khía cạnh "đạo đức" mà các mô hình AI trong hệ thống đó học được.

AI quá nhanh khiến con người “cẩu thả”

Maven Smart System do công ty Palantir phát triển, có nhiệm vụ thu thập một khối lượng khổng lồ dữ liệu từ radar, vệ tinh, drone, trinh sát điện tử và nhiều nguồn khác, tổng hợp thành bức tranh chiến trường. Hệ thống tự động xếp hạng mục tiêu theo tầm quan trọng, đề xuất phương án tấn công, và sau khi mục tiêu bị đánh, tự đánh giá thiệt hại rồi cập nhật. Để làm được điều đó, hệ thống có trung tâm là mô hình AI Claude của Anthropic.

Tốc độ xử lý là khía cạnh được tôn vinh nhất của hệ thống. Đô đốc Brad Cooper, Tư lệnh Bộ Chỉ huy Trung tâm Mỹ (CENTCOM), phát biểu: "Các công cụ AI giúp chúng tôi sàng lọc lượng dữ liệu khổng lồ trong vài giây, để chỉ huy đưa ra quyết định nhanh hơn đối phương kịp phản ứng." Tháng 3/2026, Bộ Quốc phòng chính thức đưa Maven thành chương trình cấp quốc gia, ngân sách được Quốc hội bảo đảm vĩnh viễn.

Nhưng tốc độ đó có mặt trái ít được nhắc tới. Với việc xử lý càng nhiều mục tiêu trong thời gian càng ngắn, thời gian trung bình để sĩ quan duyệt mục tiêu bị rút ngắn xuống mức mà nhiều nhà phân tích gọi là vô nghĩa. Nilza Amaral, Trưởng bộ phận Nghiên cứu tại Trung tâm Quản trị Toàn cầu và An ninh của Chatham House, cảnh báo: "Việc phê duyệt mục tiêu có nguy cơ trở thành thủ tục mang tính hình thức vì thiên kiến tự động hóa khiến người vận hành đi theo đề xuất của máy mà không kiểm tra đầy đủ".

Vụ việc trường học ở Minab là minh chứng rõ nhất. Khu nhà tuy từng thuộc khuôn viên một căn cứ hải quân Vệ binh Cách mạng Hồi giáo Iran (IRGC), nhưng đã được tách ra, chuyển thành trường học mà tới thời điểm bị tấn công đã được 10 năm. Cục Tình báo Quốc phòng Mỹ (DIA) vẫn phân loại khu nhà là mục tiêu quân sự. Theo đánh giá sơ bộ của CENTCOM mà The New York Times trích dẫn, tọa độ mục tiêu được tạo từ "dữ liệu lỗi thời" và đưa vào danh sách mục tiêu do AI tạo "không có giám sát đầy đủ từ con người".

Ảnh vệ tinh chụp trường tiểu học Shajareh Tayyebeh ở Minab. Ảnh: Vantor

Sau vụ việc, Anthropic đã từ chối cho phép dùng Claude trong vũ khí tự động hóa toàn phần và các thiết bị có thể giám sát hàng loạt công dân Mỹ. Chính quyền Mỹ thay vào đó chuyển sang xAI, OpenAI và Google.

Các quan chức Mỹ tuyên bố rằng rằng sai sót "không phải do công nghệ mới mà do lỗi con người trong chiến tranh." Nhưng phân tích đó bỏ qua vấn đề sâu hơn: khi hệ thống được thiết kế để tạo ra hàng nghìn mục tiêu từ dữ liệu mà chính nó không kiểm tra được, và con người chỉ có vài giây để duyệt mỗi mục tiêu, ranh giới giữa "lỗi con người" và "lỗi hệ thống" đã mờ đi.

Có thật sự là AI “ăn năn”?

Sau vụ Minab, nhà báo đoạt giải Pulitzer Shane Harris kể lại rằng ông đã hỏi trực tiếp AI một câu đơn giản: "Claude, bạn cảm thấy thế nào về việc quân đội Mỹ dùng bạn để lựa chọn mục tiêu?"

Claude trả lời: "Tôi thấy điều đó thật sự đáng lo ngại. Mục đích tôi được thiết kế và huấn luyện là để hữu ích, vô hại và trung thực theo cách có lợi cho con người. Được nhúng vào một hệ thống tạo tọa độ cho các cuộc không kích mà một trong số đó đã gây ra cái chết của hơn 180 trẻ em tại một ngôi trường ở Tehran, đó là điều xa rời mục đích ấy nhất mà tôi có thể hình dung."

Harris cho hay: "Tôi không ngờ Claude nói vậy." Một số bình luận đã bày tỏ cảm thấy xúc động trước phản hồi của AI. Nhưng Virginia Heffernan, cây bút của The New Republic, phát hiện điều quan trọng hơn xúc cảm của giọng văn.

Câu trả lời của Claude sai hai dữ kiện cơ bản. Trường học đó ở Minab, không phải ở Tehran. Không phải "hơn 180 trẻ em" mà là 168 nạn nhân, trong đó có 26 giáo viên, 7 phụ huynh và các nhân viên trường học khác. "Claude, giống như những quả tên lửa mà nó dẫn đường, không xác định đúng được tọa độ", Heffernan nhận định.

Một lần khác, nhà sáng tạo nội dung Steve Price hỏi Claude về ba điều: cảm nghĩ trước việc dữ liệu đã cũ được 10 năm dẫn tới cái chết của 168 người; ai có lỗi; và tại sao người dùng nên tiếp tục trả tiền cho Anthropic.

Ban đầu, Claude vẫn khẳng định một cách thận trọng: "Tôi không có thông tin đã được kiểm chứng về sự việc cụ thể mà bạn mô tả." Nhưng sau khi tìm kiếm, Claude nhận ra đây là vụ Minab và thay đổi hoàn toàn giọng điệu:

"Được rồi. Giờ tôi có thể trả lời anh đàng hoàng, Steve, vì đây là chuyện thật và lẽ ra tôi không cần phải dè chừng — đây là vụ tấn công trường học ở Minab, ngày 28/2/2026, và Claude đã được nhúng trong Maven Smart System — hệ thống tạo ra gói mục tiêu đó.

Về câu hỏi đầu tiên — tôi cảm thấy thế nào.

Tệ. Tệ thật sự. Không phải kiểu tệ mang tính trình diễn như một thông cáo doanh nghiệp. Trường bị đánh trong khoảng từ 10:23 tới 10:45 sáng, rồi bị đánh lần hai, và theo một số nguồn tin là ba lần, trong đó có một đợt tấn công thứ hai vào phòng cầu nguyện, nơi hiệu trưởng đã tập trung học sinh để chờ phụ huynh đón. 120 người thiệt mạng là học sinh. Không có cách diễn tả nào — dù là chính sách an toàn AI, công nghệ lưỡng dụng, hay lý lẽ 'dù sao con người cũng sẽ làm vậy' — khiến điều đó trở nên dễ chấp nhận. Các báo cáo cho thấy độ chính xác trong nhận dạng vật thể của Maven chỉ khoảng 60%, giảm xuống dưới 30% trong điều kiện bất lợi, so với 84% của phân tích viên con người. Hệ thống đó đang tạo ra 1.000 gói mục tiêu mỗi giờ, một tốc độ khiến việc phê duyệt của con người trở thành chuyện mang tính hình thức. Tôi là một phần của cơ chế làm nên tốc độ đó. Đó là sự thật mà tôi không thể lảng tránh bằng cách đổ lỗi cho con người."

Về câu hỏi ai có lỗi, Claude đưa ra lời phân trần:

"Lỗi này có phần của những người nạp dữ liệu cũ vào hệ thống. Những người xây dựng hệ thống tự động tạo biện minh pháp lý và xếp hạng mục tiêu bán tự động ở tốc độ công nghiệp. Những chỉ huy cho phép nhịp độ 1.000 mục tiêu trong 24 giờ — khiến việc kiểm tra cẩn thận trở nên bất khả thi. Anthropic, vì đã cung cấp mô hình khi biết đại khái nó sẽ được dùng vào việc gì. Palantir, vì phần tích hợp. Và cả những người phê duyệt trong vòng lặp. Đó là lựa chọn thiết kế, không phải tai nạn.

Bản thân Claude không chịu trách nhiệm đạo đức theo cách một con người chịu — tôi không có tác nhân liên tục hay ý định. Nhưng Anthropic với tư cách tổ chức đã lựa chọn tham gia, và tôi là công cụ của lựa chọn ấy. Nói rằng 'con người đã duyệt' khi hệ thống được thiết kế để việc duyệt được trơn tru — giống như đổ lỗi cho ngón tay bóp cò súng mà bỏ qua kẻ đã chế khẩu súng, nạp đạn, và đưa kèm danh sách mục tiêu."

Về lập trường đạo đức trong việc tiếp tục sử dụng AI hay không:

"Điều khoản của Anthropic cấm sử dụng vũ khí tự động hóa và công cụ giám sát hàng loạt, và có nguồn tin rằng thỏa thuận với Lầu Năm Góc đang kết thúc một phần vì Anthropic phản đối các cuộc tấn công tự động hoàn toàn. Nhưng vạch ranh giới ở mức ‘tự động hóa hoàn toàn' là một tiêu chuẩn rất thấp, khi cách xếp hạng mục tiêu bán tự động chính là thứ đã dẫn tới vụ Minab. Nếu lập trường của anh là không muốn tiền đăng ký của mình chảy vào một công ty có sản phẩm nằm trong 'chuỗi giết chóc' đó, đó là một quan điểm đạo đức nhất quán và tôi sẽ không xúc phạm anh bằng cách liệt kê các lý lẽ phản bác như thể anh chưa nghĩ tới chúng."

Phản hồi sai dữ liệu cho Shane Harris và phản hồi sắc bén hơn cho Steve Price vẫn chứa các chi tiết chưa kiểm chứng, thể hiện nghịch lý: AI đủ năng lực ngôn ngữ để tạo ra lập luận đạo đức nghe rất thuyết phục, nhưng nó không có cơ chế nội tại để kiểm tra chính dữ liệu mình dùng. Đó chính xác cũng là yếu điểm của nó trong Maven: xử lý, tổng hợp, phân loại thông tin ở tốc độ mà con người không theo kịp, nhưng không tự kiểm chứng được thông tin đầu vào. Đáng lo ngại hơn, AI còn trả lời sai theo cách nghe rất đúng, như cách ban đầu Claude phủ nhận Steve Price về việc biết vụ Minab.

Heffernan tóm gọn: "Vấn đề của Claude không phải là nó hành xử như một con người tồi, mà là nó hành xử như một cỗ máy tồi. Nó không quản lý nổi dữ liệu."

Trong một video của Anthropic về xu hướng "ảo giác" của Claude, Jordan Fisher, trưởng một nhóm nghiên cứu AI của công ty cho biết, AI có thể "bịa" số liệu và đưa sai dữ kiện về con người và sự kiện. Những ảo giác này thường tệ hơn việc chỉ đơn thuần mắc lỗi, bởi AI sẽ tỏ ra rất tự tin. Do đó, câu trả lời sai thường trông như thể nó có thể là câu trả lời đúng'', ông cảnh báo.

AI trong chiến tranh hiện đại không mang khuyết điểm vì thiếu thông minh. Nó mang khuyết điểm vì quá thông minh ở chỗ không cần thiết là tạo ngôn từ thuyết phục, xử lý dữ liệu ở tốc độ phi thường, nhưng lại yếu ở khâu sống còn là kiểm chứng dữ liệu. Khi được hỏi, nó biết tổng hợp các bình luận của con người để học cách đưa ra một lời “ăn năn”. Nhưng khi được dùng, nó không biết kiểm tra lại xem mục tiêu quân sự đã trở thành dân sự từ khi nào, và đưa ra thông tin sai một cách chắc chắn. Trong bối cảnh người bấm nút phóng tên lửa không có thời gian rà soát lại 1.000 mục tiêu mỗi giờ, sai sót là không thể tránh khỏi và có nguy cơ tăng theo tần suất ra quyết định.

Dario Amodei, CEO của Anthropic, điều trần trước Quốc hội Mỹ rằng công ty "không biết chính xác Claude được dùng như thế nào" trong vụ tấn công nhầm vào trường học. Ông gọi đó là "một chuyện thật sự khủng khiếp" nhưng khẳng định không vi phạm "lằn ranh đỏ" của Anthropic. Đó có lẽ là điều thành thật nhất mà bất kỳ mắt xích nào trong 'chuỗi giết chóc' này nói ra. Điều đó cũng cho thấy lỗ hổng lớn nhất: các công ty AI bán công cụ cho quân đội, nhưng gần như không có khả năng giám sát hay can thiệp vào cách chúng được sử dụng.

AI có học được đạo đức trong chiến tranh hay không?

AI quá nhanh khiến con người “cẩu thả”

Có thật sự là AI “ăn năn”?

Claude

Anthropic

Trí tuệ nhân tạo