AI & Blockchain

Anthropic đề xuất kìm hãm AI tự nâng cấp: Bảo vệ lợi thế và chiến lược trước IPO?

Sơn Vân • 06/06/2026 14:31

Khi Anthropic kêu gọi chuẩn bị cơ chế kìm hãm AI tự nâng cấp, một số chuyên gia đặt câu hỏi liệu đây có phải động thái giúp công ti bảo vệ lợi thế của mình hoặc chiến lược trước IPO?

Anthropic vừa đề xuất các nhà phát triển AI cần thiết lập một cơ chế phối hợp, có thể kiểm chứng, để làm chậm hoặc tạm thời dừng phát triển nếu các hệ thống AI tiên tiến bắt đầu tự cải thiện với tốc độ nhanh hơn khả năng xã hội kiểm soát rủi ro.

“Chúng tôi tin rằng sẽ tốt cho thế giới nếu có lựa chọn làm chậm hoặc tạm dừng dừng việc phát triển AI tiên tiến, để các quy định quản lý, thể chế xã hội và nghiên cứu về căn chỉnh AI có đủ thời gian thích ứng với những tiến bộ công nghệ đang diễn ra rất nhanh”, hai lãnh đạo cấp cao của Anthropic viết trong một bài đăng trên blog.

Theo Anthropic - công ti đứng sau mô hình Claude, AI có khả năng tự xây dựng chính nó sẽ là bước phát triển lớn trong lịch sử công nghệ, nhưng “việc tự cải thiện đệ quy hoàn toàn cũng có thể làm tăng nguy cơ con người mất quyền kiểm soát các hệ thống AI”.

Tự cải thiện đệ quy (RSI) là khái niệm mô tả việc một hệ thống AI có thể tự thiết kế, phát triển và cải thiện thế hệ AI tiếp theo với ngày càng ít sự tham gia của con người.

Anthropic cho rằng công nghệ này có thể mang lại nhiều lợi ích tích cực. Tuy nhiên, công ti cũng cảnh báo rằng việc AI tự cải thiện hoàn toàn có thể làm gia tăng nguy cơ con người mất quyền kiểm soát các hệ thống AI.

“Nếu các hệ thống AI có thể tự xây dựng hoàn toàn thế hệ tiếp theo, cách chúng ta bảo vệ, giám sát và định hình hành vi của chúng sẽ trở nên quan trọng hơn rất nhiều”, Anthropic cho biết.

Anthropic muốn có cơ chế giám sát AI tương tự vũ khí hạt nhân

Marina Favaro (người đứng đầu Anthropic Institute) và Jack Clark (đồng sáng lập Anthropic) đề xuất rằng các phòng thí nghiệm AI nên xây dựng một cơ chế hợp tác tương tự cách các quốc gia giám sát việc phổ biến vũ khí hạt nhân. Tuy nhiên, họ cũng nhấn mạnh rằng thế giới không có "hàng thập kỷ" để chờ đợi một thỏa thuận như vậy thành hiện thực.

Đề xuất này ngay lập tức vấp phải nhiều phản ứng trái chiều. Một số người trong giới công nghệ cho rằng đây là nỗ lực phục vụ lợi ích riêng của Anthropic - công ti AI hàng đầu đang trong quá trình chuẩn bị IPO (phát hành cổ phiếu lần đầu ra công chúng).

Người phát ngôn của Anthropic nói với Insider rằng công ti không kêu gọi tạm dừng ngay lập tức. Thay vào đó, Anthropic muốn các đối thủ lớn nhất của mình xây dựng sẵn những cơ chế cho phép có thể tạm dừng khi cần thiết. Theo Anthropic, với tốc độ phát triển AI hiện nay, đây là chủ đề cần được nghiên cứu từ sớm trước khi các biện pháp hạn chế thực sự trở nên cần thiết.

Anthropic kêu gọi kìm hãm AI tự nâng cấp Bảo vệ lợi thế và chiến lược trước IPO1 — Infographic: SV

Dưới đây là phản ứng của một số nhân vật nổi bật trong lĩnh vực AI, công nghệ và chính trị sau đề xuất từ Anthropic.

Mitt Romney - cựu Thượng nghị sĩ Mỹ và ứng viên Tổng thống thuộc đảng Cộng hòa năm 2012

Mitt Romney cho rằng Mỹ nên tập trung vào việc xây dựng các cơ chế bảo vệ trước AI.

“Ưu tiên quốc gia cấp bách nhất của chúng ta phải là các biện pháp bảo vệ AI”, ông viết trên X khi chia sẻ tin tức về cảnh báo của Anthropic.

Cựu ứng viên Tổng thống Mỹ cho rằng các rủi ro từ vũ khí AI, mầm bệnh do AI tạo ra, thất nghiệp quy mô lớn, giám sát xã hội và thậm chí nguy cơ tuyệt chủng của loài người đang bị xem nhẹ một cách đáng lo ngại.

David Sacks - cựu cố vấn AI và tiền mã hóa của Nhà Trắng

David Sacks chỉ trích gay gắt đề xuất của Anthropic.

“Dấu hiệu cho thấy bạn đang muốn phòng thí nghiệm AI tiên tiến của mình bị quốc hữu hóa: So sánh AI với vũ khí hạt nhân; cảnh báo AI sẽ thay thế một nửa lao động văn phòng; nói rằng tự cải thiện đệ quy có thể hủy diệt nhân loại; rồi vẫn tiếp tục lao lên phía trước”, ông viết trên X.

David Sacks không nêu đích danh Anthropic, nhưng từ các phát biểu trước đây và nội dung bài đăng, đối tượng mà ông nhắm đến đã quá rõ ràng.

“Nói cách khác, bạn muốn chính phủ cứu chúng ta khỏi… chính bạn”, ông bình luận mỉa mai Anthropic.

Andrew B. Hall - giáo sư kinh tế chính trị tại Đại học Stanford

Andrew Hall, cố vấn của Forum AI và từng là cố vấn cho Meta, cho biết Demis Hassabis (Giám đốc điều hành Google DeepMind) từng nói rằng ông ủng hộ một lệnh tạm dừng toàn cầu nếu tất cả đơn vị phát triển AI tiên tiến đều tuân thủ.

“Chỉ cách đây không lâu, điều này nghe có vẻ hoàn toàn phi thực tế. Song sau những gì chúng ta chứng kiến từ sắc lệnh hành pháp của chính phủ Mỹ, Dự án Glasswing và đề xuất tăng cường kiểm tra mô hình của OpenAI hôm qua, ý tưởng đó không còn quá xa vời nữa”, Andrew Hall viết.

Tuy nhiên, ông nghi ngờ việc các công ti trên toàn thế giới có thể cùng tuân thủ một lệnh tạm dừng phát triển AI tiên tiến, nhất là các doanh nghiệp Trung Quốc và cộng đồng phát triển mô hình trọng số mở. Theo ông, giải pháp thực tế hơn có thể là hạn chế tốc độ đưa các mô hình AI mới ra thị trường, thay vì ngừng nghiên cứu công nghệ này.

“Đó dường như cũng là điều Demis Hassabis ủng hộ”, Andrew Hall viết.

Dự án Glasswing là sáng kiến của Anthropic được công bố vào tháng 4/2026. Mục tiêu là cho các tổ chức lớn, cơ quan chính phủ và hãng an ninh mạng sử dụng mô hình tiên tiến Claude Mythos để tìm và vá các lỗ hổng bảo mật nghiêm trọng trước khi công nghệ tương tự được phổ biến rộng rãi. Anthropic tuyên bố Claude Mythos đã phát hiện hàng nghìn lỗ hổng bảo mật nghiêm trọng, trong đó có những lỗi tồn tại hàng chục năm mà con người và các công cụ tự động trước đây không phát hiện được.

Forum AI là tổ chức phi lợi nhuận tại Mỹ, quy tụ các công ti AI, học giả và nhà hoạch định chính sách để thảo luận về các vấn đề quản trị và an toàn AI.

Tae Kim - tác giả cuốn sách Con đường Nvidia: Jensen Huang và hành trình xây dựng một gã khổng lồ công nghệ

Nhà báo công nghệ Tae Kim chỉ trích Anthropic đang thổi phồng nỗi sợ hãi không cần thiết về AI. Theo ông, những cảnh báo của Anthropic đang góp phần làm gia tăng tâm lý lo ngại về AI trong bối cảnh thị trường công nghệ vốn đã chịu áp lực từ nguy cơ lãi suất cao và các tranh cãi về triển vọng tăng trưởng của ngành.

"Anthropic, hãy dừng lại", Tae Kim viết trên X.

Kylan Gibbs - Giám đốc điều hành Inworld AI

Kylan Gibbs, cựu nhân viên Google DeepMind, cho rằng Anthropic đang tạo dựng vị thế để có ảnh hưởng lớn hơn với các quy định AI trong tương lai.

Theo ông, khi một công ti liên tục cảnh báo chính phủ về những rủi ro của AI, các nhà quản lý sẽ có xu hướng tìm đến hãng đó trước tiên khi xây dựng chính sách vì xem họ là nguồn tư vấn đáng tin cậy. Điều này có thể giúp Anthropic tác động đến các quy định theo hướng có lợi cho mình, chẳng hạn hạn chế các đối thủ phát triển mô hình AI trọng số mở hoặc siết xuất khẩu GPU (bộ xử lý đồ họa) sang Trung Quốc.

Kylan Gibbs cho rằng đây là hiện tượng từng xuất hiện trong nhiều ngành công nghiệp khác, khi các doanh nghiệp lớn thúc đẩy những quy định mà họ đủ nguồn lực để đáp ứng, trong khi các công ti nhỏ hơn gặp nhiều khó khăn vì thiếu đội ngũ pháp lý và nguồn lực để tuân thủ.

Gary Marcus - nhà nghiên cứu AI và giáo sư danh dự Đại học New York

Gary Marcus kêu gọi mọi người đọc kỹ đề xuất của Anthropic.

Ông cho rằng Anthropic đang muốn hưởng lợi từ cả hai phía. Theo Gary Marcus, Anthropic thực tế không muốn tạm dừng phát triển AI tiên tiến, ít nhất là ở thời điểm hiện nay. Thay vào đó, Anthropic vẫn muốn tiếp tục tăng tốc nhưng đồng thời viện dẫn nguy cơ từ những đối thủ "kém thận trọng hơn" để biện minh cho quan điểm của mình.

Gary Marcus mô tả đề xuất của Anthropic là "thông điệp truyền thông rất hiệu quả nhưng không đi kèm cam kết cụ thể và xuất hiện đúng thời điểm trước IPO". Ông cho rằng Anthropic sẽ không thực sự muốn kích hoạt một lệnh tạm dừng phát triển AI.

"Điều Anthropic muốn là mọi người thảo luận về khả năng tạm dừng, dù bản thân họ không có ý định thực hiện và có lẽ cũng sẽ không bao giờ thực hiện. Nhiều khả năng Anthropic sẽ tiếp tục viện dẫn mối lo từ Trung Quốc như một lý do để đẩy nhanh cuộc đua AI", Gary Marcus bình luận.

Anthropic đề xuất kìm hãm AI tự nâng cấp Bảo vệ lợi thế và chiến lược trước IPO — Từ trái sang phải lần lượt là Luis Garicano, Jack Clark và David Sacks. Ảnh: Getty Images

Luis Garicano - giáo sư tại Trường Kinh tế London và cựu nghị sĩ Nghị viện châu Âu

Luis Garicano cho rằng Anthropic đang tìm cách hạn chế các đối thủ phát triển mô hình AI trọng số mở.

“Mối đe dọa lớn nhất với khả năng sinh lời của các mô hình AI tiên tiến chính là trọng số mở. Nếu họ khiến mọi người sợ hãi đủ mức, bước tiếp theo rất tự nhiên sẽ là cấm các mô hình đó và chỉ cho phép những nhà phát triển đáng tin cậy hoạt động”, ông nhận định.

Francesco Bianchi - giáo sư kinh tế và trưởng khoa tại Đại học Johns Hopkins

Francesco Bianchi cho rằng đề xuất của Anthropic có vẻ phục vụ lợi ích riêng.

Theo ông, những rủi ro mà Anthropic cảnh báo có thể là có thật, nhưng việc một hãng đang nằm trong nhóm dẫn đầu thị trường kêu gọi làm chậm hoặc đóng băng cuộc đua AI cũng mang lại lợi ích đáng kể cho chính họ vì giúp duy trì vị thế hiện tại.

Jen Zhu Scott - Giám đốc điều hành Power Dynamics

Jen Zhu Scott, đối tác sáng lập IN. Capital - quỹ đầu tư về AI và công nghệ chuyên sâu, đưa ra một cách lý giải khác. Bà cho rằng Anthropic đang cần một khoảng thời gian để giảm tốc.

"Anthropic đang dần cạn năng lực tính toán và nguồn điện phục vụ AI", bà viết trên X. Jen Zhu Scott ám chỉ rằng Anthropic đề xuất về khả năng tạm dừng phát triển AI tiên tiến có thể xuất phát từ những hạn chế về hạ tầng hơn là chỉ vì các lo ngại về an toàn công nghệ.

OpenAI khác Anthropic về triết lý quản trị AI

Thêm điểm đáng chú ý là OpenAI có sự khác biệt trong triết lý quản trị AI so với Anthropic.

Anthropic cho rằng các phòng thí nghiệm AI cần chủ động xây dựng cơ chế phối hợp để có thể làm chậm hoặc tạm dừng phát triển khi cần thiết. Trong khi đó, OpenAI gần đây nhấn mạnh rằng: “Chính phủ dân chủ nên là bên thiết lập quy tắc và cơ chế trách nhiệm giải trình, thay vì để các công ti AI tự quyết định việc quản lý hay dừng phát triển công nghệ”.

Vấn đề lớn nhất: Ai sẽ giám sát?

Câu hỏi lớn nhất với đề xuất của Anthropic là ai sẽ chịu trách nhiệm giám sát và thực thi một cơ chế tạm dừng phát triển AI tự nâng cấp trên phạm vi toàn cầu. Ngay cả những người ủng hộ ý tưởng này cũng thừa nhận đây là thách thức khó giải quyết nhất.

Một cơ chế như vậy sẽ phải xác định rõ những điều kiện nào đủ để kích hoạt việc tạm dừng, ai là người có thẩm quyền đánh giá một hệ thống AI đã vượt ngưỡng rủi ro hay chưa, cũng như cách kiểm tra các công ti có thực sự tuân thủ không.

Ngoài ra, còn nhiều câu hỏi phức tạp khác như liệu các công ti Trung Quốc có tham gia cơ chế này hay không, những dự án AI phục vụ mục đích quân sự có bị giám sát hay không, và khi nào việc phát triển AI được phép tiếp tục trở lại.

Theo một số nhà nghiên cứu về quản trị AI, nếu muốn xây dựng một cơ chế giám sát đáng tin cậy, thế giới có thể phải theo dõi năng lực tính toán AI ở cấp quốc gia, gồm việc sử dụng chip AI, quy mô huấn luyện mô hình và lượng tài nguyên tính toán được triển khai.

Cách tiếp cận này có nhiều điểm tương đồng với cơ chế kiểm soát vũ khí hạt nhân hoặc giám sát sự phổ biến của những công nghệ chiến lược.

Sơn Vân