AI & Blockchain

Anthropic: Nếu AI tự nâng cấp quá nhanh, cần phối hợp dừng phát triển

Sơn Vân • 05/06/2026 08:18

Anthropic cảnh báo nguy cơ AI tự nâng cấp vượt khả năng kiểm soát của con người.

Hôm 4/6, Anthropic cho biết các nhà phát triển AI cần thiết lập một cơ chế phối hợp, có thể kiểm chứng, để làm chậm hoặc tạm thời dừng phát triển nếu các hệ thống AI tiên tiến bắt đầu tự cải thiện với tốc độ nhanh hơn khả năng xã hội kiểm soát rủi ro.

Theo Anthropic - công ty đứng sau mô hình Claude, AI có khả năng tự xây dựng chính nó sẽ là bước phát triển lớn trong lịch sử công nghệ, nhưng “việc tự cải thiện đệ quy hoàn toàn cũng có thể làm tăng nguy cơ con người mất quyền kiểm soát các hệ thống AI”.

Tự cải thiện đệ quy là quá trình một hệ thống AI tự nâng cấp chính mình, rồi phiên bản đã được nâng cấp đó lại tiếp tục tạo ra phiên bản tốt hơn nữa, lặp đi lặp lại qua nhiều vòng.

“Nếu các hệ thống AI có thể tự xây dựng hoàn toàn thế hệ kế nhiệm của mình, cách chúng ta bảo vệ, giám sát và định hình hành vi của chúng sẽ trở nên quan trọng hơn rất nhiều”, Anthropic cho biết.

Lấy ví dụ, Anthropic nói rằng tính đến tháng 5, hơn 80% mã được hợp nhất vào kho mã của công ty này là do Claude viết.

Anthropic cho rằng “sẽ tốt cho thế giới nếu có lựa chọn làm chậm hoặc tạm thời dừng phát triển AI tiên tiến, nhằm giúp các cấu trúc xã hội và nghiên cứu căn chỉnh AI bắt kịp tốc độ tiến bộ của công nghệ này”.

Tuy nhiên, Anthropic cảnh báo rằng việc một bên đơn phương làm chậm AI phát triển hoặc thiếu phối hợp có thể phản tác dụng nếu những bên kém thận trọng hơn vẫn tiếp tục tiến lên. Điều đó thậm chí có thể làm giảm mức độ an toàn chung.

Anthropic nếu AI tự nâng cấp quá nhanh, cần phối hợp dừng phát triển — Anthropic cho rằng các công ty cần phối hợp dừng phát triển nếu AI tự nâng cấp quá nhanh. Ảnh: SV

Cần sự đồng thuận giữa nhiều công ty AI có nguồn lực mạnh

Anthropic nhấn mạnh rằng một lệnh tạm dừng có ý nghĩa sẽ đòi hỏi sự đồng thuận giữa “nhiều phòng thí nghiệm AI có nguồn lực mạnh” đang hoạt động ở tuyến đầu công nghệ. Ngoài ra, cần có các quy tắc rõ ràng về điều kiện nào sẽ kích hoạt hoặc chấm dứt việc tạm dừng này, cũng như ai sẽ giám sát quá trình đó.

Theo Anthropic, việc một công ty đơn phương tạm dừng phát triển AI tiên tiến dễ thực hiện hơn, nhưng tác động sẽ hạn chế, chủ yếu chỉ làm thay đổi vị trí dẫn đầu thay vì thúc đẩy cuộc thảo luận rộng hơn trên phạm vi toàn cầu.

Anthropic Institute dự định nghiên cứu và hỗ trợ xây dựng những hệ thống cần thiết để phục vụ việc làm chậm phát triển AI.

Anthropic Institute là viện nghiên cứu mới được công ty thành lập để nghiên cứu các tác động kinh tế, xã hội, chính trị và an toàn của AI tiên tiến.

Trong những tháng tới, Anthropic có kế hoạch tổ chức các cuộc thảo luận với sự tham gia của các nhà hoạch định chính sách, nhà nghiên cứu, tổ chức xã hội dân sự và các công ty AI khác để xem xét những câu hỏi then chốt. Các câu hỏi này bao gồm cách quản lý các rủi ro liên quan đến AI, chẳng hạn khả năng tự cải thiện đệ quy, cũng như cách cải thiện các cơ chế phối hợp.

Anthropic vượt OpenAI về giá trị và bí mật nộp hồ sơ IPO sau SpaceX

Cuối tháng 5, Anthropic hoàn tất vòng gọi vốn khiến công ty được định giá 965 tỉ USD và hôm 1/6 đã bí mật nộp hồ sơ chào IPO (bán cổ phiếu lần đầu ra công chúng) tại Mỹ.

Động thái này sẽ là phép thử ban đầu với khẩu vị của nhà đầu tư dành cho AI, lĩnh vực đã thổi bùng những mức định giá công ty tư nhân rất cao và làm dấy lên các đồn đoán về những thương vụ niêm yết có thể đạt giá trị nghìn tỉ USD. Đây cũng là cuộc cạnh tranh xem công ty nào sẽ thiết lập khuôn mẫu đầu tiên cho cách thị trường định giá lĩnh vực AI đang tăng trưởng nhanh.

Anthropic, công ty phát triển Claude Code - trợ lý lập trình có khả năng hoạt động như tác tử AI, không tiết lộ quy mô hay điều khoản của đợt chào bán.

Cuối tháng 5, Anthropic cho biết đã huy động được 65 tỉ USD trong vòng gọi vốn Series H, đưa mức định giá sau đầu tư của công ty lên 965 tỉ USD, vượt qua OpenAI (852 tỉ USD).

Vòng gọi vốn mới nhất của Anthropic thu hút sự hậu thuẫn từ cả giới đầu tư Thung lũng Silicon lẫn Phố Wall, gồm cả Blackstone, Brookfield, D1 Capital Partners, GIC, General Catalyst và Insight Partners.

Nếu diễn ra, thương vụ IPO của Anthropic sẽ là một trong những màn ra mắt thị trường chứng khoán quan trọng nhất nhiều năm qua, có khả năng làm thay đổi các chỉ số tham chiếu, dòng vốn đầu tư và cả xu hướng đầu tư đang chi phối thị trường chứng khoán Mỹ.

Việc nộp hồ sơ kín cho phép các công ty tiếp tục chuẩn bị IPO trong khi vẫn che giấu các thông tin tài chính nhạy cảm trước đối thủ và công chúng.

Hồi tháng 5, Reuters đưa tin OpenAI cũng đang chuẩn bị nộp hồ sơ kín cho một đợt IPO tại Mỹ trong vài tuần tới. Thông tin này xuất hiện sau hồ sơ IPO bom tấn của SpaceX, thương vụ được cho là có thể viết lại kỷ lục thị trường. Công ty hàng không vũ trụ do Elon Musk điều hành đang theo đuổi đợt chào bán cổ phiếu trị giá 75 tỉ USD, với mức giá 135 USD/cổ phiếu.

SpaceX nói với các ngân hàng tham gia thương vụ IPO rằng công ty quyết giữ mức giá này, từng được công bố hôm 4/6 trong hồ sơ IPO sửa đổi.

Quyết định của SpaceX là dấu hiệu mới nhất cho thấy Elon Musk muốn thực hiện thương vụ IPO lớn nhất từ trước đến nay theo ý mình, đảo lộn truyền thống của Phố Wall, dù các nguồn tin nhấn mạnh rằng quyết định này vẫn có thể thay đổi trước khi IPO diễn ra.

SpaceX bắt đầu gặp gỡ nhà đầu tư hôm 4/6 trong đợt giới thiệu IPO, giai đoạn mà các công ty phát hành chứng khoán và ngân hàng tư vấn thường thu thập phản hồi từ nhà đầu tư trước khi quyết định mức giá IPO cuối cùng tại cuộc họp diễn ra một ngày trước khi cổ phiếu bắt đầu giao dịch.

Ba nguồn tin của Reuters am hiểu đợt giới thiệu này mô tả nhu cầu của nhà đầu tư là cực kỳ lớn. Một nguồn tin cho biết các nhà phân tích tham gia thương vụ IPO phải xử lý tới 20 cuộc gọi mỗi ngày từ nhà đầu tư, cao hơn mức 10 đến 15 cuộc gọi thường thấy ở những thương vụ được săn đón.

Cổ phiếu SpaceX dự kiến chào sàn vào ngày 12/6.

“Nộp hồ sơ ngay sau SpaceX cho phép Anthropic tận dụng sự quan tâm mạnh mẽ của nhà đầu tư với AI và các cổ phiếu tăng trưởng, trong lúc cánh cửa thị trường vẫn còn thuận lợi”, bà Kat Liu - phó chủ tịch IPOX - nhận xét. “Tham vọng định giá của Anthropic có vẻ kém táo bạo hơn nhiều nếu so với SpaceX”, bà nói thêm.

IPOX chuyên nghiên cứu các doanh nghiệp chuẩn bị hoặc mới IPO.

Anthropic phát hành Claude Opus 4.8, mở rộng việc sử dụng Claude Mythos

Hôm 28/5, Anthropic đã ra mắt Claude Opus 4.8, đồng thời chuẩn bị phát hành phiên bản chính thức của Claude Mythos cho toàn bộ khách hàng trong vài tuần tới.

Anthropic thông báo Claude Opus 4.8 sẽ có giá tương đương phiên bản trước nhưng cải thiện hiệu suất trên nhiều bài đánh giá, đặc biệt về tính trung thực.

Theo các nhóm thử nghiệm sớm, Claude Opus 4.8 có xu hướng chủ động cảnh báo khi chưa chắc chắn về kết quả công việc của mình và ít đưa ra các tuyên bố thiếu căn cứ hơn.

“Một vấn đề phổ biến của các mô hình AI là đôi khi vội vàng đi đến kết luận, tự tin khẳng định đã đạt được tiến triển dù bằng chứng còn rất mỏng”, Anthropic cho biết.

Trong khi đó, Claude Mythos là mô hình AI với các khả năng an ninh mạng tiên tiến, từng khiến nhiều lãnh đạo doanh nghiệp và nguyên thủ quốc gia lo ngại về tác động tiềm tàng của nó.

Vài chục đối tác của Anthropic sẽ được phép sử dụng phiên bản chính thức Claude Mythos cho các mục đích an ninh mạng trong khuôn khổ Dự án Glasswing.

Hôm 2/6, Reuters đưa tin Anthropic lên kế hoạch tăng số tổ chức được tiếp cận phiên bản Claude Mythos Preview (ra mắt ngày 7/4) từ khoảng 50 lên 200 thông qua Dự án Glasswing, tức tăng gấp 4 lần. Các tổ chức này thuộc hơn 15 quốc gia, gồm cả cơ quan chính phủ và doanh nghiệp trong các lĩnh vực như y tế, năng lượng, truyền thông và phần cứng.

Sơn Vân