AI & Blockchain

ChatGPT Agent và rủi ro khi AI điều khiển máy tính

Bùi Tú • 19/08/2025 19:45

Với các công cụ mới và quyền tự chủ lớn hơn, chatbot AI hàng đầu của OpenAI giờ đây không chỉ mạnh mẽ hơn mà còn tiềm ẩn nhiều rủi ro hơn bao giờ hết.

*Liệu có nên trao quyền quá nhiều cho AI?*

OpenAI đã ra mắt ChatGPT agent, một phiên bản nâng cấp của mô hình trí tuệ nhân tạo (AI) chủ lực, được trang bị một máy tính ảo và bộ công cụ tích hợp.

Những công cụ mới này cho phép agent thực hiện các tác vụ phức tạp, gồm nhiều bước mà các phiên bản ChatGPT trước đây không thể làm được, chẳng hạn như điều khiển máy tính của bạn và hoàn thành công việc thay bạn.

Phiên bản mạnh mẽ này, dù vẫn phụ thuộc nhiều vào sự giám sát của con người, ra mắt ngay sau khi Mark Zuckerberg thông báo rằng các nhà nghiên cứu của Meta đã quan sát thấy các mô hình AI của họ có dấu hiệu tự cải thiện một cách độc lập. Nó cũng ra mắt không lâu trước khi OpenAI giới thiệu GPT-5 - phiên bản mới nhất của chatbot này.

Từ cung cấp thông tin đến hành động thực tế

Đại diện OpenAI cho biết, với ChatGPT agent, người dùng giờ đây không chỉ yêu cầu mô hình ngôn ngữ lớn (LLM) này phân tích hoặc thu thập dữ liệu, mà còn yêu cầu nó hành động dựa trên dữ liệu đó.

Ví dụ, bạn có thể ra lệnh cho agent đánh giá lịch làm việc của mình và tóm tắt các sự kiện, nhắc nhở sắp tới, hoặc nghiên cứu một tập dữ liệu lớn và tóm tắt thành một bản báo cáo ngắn gọn hoặc một bộ slide. Trong khi một LLM truyền thống chỉ có thể tìm kiếm và cung cấp công thức cho một bữa sáng kiểu Nhật, ChatGPT agent có thể lập kế hoạch và mua sắm đầy đủ nguyên liệu cho bữa sáng đó, phục vụ một số lượng khách cụ thể.

Mặc dù rất mạnh mẽ, mô hình mới này vẫn phải đối mặt với một số hạn chế. Giống như tất cả các mô hình AI, khả năng lý luận không gian của nó còn yếu, vì vậy nó gặp khó khăn với các tác vụ như lập kế hoạch lộ trình vật lý. Nó cũng thiếu bộ nhớ liên tục thực sự, chỉ xử lý thông tin trong khoảnh khắc mà không có khả năng ghi nhớ đáng tin cậy hoặc tham chiếu các tương tác trước đó ngoài ngữ cảnh ngay lập tức.

Tuy nhiên, ChatGPT agent cho thấy những cải tiến đáng kể trong các bài kiểm tra của OpenAI. Trên "Kỳ thi cuối cùng của nhân loại" (Humanity’s Last Exam) – một bài kiểm tra AI đánh giá khả năng của mô hình trong việc trả lời các câu hỏi cấp chuyên gia trên nhiều lĩnh vực – nó đã tăng hơn gấp đôi tỷ lệ chính xác (41,6%) so với phiên bản OpenAI o3 không có công cụ (20,3%).

Những rủi ro tiềm ẩn khi AI ngày càng tiến bộ

Bản thân OpenAI cũng đã thừa nhận mối nguy hiểm của agent mới này và quyền tự chủ tăng lên của nó. Đại diện công ty cho biết ChatGPT agent có “khả năng sinh học và hóa học cao”, có thể hỗ trợ việc tạo ra vũ khí hóa học hoặc sinh học.

So với các tài nguyên hiện có, như một phòng thí nghiệm hóa học và sách giáo khoa, một AI agent đại diện cho cái mà các chuyên gia an ninh sinh học gọi là “lộ trình leo thang năng lực”. AI có thể rút ra vô số tài nguyên và tổng hợp dữ liệu trong đó ngay lập tức, kết hợp kiến thức từ các ngành khoa học khác nhau, cung cấp hướng dẫn xử lý sự cố lặp đi lặp lại như một người cố vấn chuyên nghiệp, điều hướng các trang web của nhà cung cấp, điền vào các biểu mẫu đặt hàng và thậm chí giúp vượt qua các kiểm tra xác minh cơ bản.

Với máy tính ảo của mình, agent cũng có thể tương tác tự động với các tệp, trang web và công cụ trực tuyến theo những cách có thể gây ra nhiều thiệt hại tiềm tàng nếu bị lạm dụng. Nguy cơ rò rỉ hoặc thao túng dữ liệu, cũng như các hành vi sai trái như gian lận tài chính, sẽ được khuếch đại trong trường hợp bị tấn công hoặc chiếm quyền kiểm soát.

Kofi Nyarko, một giáo sư tại Đại học Morgan State, đã nhanh chóng nhấn mạnh rằng agent mới này vẫn chưa hoàn toàn tự chủ: "Ảo giác, tính mong manh của giao diện người dùng hoặc hiểu sai có thể dẫn đến lỗi. Các biện pháp bảo vệ tích hợp, như lời nhắc cấp quyền và khả năng gián đoạn, là cần thiết nhưng không đủ để loại bỏ hoàn toàn rủi ro".

Trước những mối đe dọa mới do mô hình có tính tác nhân cao hơn này gây ra, các kỹ sư của OpenAI cũng đã tăng cường một số biện pháp bảo vệ, gồm mô hình hóa mối đe dọa, đào tạo từ chối mục đích kép (dual-use refusal training), chương trình tiền thưởng lỗi và kiểm tra "nhóm đỏ" (red-teaming) tập trung vào an ninh sinh học.

Tuy nhiên, một đánh giá rủi ro được thực hiện vào tháng 7 vừa qua bởi SaferAI (một tổ chức phi lợi nhuận chuyên về an toàn AI) đã xếp hạng các chính sách quản lý rủi ro của OpenAI là "yếu", với điểm số 33% trên thang 100%. OpenAI cũng chỉ đạt điểm C trên Chỉ số An toàn AI do Viện Tương lai Cuộc sống (Future of Life Institute - một công ty hàng đầu về an toàn AI) tổng hợp.