OpenAI tuyển chuyên gia lương 11,7 tỉ đồng, đối phó kịch bản AI tự nâng cấp
OpenAI đặt mục tiêu tạo ra công cụ AI có thể tự nghiên cứu cách nâng cấp chính mình. Giờ đây, công ty chuẩn bị cho những rủi ro có thể phát sinh từ công nghệ này.
Khả năng hệ thống AI đạt tới cái gọi là “tự cải thiện đệ quy” đã trở thành vấn đề nổi bật với các lãnh đạo ngành AI, sau khi công cụ lập trình của OpenAI và Anthropic tiến bộ mạnh mẽ trong 6 tháng qua.
Tự cải thiện đệ quy là quá trình một hệ thống AI tự nâng cấp chính mình, rồi phiên bản đã được nâng cấp đó lại tiếp tục tạo ra phiên bản tốt hơn nữa, lặp đi lặp lại qua nhiều vòng.
Tại hội nghị I/O 2026, ông Demis Hassabis - Giám đốc điều hành Google DeepMind - nói rằng nhân loại hiện đã đứng ở “ngưỡng cửa của điểm kỳ dị”, tức thời khắc AI bắt đầu tự cải thiện và vượt trí tuệ con người.
Đặt mục tiêu IPO (phát hành cổ phiếu lần đầu ra công chúng) trong năm nay, OpenAI gần đây đăng tin tuyển dụng một nhà nghiên cứu để xử lý câu hỏi: điều gì sẽ xảy ra khi AI có thể huấn luyện các phiên bản tốt hơn của chính mình?
Theo các trang tổng hợp việc làm, OpenAI đã đăng tin tuyển dụng cho nhóm an toàn của Preparedness (chuẩn bị ứng phó rủi ro AI) trong tháng này. OpenAI đưa ra mức lương hấp dẫn từ 295.000 đến 445.000 USD/năm (hơn 7,7 tỉ đồng đến hơn 11,7 tỉ đồng/năm), nhằm tìm kiếm những ứng viên có năng lực kỹ thuật vững chắc để chuẩn bị cho kịch bản AI có thể tự cải thiện chính mình qua nhiều vòng liên tiếp.
“Công việc này dựa trên việc suy luận về những vấn đề có thể xuất hiện trong tương lai, nhưng hiện chưa tồn tại. Vì vậy, những người đảm nhận vai trò này đặc biệt cần có khả năng phán đoán tốt và tầm nhìn chiến lược”, theo tin tuyển dụng.

Các công ty hàng đầu chạy đua xây dựng mô hình AI có thể tự huấn luyện
Các mô hình AI từ OpenAI và Anthropic đã cải thiện với tốc độ chóng mặt, xét theo độ phức tạp của các vấn đề mà chúng có thể xử lý. Những nhà nghiên cứu tại METR, phòng thí nghiệm chuyên nghiên cứu năng lực mô hình AI, viết hồi tháng 3 rằng độ dài của một nhiệm vụ mà các mô hình tiên tiến có thể hoàn thành đã tăng gấp đôi khoảng 7 tháng một lần. Điều này có nghĩa là các mô hình AI ngày càng có thể thực hiện nhanh những công việc mà con người mất rất nhiều thời gian.
Theo METR, hệ quả là các tác tử AI sẽ có thể xử lý một phần lớn công việc liên quan phần mềm mà lập trình viên phải mất nhiều ngày hoặc nhiều tuần mới hoàn thành.
Tác tử AI là hệ thống AI được thiết kế để tự mình quan sát môi trường, đưa ra quyết định và thực hiện hành động nhằm đạt được một mục tiêu cụ thể mà không cần con người điều khiển liên tục.
OpenAI đang tích cực theo đuổi tầm nhìn này. Việc bán tác tử AI lập trình Codex cho doanh nghiệp tạo ra nguồn thu rất lớn cho OpenAI. Công ty cũng hy vọng tự động hóa chính công việc nghiên cứu của mình. Giám đốc điều hành Sam Altman tiết lộ OpenAI đã đặt mục tiêu vận hành “thực tập sinh nghiên cứu AI tự động” trên hàng trăm nghìn chip vào tháng 9/2026 và “nhà nghiên cứu AI tự động thực thụ” hồi tháng 3/2028.
Sam Altman viết trên mạng xã hội X: “Chúng tôi có thể hoàn toàn thất bại với mục tiêu này, nhưng do các tác động tiềm tàng là rất lớn, OpenAI cho rằng minh bạch về điều đó là vì lợi ích công chúng”.
Hồi tháng 4, Anthropic công bố nghiên cứu về việc dùng các mô hình AI để giám sát những mô hình mạnh hơn, với kết quả hứa hẹn nhưng vẫn còn hạn chế.
Tháng 5, ông Jack Clark - đồng sáng lập kiêm người đứng đầu chính sách của Anthropic - cho rằng có khoảng 60% khả năng hoạt động nghiên cứu và phát triển AI không cần sự tham gia của con người sẽ xuất hiện vào cuối năm 2028.
OpenAI đối phó kịch bản AI tự nâng cấp
Nếu AI có thể tự huấn luyện chính mình, người ta lo ngại sẽ xuất hiện một kịch bản kiểu phim khoa học viễn tưởng: AI phát triển năng lực quá nhanh, vượt khỏi sự kiểm soát của con người và gây ra hậu quả nghiêm trọng trên diện rộng. Đây là một trong những nỗi lo lớn của giới nghiên cứu an toàn AI.
Hôm 22/5, bà Elizabeth Barnes - Giám đốc điều hành METR - cho rằng bất kỳ “nền văn minh hợp lý” nào cũng sẽ phát triển AI chậm hơn và thận trọng hơn nhiều so với hiện nay.
Thông báo tuyển dụng của OpenAI hé lộ cách công ty đang chuẩn bị cho một thế giới nơi các mô hình AI có thể nhanh chóng tự cải thiện. OpenAI muốn tìm nhà nghiên cứu có thể tập trung vào việc bảo vệ các mô hình AI của OpenAI khỏi các cuộc tấn công đầu độc dữ liệu, tức nỗ lực làm hỏng mô hình AI thông qua bộ dữ liệu dùng để huấn luyện nó.
Người được tuyển cũng có thể phát triển các công cụ để phân tích cách AI suy luận, hoặc thử nghiệm trực tiếp với các mô hình nhằm đánh giá mức độ an toàn cũng như các nguy cơ tiềm ẩn của chúng.
Ngoài ra, OpenAI cho biết vị trí này còn có nhiệm vụ theo dõi quá trình tự động hóa công việc kỹ thuật, chẳng hạn đo lường mức độ sử dụng các công cụ lập trình AI trong nội bộ.
Nhóm Preparedness của OpenAI được thành lập để ngăn chặn những rủi ro nghiêm trọng mà AI có thể gây ra. Trang tuyển dụng của công ty cho thấy nhóm này còn tuyển nhiều vị trí khác, gồm tự động hóa hoạt động kiểm thử đối kháng để kiểm tra các rủi ro về an ninh mạng, sinh học, hóa học và mối đe dọa từ agentic AI (AI có tính tự chủ).
“Đây là công việc cấp bách, nhịp độ nhanh và có tác động sâu rộng với công ty cũng như xã hội”, theo các tin tuyển dụng của Preparedness.