Cuộc sống số

Những điều ít bên trong OpenAI và Meta Superintelligence Labs

Sơn Vân • 11/03/2026 17:45

Prakhar Agarwal, nhà nghiên cứu ứng dụng tại Meta Superintelligence Labs và cựu nhân viên OpenAI, vừa chia sẻ bí mật về môi trường làm việc bên trong các phòng thí nghiệm AI hàng đầu thế giới.

Theo anh, công việc tại Meta Superintelligence Labs và OpenAI có nhịp độ rất nhanh, ít cấu trúc cố định, đòi hỏi các nhà nghiên cứu phải liên tục thích nghi với những vấn đề hoàn toàn mới.

Prakhar Agarwal sinh ra tại Ấn Độ và theo học ngành kỹ thuật ở Viện Công nghệ và Khoa học Birla, một trong những trường kỹ thuật hàng đầu của nước này. Sau đó, anh tiếp tục học cao học tại Đại học Washington (Mỹ), tập trung vào lĩnh vực học máy.

Prakhar Agarwal từng là kỹ sư học máy tại Apple từ 2020 đến tháng 1.2025. Sau đó, anh gia nhập OpenAI và làm trong nhóm API (giao diện lập trình ứng dụng) được khoảng 6 tháng trước khi chuyển sang Meta Superintelligence Labs từ tháng 7.2025. Tại Meta, Prakhar Agarwal tập trung vào việc cải thiện và huấn luyện hậu kỳ cho các mô hình ngôn ngữ lớn.

Meta Superintelligence là đơn vị nghiên cứu AI (trí tuệ nhân tạo) của Meta, được thành lập vào tháng 6.2025 với mục tiêu phát triển các hệ thống AI cực kỳ tiên tiến, hướng tới siêu AI. Đây là phòng thí nghiệm AI cao cấp nhất của công ty mẹ Facebook, tập trung các nhà nghiên cứu hàng đầu để phát triển thế hệ AI mới có khả năng suy luận và xử lý thông tin vượt xa các hệ thống hiện tại.

Prakhar Agarwal vừa chia sẻ với trang Insider về những điều ít bên trong Meta Superintelligence Labs và OpenAI.

Những cột mốc lớn

Prakhar Agarwal cho biết công việc hằng ngày của anh thay đổi đáng kể tùy theo giai đoạn trong dự án. Các phòng thí nghiệm AI như Meta hay OpenAI thường đặt ra những cột mốc lớn, chẳng hạn một đợt huấn luyện mô hình AI hoặc thử nghiệm học tăng cường quy mô lớn sau khoảng 10 tháng. Khi thời hạn này đến gần, cường độ làm việc tăng mạnh vì mọi nhóm đều phải hoàn thiện các cải tiến trước khi mô hình bước sang phiên bản tiếp theo.

Học tăng cường là phương pháp trong lĩnh vực AI, trong đó mô hình học cách đưa ra quyết định thông qua quá trình thử – sai và nhận phần thưởng hoặc hình phạt.

Nói đơn giản, học tăng cường hoạt động giống cách con người hoặc động vật học hỏi từ trải nghiệm. Một mô hình AI sẽ tương tác với môi trường, thực hiện các hành động và nhận phản hồi. Nếu hành động đó dẫn đến kết quả tốt, mô hình AI nhận “phần thưởng”. Nếu có kết quả xấu, nó nhận “hình phạt”. Qua nhiều lần thử nghiệm, mô hình AI dần học được chiến lược tối ưu để đạt phần thưởng cao nhất.

Phần lớn công việc của các nhà nghiên cứu xoay quanh việc phân tích phiên bản mô hình AI hiện tại. Nếu phát hiện mô hình AI chưa làm tốt một nhiệm vụ cụ thể, họ sẽ tìm cách khắc phục ngay trên phiên bản đó. Tuy nhiên, nếu không kịp hoàn thành trước hạn chót, chưa ai biết phiên bản mô hình AI tiếp theo có còn gặp vấn đề tương tự hay không. Chính điều này khiến nhịp độ nghiên cứu luôn gấp gáp.

Khi còn cách xa các mốc quan trọng, các nhà nghiên cứu dành nhiều thời gian cho việc đánh giá mô hình AI, tìm các trường hợp thất bại và phát hiện những điểm yếu trong hệ thống. Prakhar Agarwal cho biết công việc này rất khó đoán trước. Có những vấn đề tưởng chừng đơn giản có thể giải quyết trong một ngày, nhưng cũng có lúc một nhiệm vụ nhỏ lại kéo dài cả tuần vì xuất hiện quá nhiều yếu tố chưa biết đến.

Theo Prakhar Agarwal, môi trường tại các phòng thí nghiệm AI tiên phong rất khác so với những tập đoàn công nghệ lớn truyền thống. Điểm hạn chế lớn nhất ở đây không phải là nhân lực mà là năng lực tính toán. Không giống nhiều hãng công nghệ có thể tuyển thêm người để chia nhỏ công việc, trong các phòng thí nghiệm AI tiên phong, mọi nhà nghiên cứu đều cần tài nguyên tính toán để thử nghiệm mô hình. Nếu số người tăng quá nhiều, tài nguyên tính toán này sẽ bị chia nhỏ và làm giảm hiệu quả công việc.

Chính vì vậy, các nhóm nghiên cứu thường có quy mô nhỏ và gắn kết chặt chẽ. Prakhar Agarwal cho biết các phòng thí nghiệm AI như Meta hay OpenAI có nhiều nhân sự cấp cao nhưng ít nhân viên cấp thấp, khiến mỗi người phải chịu trách nhiệm cho phạm vi dự án khá rộng.

Khái niệm “đội nhóm” cũng khá linh hoạt: Mỗi người có dự án riêng nhưng vẫn thường xuyên hợp tác với nhiều đồng nghiệp khác, đôi khi là những người ngoài nhóm chính của mình. Phạm vi công việc của họ không bị giới hạn bởi một nhóm cố định mà được xác định bởi vấn đề cần giải quyết.

Trong môi trường này, giao tiếp được xem là kỹ năng quan trọng nhất. Do nhiều quy trình và kết quả nghiên cứu chưa được ghi chép đầy đủ, các nhà nghiên cứu phải có khả năng giải thích rõ ràng họ đang làm gì, tại sao làm như vậy và bước tiếp theo sẽ là gì. Họ cũng phải thường xuyên chia sẻ kết quả để nhận phản hồi từ đồng nghiệp.

Bên cạnh đó, khả năng đọc và hiểu mã nguồn sâu cũng là kỹ năng thiết yếu. Prakhar Agarwal cho biết tốc độ thay đổi của mã trong các phòng thí nghiệm AI thường nhanh hơn rất nhiều so với tài liệu kỹ thuật. Vì vậy, khi gặp vấn đề, cách tốt nhất là trực tiếp đọc mã để tự tìm hiểu cơ chế hoạt động của hệ thống.

Tích lũy kiến thức từ những thử nghiệm thất bại

Một yếu tố khác giúp các phòng thí nghiệm AI hàng đầu duy trì lợi thế là lượng kiến thức tích lũy được từ những thử nghiệm thất bại. Theo Prakhar Agarwal, các bài báo khoa học thường chỉ trình bày những phương pháp thành công, nhưng trước đó các nhà nghiên cứu có thể đã thử hàng chục cách khác nhau không hiệu quả.

Những kinh nghiệm này hiếm khi được công bố nhưng lại rất có giá trị, giúp các nhóm nghiên cứu nhanh chóng loại bỏ những hướng đi kém khả thi.

Nhờ quá trình thử nghiệm liên tục, các nhóm trong phòng thí nghiệm dần xây dựng được trực giác mạnh về việc điều gì có thể mở rộng quy mô và điều gì sẽ thất bại. Trong khi người ngoài thường chỉ nhìn vào các bước tiến thành công, các nhà nghiên cứu hiểu rằng ngay cả những lần thử nghiệm không thành công cũng đóng vai trò quan trọng trong tiến trình phát triển công nghệ.

Không có cách rõ ràng để tránh kiệt sức

Khi được hỏi về lời khuyên dành cho những người muốn làm việc tại các phòng thí nghiệm AI hàng đầu, Prakhar Agarwal nói không có cách rõ ràng để tránh kiệt sức. Theo anh, những người làm việc ở tuyến đầu công nghệ thường phải chấp nhận nhịp độ công việc rất cao và không thể suy nghĩ quá cứng nhắc theo lịch làm việc từng ngày.

Prakhar Agarwal nói điều quan trọng hơn là sẵn sàng khám phá những lĩnh vực hoàn toàn mới. Nhiều người có xu hướng chỉ tập trung vào thế mạnh quen thuộc của mình, nhưng trong lĩnh vực AI, tốc độ thay đổi quá nhanh khiến các nhà nghiên cứu phải liên tục chuyển sang những chủ đề khác nhau.

Vì vậy, anh cho rằng kỹ năng quan trọng nhất là khả năng thích nghi khi phải chuyển vào một vấn đề hoàn toàn mới. Trong nhiều trường hợp, rào cản lớn nhất không phải là kỹ thuật mà là tâm lý sẵn sàng bước ra khỏi vùng an toàn.

Sơn Vân