AI & Blockchain

Trung Quốc giới thiệu mô hình AI 'hiểu thế giới thực', thách thức OpenAI và Meta

Bùi Tú 27/06/2026 11:18

Trong cuộc đua phát triển trí tuệ nhân tạo (AI), các mô hình hiểu thế giới thực được xem là nền tảng quan trọng để đào tạo robot, xe tự hành và xây dựng các hệ thống AI hiện thân

thegioithuc.jpg
Các mô hình AI đang hướng tới việc bước ra thế giới thực nhiều hơn. Ảnh: AI

Mới đây, startup Fysics AI của Trung Quốc đã công bố Fysiverse, một mô hình hiểu thế giới thực dựa trên các định luật vật lí (world model), được kỳ vọng mở ra hướng đi mới, khác biệt với cách tiếp cận của OpenAI, Meta hay World Labs. Động thái này cho thấy cuộc cạnh tranh AI toàn cầu đang mở rộng từ mô hình ngôn ngữ sang những nền tảng có khả năng mô phỏng thế giới thực với độ chính xác ngày càng cao.

Mô hình AI "hiểu thế giới thực" thay vì chỉ học từ dữ liệu

Fysics AI, startup có trụ sở tại Thượng Hải, vừa chính thức giới thiệu Fysiverse, nền tảng mà hãng mô tả là "mô hình thế hệ mới dựa trên các quy luật vật lí của thế giới thực". Theo doanh nghiệp, đây là một "mô hình mới" có thể khắc phục nhiều hạn chế vốn tồn tại ở các world model hiện nay như hiện tượng "ảo giác vật lí" (physical hallucination), lỗi suy luận hay thất bại khi gặp những tình huống bất thường.

Mô hình hiểu thế giới thực dựa trên các định luật vật lí đang trở thành một trong những hướng phát triển quan trọng nhất của AI. Không chỉ phục vụ việc tạo video hay nội dung số, công nghệ này còn đóng vai trò trung tâm trong đào tạo robot hình người, xe tự lái, robot công nghiệp và nhiều hệ thống AI có khả năng hoạt động ngoài đời thực.

Theo Fysics AI, hiện nay lĩnh vực này chủ yếu phát triển theo ba hướng. Thứ nhất là mô hình sinh video từ kho dữ liệu khổng lồ, tiêu biểu là Sora của OpenAI. Các hệ thống này học cách tái tạo chuyển động bằng cách phân tích hàng triệu video và dự đoán diễn biến tiếp theo của cảnh quay.

Hướng thứ hai là để AI tự xây dựng các quy luật của thế giới thông qua quá trình học tự giám sát mà không được lập trình sẵn kiến thức vật lí. Đại diện tiêu biểu là dòng V-JEPA của Meta.

Trong khi đó, hướng thứ ba dựa trên mô hình hóa không gian 3D nhằm tái tạo hình học và động lực học của môi trường. Marble của World Labs, công ty do giáo sư Li Fei-Fei đồng sáng lập là một ví dụ tiêu biểu.

Theo Fysics AI, cả ba cách tiếp cận đều tồn tại điểm yếu. Các mô hình học từ video chỉ nắm bắt được mối tương quan giữa các hiện tượng chứ chưa thực sự hiểu nguyên nhân. Những mô hình học trong "hộp đen" lại khó kiểm chứng tính đúng đắn của quá trình suy luận. Còn mô hình 3D dù có cấu trúc không gian tốt nhưng vẫn chưa mô phỏng đầy đủ các thuộc tính vật liệu, va chạm hay động lực học ngoài thực tế.

Để khắc phục điều này, Fysiverse được xây dựng dựa trên bộ mô phỏng vật lí kết hợp với hệ thống dựng hình video. Thay vì chỉ tạo ra hình ảnh chân thực, nền tảng hướng tới việc tạo nên một "thế giới thực" vận hành theo đúng các định luật vật lí và có thể tính toán, điều khiển cũng như tối ưu hóa.

Quy trình hoạt động của Fysiverse bắt đầu bằng việc tái tạo hình học 3D của cảnh vật, tách riêng các vật thể khỏi bối cảnh, sau đó sử dụng bộ mô phỏng vật lí để tính toán chuyển động, lực tác động và tương tác giữa các vật thể trước khi dựng thành hình ảnh cuối cùng.

Theo Fysics AI, kết quả thu được không chỉ là video chân thực mà còn chứa các thông tin có cấu trúc như hình học, chuyển động, điểm tiếp xúc hay hiện tượng che khuất, những dữ liệu rất quan trọng đối với robot và hệ thống AI trong thế giới thực.

Cuộc đua AI chuyển sang giai đoạn mô phỏng thế giới thực

Để minh họa khả năng của Fysiverse, startup Trung Quốc đã công bố nhiều video thử nghiệm, trong đó có cảnh bốn chiếc tủ lần lượt đổ như hiệu ứng domino hay một chú gấu bông bật nảy lên với quỹ đạo tự nhiên.

Theo doanh nghiệp, khi so sánh với 9 mô hình đối thủ (không nêu tên), Fysiverse tạo ra các chuyển động và tương tác vật lí tự nhiên hơn, đặc biệt trong những tình huống nhiều vật thể va chạm cùng lúc.

Fysics AI được thành lập năm 2024 bởi Trương Lập Hoa (Zhang Lihua), cựu quản lí cấp cao của NVIDIA và là một trong những người đóng góp quan trọng cho PhysX, bộ công cụ mô phỏng vật lí nổi tiếng của Nvidia. Hiện ông đồng thời giữ chức Phó Viện trưởng Viện Robot thông minh và Sản xuất tiên tiến thuộc Fudan University tại Thượng Hải.

Startup này cũng đã nhận được vốn đầu tư từ nhiều quỹ lớn như MPC (đơn vị kế thừa hoạt động của Matrix Partners China) và MetaX, doanh nghiệp thiết kế GPU của Trung Quốc.

Sự xuất hiện của Fysiverse phản ánh xu hướng mới trong cuộc cạnh tranh AI toàn cầu. Sau giai đoạn tập trung vào chatbot và mô hình ngôn ngữ lớn, các công ty công nghệ đang chuyển sang phát triển những mô hình có khả năng mô phỏng thế giới thực với độ chính xác cao hơn.

Đây được xem là nền tảng quan trọng để robot hình người có thể học kỹ năng mới trong môi trường ảo trước khi triển khai ngoài thực tế, giúp giảm đáng kể chi phí huấn luyện và hạn chế rủi ro.

Không chỉ robot, world model còn là công nghệ cốt lõi trong xe tự lái, nhà máy thông minh, robot công nghiệp và nhiều ứng dụng AI vật lí (Physical AI) khác.

Việc một startup Trung Quốc lựa chọn con đường tích hợp trực tiếp các định luật vật lí thay vì chỉ dựa vào dữ liệu cũng cho thấy cách tiếp cận AI đang ngày càng đa dạng. Nếu hướng đi này chứng minh được hiệu quả trong thực tế, Fysiverse có thể trở thành đối trọng đáng chú ý với các nền tảng của OpenAI, Meta hay World Labs trong lĩnh vực mô hình hóa thế giới thực.

Trong bối cảnh Mỹ và Trung Quốc cạnh tranh quyết liệt về AI, sự xuất hiện của những mô hình như Fysiverse cũng cho thấy cuộc đua công nghệ không còn dừng ở việc tạo ra chatbot thông minh hơn, mà đang tiến tới mục tiêu lớn hơn: xây dựng những hệ thống AI có khả năng hiểu, mô phỏng và tương tác với thế giới thực một cách chính xác như con người.

Nổi bật
      Mới nhất
      Trung Quốc giới thiệu mô hình AI 'hiểu thế giới thực', thách thức OpenAI và Meta
      • Mặc định

      POWERED BY ONECMS - A PRODUCT OF NEKO