Kinh tế 4.0

CEO Unitree: Khoảnh khắc ChatGPT của robotics sắp đến

Sơn Vân • 10/08/2025 20:30

AI có thể thúc đẩy những tiến bộ trong trí tuệ hiện thân, cho phép robot tự hành hoạt động trong môi trường xa lạ, theo CEO Unitree Robotics.

Trí tuệ hiện thân (trí tuệ thể hiện) là một khái niệm trong robotics (ngành robot học) và AI (trí tuệ nhân tạo), nhấn mạnh vai trò quan trọng của cơ thể vật lý và sự tương tác với môi trường trong việc hình thành, biểu hiện trí tuệ.

Không giống các quan niệm truyền thống coi trí tuệ chỉ là các quy trình tính toán trừu tượng diễn ra trong "bộ não" (phần mềm hoặc bộ xử lý), trí tuệ hiện thân cho rằng trí thông minh phát sinh từ sự kết nối chặt chẽ giữa:

Cơ thể: Hình dạng, cấu trúc và các thuộc tính vật lý của tác nhân (ví dụ robot); Nhận thức: Khả năng thu nhận thông tin từ môi trường thông qua các cảm biến; Hành động: Khả năng tương tác với môi trường thông qua các cơ cấu chấp hành; Môi trường: Bối cảnh vật lý mà tác nhân tồn tại và tương tác.

Theo quan điểm này, trí tuệ không chỉ nằm ở khả năng xử lý thông tin hay suy luận logic một cách tách biệt, mà còn được định hình và biểu hiện thông qua cách tác nhân vật lý cảm nhận, di chuyển và hành động trong thế giới thực. Cơ thể không chỉ là một phương tiện để thực hiện các lệnh từ "bộ não", mà cũng đóng vai trò tính toán và ảnh hưởng trực tiếp đến hành vi thông minh.

Trong robotics, trí tuệ hiện thân dẫn đến việc thiết kế các robot có khả năng học hỏi và thích ứng thông qua trải nghiệm vật lý, sử dụng đa giác quan và tương tác trực tiếp với môi trường để giải quyết vấn đề và hoàn thành nhiệm vụ; thay vì chỉ dựa vào các mô hình hoặc lập trình được xác định trước.

CEO-Unitree-Khoanh-khac-ChatGPT-cua-robotics-sap-den (1) — *Wang Xingxing chụp ảnh cùng một robot của Unitree Robotics - Ảnh: Handout*

Theo ông Wang Xingxing - nhà sáng lập kiêm Giám đốc điều hành Unitree Robotics, khoảnh khắc ChatGPT của robotics có thể xuất hiện trong vòng 1-2 năm nữa nếu AI đủ mạnh để thúc đẩy chuyển động của robot, trang SCMP đưa tin.

Unitree Robotics hiện là công ty dẫn đầu ngành công nghiệp robot tại Trung Quốc.

Wang Xingxing định nghĩa khoảnh khắc này là lần đầu tiên robot có thể thực hiện nhiệm vụ trong một địa điểm mà nó chưa từng đến trước đó, chẳng hạn dọn dẹp căn phòng hoặc mang chai nước cho đúng người được chỉ định.

“Nếu mọi thứ phát triển nhanh, điều này có thể xảy ra trong 1-2 năm tới, hoặc có thể 2-3 năm”, ông nói tại Hội nghị Robot Thế giới ở Bắc Kinh (thủ đô Trung Quốc) hôm 10.8.

Dù cả phần cứng của robot (như bàn tay linh hoạt) và dữ liệu huấn luyện đã đủ tốt để đạt được thành tựu này, nhưng yếu tố then chốt là “AI cho trí tuệ hiện thân” hiện hoàn toàn chưa đáp ứng được yêu cầu, Wang Xingxing cho hay.

Doanh nhân 35 tuổi tỏ ra nghi ngờ về việc các mô hình thị giác-ngôn ngữ-hành động (VLA) phổ biến, vốn có kiến trúc khá “ngớ ngẩn”, liệu có đủ khả năng đảm nhận nhiệm vụ hay không.

Dù Unitree Robotics cũng sử dụng các mô hình này, cùng với học tăng cường để cải thiện VLA đã huấn luyện sẵn trong các nhiệm vụ thực tế, phương pháp đó đòi hỏi sự tối ưu hóa rất nhiều, theo Wang Xingxing.

Học tăng cường là lĩnh vực trong AI và học máy, trong đó một hệ thống gọi là tác nhân học cách đưa ra quyết định tối ưu bằng cách tương tác với môi trường xung quanh. Quá trình học diễn ra thông qua việc thử nghiệm các hành động khác nhau, nhận về phản hồi từ môi trường dưới dạng phần thưởng và dần dần điều chỉnh chiến lược hành động để tối đa hóa tổng phần thưởng tích lũy theo thời gian.

Một hướng tiếp cận khác, tạo video hoặc mô hình tương tác dựa trên lời nhắc (prompt) văn bản, rồi cho robot làm theo để thực hiện nhiệm vụ, có thể đạt xác suất thành công cao hơn trong việc điều khiển chuyển động robot, Wang Xingxing nhận định.

Ông lấy ví dụ về Genie 3 như một minh chứng cho sự phát triển công nghệ trong lĩnh vực này. Genie 3 là mô hình thế giới đa dụng mà Google DeepMind ra mắt hôm 5.8, có khả năng tạo ra môi trường tương tác 3D theo thời gian thực chỉ bằng mô tả văn bản, gồm cả thông tin về đặc tính vật lý,

Unitree Robotics đang thử nghiệm hướng tiếp cận này, nhưng một vấn đề là các mô hình thế giới đó đòi hỏi số lượng lớn GPU (bộ xử lý đồ họa) và tạo ra chất lượng hình ảnh cao hơn mức cần thiết cho việc huấn luyện robot, Wang Xingxing nói.

Tuy vậy, ông vẫn lạc quan về triển vọng của robotics. Wang Xingxing nhận xét sự xuất hiện của ChatGPT từ OpenAI và DeepSeek đã chứng minh rằng "sự đổi mới AI đi kèm với rất nhiều yếu tố ngẫu nhiên" có thể dẫn đến những tiến bộ nhanh chóng.

Phát triển robot hình người nhờ ChatGPT và Tesla truyền cảm hứng

Được thành lập năm 2016, Unitree Robotics chỉ bắt đầu phát triển robot hình người từ đầu 2023. Wang Xingxing cho biết quyết định này được truyền cảm hứng từ sự phát triển AI nhanh chóng, đặc biệt kể khi ChatGPT gây bão mạng toàn cầu, và từ các đối thủ trong ngành, điển hình là Tesla. Công ty do Elon Musk điều hành dự kiến sản xuất hàng nghìn robot hình người Optimus trong năm 2025.

Trước nhu cầu thị trường mạnh mẽ, mọi hãng sản xuất robot, kể cả các nhà cung cấp linh kiện, đều đạt tăng trưởng doanh thu hàng năm từ 50% đến 100% trong nửa đầu năm 2025, theo ước tính từ Wang Xingxing.

Gần đây, Unitree Robotics đã ký hợp đồng trị giá 46 triệu nhân dân tệ (tương đương 6,4 triệu USD) để cung cấp cho hãng viễn thông nhà nước China Mobile các robot có năng lực tính toán và ngón tay linh hoạt trong vòng hai năm tới.

Unitree Robotics phát triển nhanh chóng nên được nhiều nhà đầu tư để mắt tới. Tháng 7, Unitree Robotics đã nộp tài liệu hướng dẫn cho cơ quan quản lý chứng khoán Trung Quốc - bước tuân thủ quan trọng trước khi chính thức nộp đơn niêm yết. Theo hồ sơ, Unitree Robotics dự kiến hoàn tất tài liệu cần thiết vào tháng 12 tới.

Wang Xingxing tiết lộ quá trình này đang diễn ra “theo đúng quy trình”.

Giữa tháng 3, Unitree Robotics gây chú ý khi công bố robot hình người G1 với biệt danh kung fu bot, có khả năng nhào lộn và thực hiện thành công cú lật ngang đầu tiên trong ngành. Đây là kỳ tích mới của robot đã nổi tiếng vào đầu năm nay vì khả năng đá kung fu.

G1 thể hiện khả năng nhào lộn

Theo Unitree Robotics, cú lật ngang là động tác thậm chí còn khó thực hiện hơn so với lộn ngược đứng, mà phiên bản trước đó của G1 là H1 thực hiện đầu tháng 3.

Cuối tháng 5, Unitree Robotics livestream trận kickboxing đầu tiên giữa các robot hình người. Bốn G1, mỗi robot cao khoảng 132 cm và nặng 35 kg, đã tham gia cuộc tỉ thí này.

CEO-Unitree-Khoanh-khac-ChatGPT-cua-robotics-sap-den (2) — *Robot của Unitree Robotics đấu võ với người tại Hội nghị Robot Thế giới 2025 - Ảnh: Tân Hoa Xã*

Hồi tháng 1, dàn robot H1 của Unitree Robotics đã trở nên nổi tiếng tại Trung Quốc khi trình diễn điệu múa dân gian trong Gala Tết Nguyên Đán - chương trình truyền hình có lượt xem cao nhất nước này với hơn 1 tỉ khán giả.

Unitree Robotics mô tả đó là “màn trình diễn robot hình người AI hoàn toàn tự động, quy mô lớn đầu tiên trong lịch sử – kết hợp hoàn hảo giữa công nghệ và văn hóa truyền thống”.

Dàn robot H1 múa dân gian

Đầu tháng 7 vừa qua, tỷ phú đầu tư mạo hiểm Vinod Khosla cũng dự đoán tương tự Wang Xingxing.

Vinod Khosla (tỷ phú 70 tuổi từng đầu tư vào OpenAI, DoorDash, Block và Impossible Foods) dự đoán rằng những robot không cần lập trình sẵn sẽ xuất hiện vài năm tới.

“Robotics sẽ mất thêm một chút thời gian, nhưng tôi nghĩ nó sẽ có khoảnh khắc ChatGPT trong vòng 2 đến 3 năm tới”, ông nói.

Vinod Khosla cho biết những robot này nhiều khả năng sẽ có hình dáng giống con người và nhu cầu sẽ đủ lớn để kéo giá thành xuống.

“Hầu như ai cũng sẽ sở hữu một robot hình người trong nhà vào những năm 2030. Robot này có thể sẽ bắt đầu với những công việc đơn giản như nấu ăn. Nó có thể thái rau, nấu nướng, rửa chén, nhưng chỉ hoạt động trong phạm vi nhà bếp”, doanh nhân người Mỹ gốc Ấn Độ dự đoán.

Ông ước tính chi phí cho những robot này sẽ vào khoảng 300 đến 400 USD mỗi tháng, một mức giá có thể chấp nhận được với những ai đang thuê người giúp việc.

robotics-se-co-khoanh-khac-chatgpt-trong-2-3-nam-toi1.jpg — *Vinod Khosla: Robotics sẽ có khoảnh khắc ChatGPT trong vòng 2 đến 3 năm tới - Ảnh: Getty Images*

Vinod Khosla nói rằng hiện đã có một số robot tồn tại và những robot do Trung Quốc sản xuất “thật sự rất ấn tượng” nhưng vẫn còn một nhược điểm lớn.

“Chúng không phải là robot dạng học hỏi. Khi bạn thay đổi môi trường, chúng không hoạt động tốt. Nếu bạn dẫn một người vào đây và đề nghị dọn vệ sinh, người đó sẽ biết phải làm gì. Robot cũng cần phải làm được điều này”, ông lý giải.

CEO Nvidia và Amazon cũng đặt cược vào robotics

Nhiều lãnh đạo công nghệ cũng đang đặt cược lớn vào robotics. Jensen Huang (Giám đốc điều hành Nvidia) đã nhiều lần bày tỏ niềm tin vào một tương lai bị chi phối bởi AI vật lý, nơi robot đóng vai trò quan trọng trong cả công nghiệp lẫn đời sống hàng ngày.

“Tôi rất thích ý tưởng rằng mình sẽ có một R2-D2, một C-3PO riêng, R2-D2 sẽ đi theo tôi và với nhiều người trẻ bây giờ, họ sẽ có một R2-D2 đồng hành suốt cuộc đời”, ông nói vào tháng 9.2024.

AI vật lý là một khái niệm rộng, dùng để chỉ sự kết hợp giữa AI với các hệ thống vật lý như robot, máy móc, thiết bị thông minh, xe tự lái, máy bay không người lái, cánh tay máy… Mục tiêu chính của AI vật lý là cho phép các hệ thống không chỉ xử lý thông tin, đưa ra quyết định mà còn tương tác trực tiếp và thực hiện hành động trong thế giới thực.

R2-D2 và C-3PO là hai nhân vật robot nổi tiếng trong loạt phim khoa học viễn tưởng Star Wars (Chiến tranh giữa các vì sao). Chúng là biểu tượng của AI vật lý trong trí tưởng tượng, được yêu thích bởi cả trẻ em lẫn người lớn trên khắp thế giới.

Tại cuộc họp cổ đông thường niên của Nvidia cuối tháng 6, Jensen Huang gọi ngành robot học là cơ hội lớn nhất tiếp theo sau AI với hãng này.

“Chúng tôi đang hướng đến một tương lai có hàng tỉ robot, hàng trăm triệu xe tự lái và hàng trăm nghìn nhà máy tự động hóa có thể đều được vận hành bằng công nghệ của Nvidia”, tỷ phú 62 tuổi người Mỹ gốc Đài Loan tuyên bố.

Jensen Huang nói thêm rằng xe tự lái, mà theo ông sẽ là ứng dụng thương mại đầu tiên của robotics, là một trọng tâm lớn với Nvidia.

Đầu tháng 7, Andy Jassy (Giám đốc điều hành Amazon) cũng nói rằng robotics đại diện cho một lĩnh vực sẽ tăng trưởng về số lượng nhân sự.

“Chúng tôi sẽ tuyển dùng thêm nhiều người làm trong lĩnh vực AI và robotics”, ông nói trong cuộc phỏng vấn với hãng tin CNBC.