Mặc chiếc áo khoác da đen đặc trưng, Jensen Huang dang rộng cả hai cánh tay, chỉ về phía những robot hình người đứng cạnh mình trong tiếng vỗ tay của khán giả. "Kích cỡ khoảng bằng tôi", Giám đốc điều hành Nvidia nói đùa trên sân khấu tại triển lãm công nghệ Computex 2024 ở Đài Loan hồi tháng 6.
"Robot ở đây. Trí tuệ nhân tạo (AI) vật lý ở đây. Đây không phải là khoa học viễn tưởng", tỷ phú 61 tuổi người Mỹ gốc Đài Loan nói. Tuy nhiên, những robot này chỉ hình ảnh mô phỏng, được tạo ra trên màn hình lớn. Những gì xuất hiện trên sân khấu là những cỗ máy có bánh xe giống robot giao hàng.
Robot đóng vai trò quan trọng trong tầm nhìn về tương lai của Jensen Huang, giống một số nhân vật công nghệ nổi tiếng khác, gồm cả Elon Musk. Ngoài màn trình diễn tại Computex, robot hình người đã được đề cập trong hai buổi báo cáo kết quả kinh doanh quý gần nhất của Nvidia.
Hầu hết nhà phân tích đều đồng ý rằng tương lai của Nvidia sẽ được quyết định trong vài năm nữa. Nhu cầu về các GPU (bộ xử lý đồ họa) đã giúp công ty đạt vốn hóa thị trường hơn 3.000 tỉ USD. Song, ngành công nghiệp bán dẫn rất tàn khốc. Việc đầu tư vào các trung tâm dữ liệu, chiếm 87% doanh thu của Nvidia, thường trải qua các chu kỳ bùng nổ và suy thoái. Nvidia cần một thị trường lớn khác.
Tại Computex 2024, Jensen Huang cho biết Nvidia sẽ có hai sản phẩm robot "được sản xuất hàng loạt" trong tương lai. Đầu tiên là ô tô tự lái và thứ hai có thể là robot hình người. Nhờ vào học máy, các công nghệ này đang hội tụ.
Cả hai sản phẩm này đều cần nhận thức giống con người về môi trường xung quanh thay đổi nhanh chóng và phản ứng tức thì với ít chỗ cho sai sót. Chúng cũng đòi hỏi lượng lớn sức mạnh tính toán AI lớn mà Nvidia cung cấp. Thế nhưng, robot chỉ chiếm một phần nhỏ trong doanh thu của Nvidia hiện nay. Việc mở rộng lĩnh vực này không chỉ là vấn đề thời gian.
Nếu Nvidia muốn duy trì vị trí hàng đầu trong ngành công nghệ, Jensen Huang cần thị trường robot trở nên lớn mạnh. Dù câu chuyện về những năm gần đây của Nvidia là minh chứng cho khả năng kỹ thuật, tầm nhìn và thời điểm hoàn hảo, thách thức trong việc biến robot thành sản phẩm gây sốt có thể khó khăn hơn.
Nvidia có thể đưa robot vào thực tế như thế nào?
AI mở ra một tiềm năng to lớn cho ngành robot. Song để lĩnh vực này phát triển trên quy mô lớn, cần giảm bớt độ phức tạp và chi phí, giúp nhiều người hơn có thể tham gia vào việc phát triển và ứng dụng công nghệ robot.
"AI dành cho robot là phức tạp nhất vì mô hình ngôn ngữ lớn là phần mềm, nhưng robot là vấn đề của kỹ thuật cơ khí, phần mềm và cả vật lý. Nó phức tạp hơn rất nhiều", Raul Martynek, Giám đốc điều hành công ty quản lý trung tâm dữ liệu DataBank, nhận xét.
Hầu hết những người làm việc về robot đều là chuyên gia có bằng tiến sĩ về robot vì yêu cầu kiến thức chuyên sâu. Điều tương tự cũng đúng với AI dựa trên ngôn ngữ cách đây 10 năm. Bây giờ, khi các mô hình nền tảng và máy tính hỗ trợ chúng đã có sẵn rộng rãi, không cần phải có bằng tiến sĩ để xây dựng các ứng dụng AI.
Các công cụ và tài nguyên như phần mềm, thư viện dữ liệu giúp việc sử dụng và phát triển AI trở nên dễ dàng hơn, không cần phải có chuyên môn cao.
Nvidia cần phát triển các công cụ và nền tảng để đơn giản hóa việc chế tạo robot, tương tự cách AI được đơn giản hóa trong các lĩnh vực khác. Tuy nhiên, vì AI liên quan đến robot phải xử lý các môi trường vật lý phức tạp, việc làm cho các công cụ này dễ tiếp cận với người dùng phổ thông trở nên thách thức hơn.
Bộ công cụ robot của Nvidia khá phức tạp và khó hiểu. Nó giống như đại dương rộng lớn với nhiều nền tảng, thư viện và thuật ngữ khác nhau.
Omniverse là nền tảng mô phỏng, cung cấp thế giới ảo mà các nhà phát triển có thể tùy chỉnh và sử dụng để thử nghiệm mô phỏng robot. Isaac là thứ mà Nvidia gọi là "phòng tập thể dục" được xây dựng trên Omniverse, cho bạn đưa robot của mình vào môi trường và thực hành các nhiệm vụ.
Jetson Thor là chip của Nvidia để cung cấp năng lượng cho robot. Dự án Groot của Nvidia là mô hình nền tảng cho robot hình người. Vào tháng 7, Nvidia đã ra mắt dịch vụ tạo dữ liệu tổng hợp và Osmo, lớp phần mềm liên kết tất cả lại với nhau.
Jensen Huang thường nói rằng robot hình người dễ chế tạo hơn vì thế giới đã được tạo ra cho con người.
"Robot dễ thích nghi nhất trên thế giới là robot hình người vì chúng ta xây dựng thế giới cho mình. Có nhiều dữ liệu hơn để đào tạo những robot này vì chúng ta có cùng vóc dáng", ông nói tại Computex 2024.
Tuy nhiên, việc thu thập dữ liệu về cách chúng ta di chuyển vẫn tốn thời gian, công sức và tiền bạc. Ví dụ, Tesla đang trả cho 48 USD/giờ để thuê người thực hiện các nhiệm vụ trong bộ đồ đặc biệt với mục đích đào tạo robot hình người Optimus của mình.
"Đó là vấn đề lớn nhất trong ngành robot — cần bao nhiêu dữ liệu để cung cấp cho các mô hình nền tảng đó hiểu biết về thế giới và điều chỉnh cho phù hợp", theo Sophia Velastegui, chuyên gia AI từng làm việc cho Apple, Google và Microsoft.
Thế nhưng, các nhà phân tích nhìn thấy tiềm năng. Các nhà phân tích của hãng nghiên cứu William Blair gần đây viết: "Năng lực của Nvidia trong lĩnh vực robot và mô phỏng kỹ thuật số (với Omniverse) có tiềm năng phát triển thành những lĩnh vực kinh doanh lớn". Các nhà phân tích dự đoán doanh thu từ mảng ô tô tự hành của Nvidia sẽ tăng trưởng 20% hàng năm cho đến 2027.
Nvidia thông báo BMW sử dụng Isaac và Omniverse để đào tạo robot nhà máy. Boston Dynamics, BYD Electronics, Figure, Intrinsic, Siemens và Teradyne Robotics sử dụng hệ sinh thái của Nvidia để chế tạo cánh tay robot, robot hình người và các loại robot khác.
Thế nhưng, ba chuyên gia về robot nói với trang Insider rằng cho đến nay, Nvidia vẫn chưa thể hạ thấp rào cản gia nhập với những người muốn chế tạo robot như từng làm với AI dựa trên ngôn ngữ và hình ảnh. Các đối thủ cạnh tranh đang tìm cách xây dựng hệ sinh thái lý tưởng cho robot trước khi Nvidia có thể thống trị lĩnh vực này.
"Chúng tôi nhận ra rằng việc phát triển AI có thể tương tác với thế giới vật lý là vô cùng khó khăn. Đó là lý do tại sao chúng tôi phát triển toàn bộ nền tảng để giúp các công ty đào tạo và triển khai robot", phát ngôn viên Nvidia nói với Insider.
Vào tháng 7, Nvidia đã ra mắt chương trình phát triển robot hình người. Sau khi nộp đơn đăng ký thành công, các nhà phát triển có thể truy cập tất cả công cụ này.
Nvidia không thể làm điều này một mình
Ashish Kapoor nhận thức sâu sắc về mọi tiến bộ mà lĩnh vực này vẫn chưa đạt được. Trong 17 năm, ông là người lãnh đạo bộ phận nghiên cứu robot của Microsoft. Tại đó, Ashish Kapoor đã giúp phát triển AirSim, nền tảng mô phỏng thị giác máy tính được ra mắt năm 2017 nhưng bị khai tử vào năm ngoái.
Ashish Kapoor đã rời đi để tạo ra nền tảng của riêng mình. Năm ngoái, ông đã thành lập Scaled Foundations và ra mắt Grid, nền tảng phát triển robot được thiết kế cho những người chế tạo robot đầy tham vọng.
Ashish Kapoor nói không một công ty nào có thể tự mình giải quyết những vấn đề khó khăn của robot.
"Theo cách tôi thấy trong AI, giải pháp thực sự đến từ cộng đồng khi họ cùng nhau làm việc. Đó là lúc phép màu bắt đầu xuất hiện và điều này cần phải xảy ra trong robot ngay bây giờ", Ashish Kapoor cho biết.
Theo Ashish Kapoor, có vẻ dường như mỗi hãng tham gia lĩnh vực robot hình người đều làm việc riêng lẻ. Song có một lý do khiế nhiều công ty khởi nghiệp về robot phải đóng cửa. Các robot khi được đưa vào tình huống thực tế thường không đủ tốt. Khách hàng từ bỏ trước khi chúng có thể trở nên tốt hơn.
"Chuyện cười thường gặp là mỗi robot đều cần đội ngũ 10 người để vận hành", Ashish Kapoor nói.
Nền tảng Grid cung cấp một dịch vụ được quản lý cung cấp nhiều trợ giúp hơn. Scaled Foundations đang xây dựng mô hình nền tảng riêng cho robot nhưng cũng khuyến khích người dùng phát triển một mô hình.
Một số thành phần trong hệ sinh thái robot của Nvidia là mã nguồn mở. Jensen Huang thường nói rằng Nvidia đang hợp tác với mọi công ty robot và AI trên hành tinh, nhưng một số nhà phát triển lo ngại rằng gã khổng lồ chip Mỹ sẽ đảm bảo sự thành công của chính mình trước rồi mới hỗ trợ hệ sinh thái sau.
"Nvidia đang làm điều giống Apple. Với tôi, Nvidia đang cố gắng giữ chân bạn càng nhiều càng tốt trong hệ sinh thái của họ", Jonathan Stephens, người đứng đầu bộ phận phát triển tại công ty thị giác máy tính EveryPoint, cho hay.
Tuy nhiên, phát ngôn viên của Nvidia rằng nhận thức này là không chính xác. "Công ty hợp tác với phần lớn những người chơi hàng đầu trong hệ sinh thái nhà phát triển robot và hình người để giúp họ triển khai robot nhanh hơn. Thành công của chúng tôi đến từ hệ sinh thái", phát ngôn viên Nvidia nói.
Scaled Foundations và Nvidia không phải là hai công ty hiếm hoi đang nghiên cứu mô hình nền tảng cho robot. Skild AI đã huy động được 300 triệu USD vào tháng 7 để xây dựng phiên bản của mình.
Điều gì tạo nên robot hình người?
Các trình mô phỏng là điểm dừng chân thiết yếu trên hành trình phát triển robot hình người, nhưng chúng không nhất thiết dẫn đến nhận thức giống con người.
Khi mô tả một cánh tay robot tại Computex 2024, Jensen Huang cho biết Nvidia đã cung cấp "máy tính, các lớp tăng tốc và các mô hình AI được đào tạo trước" cần thiết để đưa robot AI vào nhà máy AI. Mục tiêu sử dụng cánh tay robot trong các nhà máy ở quy mô lớn đã có từ nhiều thập kỷ. Cánh tay robot đã được dùng để chế tạo ô tô từ năm 1961. Thế nhưng, Jensen Huang đang nói về robot AI thông minh.
Những cánh tay robot chế tạo ô tô phần lớn là không thông minh. Chúng được lập trình để thực hiện các nhiệm vụ lặp đi lặp lại và thường "nhìn" bằng cảm biến thay vì camera.
Một cánh tay robot hỗ trợ AI sẽ có thể xử lý nhiều nhiệm vụ khác nhau, nhặt các vật phẩm khác nhau và đặt chúng xuống ở nhiều nơi mà không làm hỏng chúng, có thể là khi đang di chuyển.
Chúng cần có khả năng nhận biết các vật thể và hàng rào an toàn, sau đó thực hiện các động tác theo thứ tự mạch lạc. Tuy nhiên, robot hình người là thế giới hoàn toàn khác so với những robot bình thường hữu ích nhất. Một số chuyên gia robot nghi ngờ rằng đây có phải là mục tiêu phù hợp để nhắm tới hay không.
"Tôi rất hoài nghi. Chi phí để tạo ra robot hình người và làm cho nó trở nên linh hoạt sẽ cao hơn so với khi bạn tạo ra robot không giống con người và chỉ có thể thực hiện một nhiệm vụ duy nhất nhưng làm điều đó tốt và nhanh hơn", cựu chuyên gia về robot của Nvidia với hơn 15 năm kinh nghiệm trong lĩnh vực này nói.
Tuy nhiên, Jensen Huang vẫn kiên định với tầm nhìn của mình.
"Tôi nghĩ Jensen Huang bị ám ảnh với robot vì cuối cùng điều ông ấy đang cố gắng làm là tạo ra tương lai", Raul Martynek (CEO DataBank) nhận định.
Ô tô tự hành và robot là một phần quan trọng trong tương lai của Nvidia. Công ty Mỹ mong đợi mọi thứ cuối cùng sẽ trở nên tự động, bắt đầu từ cánh tay robot và phương tiện, sau đó đến các tòa nhà và thậm chí cả thành phố.
"Tôi đã ở Apple khi chúng tôi phát triển iPad lấy cảm hứng từ loạt phim Star Trek và các thế giới tương lai khác trong phim", Sophia Velastegui nói, đồng thời cho biết lĩnh vực robot khơi gợi trí tưởng tượng của chúng ta.