Tại hội nghị GTC 2025, NVIDIA giới thiệu loạt công nghệ mới hỗ trợ phát triển robot humanoid, nổi bật là NVIDIA Isaac GR00T N1 – mô hình nền tảng (foundation model) mã nguồn mở đầu tiên cho khả năng suy luận và kỹ năng chung của robot hình dạng con người. Ngoài ra, NVIDIA công bố các khung mô phỏng (simulation frameworks) như Isaac GR00T Blueprint để tạo dữ liệu tổng hợp (synthetic data) và Newton – công cụ mô phỏng vật lý mã nguồn mở hợp tác với Google DeepMind và Disney Research.
Isaac GR00T N1, hiện đã khả dụng, là mô hình có thể tùy chỉnh hoàn toàn, được NVIDIA huấn luyện sẵn và cung cấp cho các nhà phát triển robot toàn cầu. Mô hình này ứng dụng kiến trúc hai hệ thống dựa trên nhận thức con người: “System 1” xử lý nhanh như phản xạ, và “System 2” suy luận chậm để đưa ra quyết định.
Được hỗ trợ bởi mô hình ngôn ngữ hình ảnh (vision language model), GR00T N1 thực hiện các tác vụ như cầm nắm, di chuyển vật thể và phối hợp tay, hoặc xử lý công việc đa bước cần ngữ cảnh dài. Jensen Huang, CEO NVIDIA, cho biết công nghệ này mở ra kỷ nguyên robot đa năng, giải quyết thiếu hụt lao động toàn cầu ước tính hơn 50 triệu người.
Mô hình được huấn luyện từ dữ liệu biểu diễn của con người và dữ liệu tổng hợp từ Omniverse. Tại GTC, Huang trình diễn robot của 1X tự dọn dẹp nhà cửa nhờ chính sách huấn luyện dựa trên GR00T N1, hợp tác giữa 1X và NVIDIA. Bernt Børnich, CEO 1X, cho biết GR00T N1 tăng tốc khả năng suy luận và kỹ năng robot với ít dữ liệu hậu huấn luyện (post-training). Các công ty như Agility Robotics, Boston Dynamics, Mentee Robotics và NEURA Robotics cũng được truy cập sớm mô hình này.
NVIDIA hợp tác Google DeepMind và Disney Research phát triển Newton, công cụ mô phỏng vật lý tối ưu cho học máy robot, tăng tốc 70 lần so với MJX của MuJoCo. Disney dùng Newton để nâng cấp robot giải trí như BDX droids, xuất hiện cùng Huang tại GTC. Kyle Laughlin từ Walt Disney Imagineering cho biết đây là bước đầu đưa nhân vật robot sống động hơn vào thực tế. Newton dự kiến ra mắt cuối năm nay, hỗ trợ MuJoCo-Warp và Isaac Lab.
Dữ liệu chất lượng cao rất quan trọng cho robot, nhưng thu thập từ con người tốn thời gian. Isaac GR00T Blueprint, dựa trên Omniverse và Cosmos Transfer, tạo dữ liệu tổng hợp quy mô lớn từ ít biểu diễn thực tế. NVIDIA tạo 780.000 quỹ đạo tổng hợp – tương đương 6.500 giờ dữ liệu con người – trong 11 giờ, kết hợp dữ liệu thực để tăng hiệu suất GR00T N1 lên 40% so với chỉ dùng dữ liệu thực. Bộ dữ liệu GR00T N1 được công bố mã nguồn mở trên Hugging Face, nằm trong tập dữ liệu AI vật lý lớn hơn.
GR00T N1 và Blueprint hiện tải được từ Hugging Face và GitHub. NVIDIA cũng ra mắt DGX Spark, siêu máy tính AI cá nhân giúp mở rộng GR00T N1 cho robot và tác vụ mới mà không cần lập trình phức tạp. Các công nghệ này nhắm đến đẩy nhanh phát triển robot humanoid, nhưng đòi hỏi hạ tầng mạnh và khả năng tích hợp từ nhà phát triển.
Tại GTC, Disney Research chia sẻ cách dùng Newton cho robot BDX, trong khi Google DeepMind trình bày MuJoCo-Warp. NVIDIA và Intrinsic cũng công bố khung OpenUSD để tối ưu luồng dữ liệu robot.