Sáng ngày 18.3.2025 (giờ Mỹ), Hội nghị Công nghệ GPU –GTC 2025 tại San Jose, California, bước sang ngày thứ hai với bài trình bày quan trọng của Jensen Huang, CEO NVIDIA.
Diễn tại SAP Center, sự kiện được phát trực tiếp trên trang web NVIDIA và YouTube, thu hút hàng nghìn khán giả trực tiếp lẫn trực tuyến. Đây là dịp để NVIDIA công bố các sản phẩm mới, định hướng tương lai công nghệ, và phản hồi những kỳ vọng lớn từ nhà đầu tư trong bối cảnh cạnh tranh ngày càng gay gắt trong ngành AI và lượng tử.
Huang mở đầu bằng hành trình phát triển AI trong thập kỷ qua. Ông chia quá trình này thành bốn giai đoạn: Perception AI (nhận diện giọng nói, hình ảnh), Generative AI (tạo nội dung), Agentic AI (AI tự hành), và hiện tại là Physical AI (AI vật lý ứng dụng trong robot và thế giới thực). Theo ông, NVIDIA đã đóng vai trò trung tâm trong việc cung cấp phần cứng cho các ứng dụng này, từ xe tự lái, mạng không dây, đến robot tiên tiến.
Công bố Blackwell Ultra và Rubin
Điểm nhấn chính của bài trình bày là công bố Blackwell Ultra (B300 series), phiên bản nâng cấp của dòng chip Blackwell ra mắt năm 2024. Chip này được cải thiện hiệu suất AI gấp 1,5 lần so với phiên bản trước, với dung lượng bộ nhớ HBM tăng từ 192GB lên 288GB. Huang cho biết Blackwell Ultra sẽ bắt đầu xuất xưởng vào nửa cuối năm 2025, nhắm đến các trung tâm dữ liệu và ứng dụng AI quy mô lớn. Tuy nhiên, ông không tiết lộ chi tiết kỹ thuật như số lượng transistor hay mức tiêu thụ điện, khiến một số nhà phân tích cho rằng thông tin còn thiếu chiều sâu.
Ngoài ra, Huang hé lộ về Rubin – dòng GPU thế hệ tiếp theo – dự kiến ra mắt vào năm 2026, đi kèm với CPU Vera. Ông mô tả Rubin là “bước nhảy vọt” trong tính toán, nhưng không cung cấp thêm thông tin về kiến trúc hay ứng dụng cụ thể. Đây là một phần trong chiến lược của NVIDIA nhằm duy trì chu kỳ ra mắt sản phẩm mới mỗi năm, dù thời điểm ra mắt 2026 khiến một số nhà đầu tư thất vọng khi kỳ vọng sớm hơn.
NVIDIA Dynamo
Một công bố đáng chú ý khác là NVIDIA Dynamo, một phần mềm mã nguồn mở mới được giới thiệu tại GTC 2025. Dynamo là một framework phục vụ suy luận (inference) với độ trễ thấp và thông lượng cao, được thiết kế để tối ưu hóa hiệu suất AI trên quy mô lớn. Phần mềm này có khả năng phân phối công việc suy luận qua tối đa 1.000 GPU, tăng tốc độ xử lý token mỗi giây – một chỉ số quan trọng trong các ứng dụng AI như chatbot hoặc mô hình ngôn ngữ lớn. Huang cho biết Dynamo có thể nâng cao doanh thu cho các “nhà máy AI” bằng cách tăng số lượng token xử lý hoặc cung cấp dịch vụ cao cấp với tốc độ nhanh hơn. Phần mềm đã được phát hành trên GitHub ngay trong ngày 18/3, đánh dấu nỗ lực của NVIDIA trong việc cải thiện hiệu quả tính toán AI.
Hệ thống workstation DGX mới: Spark và Station
Huang cũng giới thiệu hai thiết bị workstation mới: DGX Spark và DGX Station, nhắm đến các nhà phát triển AI và nhà khoa học dữ liệu. DGX Spark (trước đây gọi là Project DIGITS) sử dụng siêu chip GB10 Grace Blackwell, cung cấp hiệu suất AI lên đến 1.000 nghìn tỷ phép tính mỗi giây (1 petaflops). Thiết bị này được thiết kế để chạy các mô hình AI cục bộ mà không cần phụ thuộc vào đám mây, với mục tiêu giảm chi phí và tăng tính linh hoạt cho người dùng.
Trong khi đó, DGX Station được trang bị Grace Blackwell Ultra Desktop Superchip GB300, kết hợp với 784GB bộ nhớ DRAM. Đây là phiên bản nâng cấp của dòng DGX Station ra mắt năm 2017, chuyển từ CPU Intel sang kiến trúc Grace Blackwell của NVIDIA. Các hãng như Asus, Dell, HP, Lambda và Supermicro sẽ sản xuất thiết bị này, với thời điểm phát hành dự kiến vào cuối năm 2025. Huang mô tả đây là “máy tính của kỷ nguyên AI”, phù hợp cho việc phát triển và thử nghiệm mô hình tại chỗ.
Vai trò của NVIDIA trong lượng tử và Quantum Day
Liên quan đến “Quantum Day” dự kiến diễn ra ngày 20.3, Huang đề cập ngắn gọn về nỗ lực của NVIDIA trong điện toán lượng tử. Ông xác nhận sự kiện này sẽ tập trung vào hệ thống lai lượng tử-cổ điển, sử dụng framework CUDA-Q để mô phỏng lượng tử trên GPU. “Chúng ta chưa sẵn sàng cho lượng tử độc lập, nhưng hệ thống lai là con đường thực tế,” Huang nói, nhắc lại quan điểm từ CES 2025 rằng lượng tử thực dụng còn cách 15-30 năm. Ông cũng ám chỉ công nghệ mạng Quantum InfiniBand có thể tích hợp quang học đồng gói (CPO), nhưng không xác nhận cụ thể.
Hợp tác và ứng dụng thực tiễn
Một số công bố khác cũng thu hút sự chú ý. NVIDIA hợp tác với General Motors (GM) để phát triển xe tự lái, giới thiệu hệ thống an toàn NVIDIA HALO dựa trên chip của hãng. Huang cũng trình diễn robot Blue – kết quả hợp tác với Google DeepMind và Disney Research – với khả năng phản hồi cử chỉ và âm thanh. Robot này được đánh giá là minh chứng cho ứng dụng của Physical AI, nhưng tính thực tiễn trong đời sống vẫn còn là câu hỏi.
Bài trình bày của Huang kết thúc bằng lời kêu gọi các nhà phát triển tham gia vào hệ sinh thái NVIDIA. Video phát lại hiện đã có trên NVIDIA.com và YouTube, cho phép người xem đánh giá chi tiết các công bố. Với GTC 2025 còn tiếp diễn đến ngày 21.3, các phiên thảo luận sắp tới, đặc biệt là Quantum Day, có thể cung cấp thêm thông tin để làm sáng tỏ những gì NVIDIA đã giới thiệu hôm nay.
Một số các hình ảnh khác tại keynote GTC 2025