NVIDIA giới thiệu các mô hình nền tảng AI chạy cục bộ trên PC RTX AI, tăng cường hiệu suất phát triển nội dung, năng suất và tạo hình kỹ thuật số, cùng nhiều tính năng khác.
NVIDIA nâng cấp sức mạnh AI trên PC RTX AI
Hôm nay, NVIDIA công bố các mô hình nền tảng AI mới được chạy trực tiếp trên các PC RTX AI. Những mô hình này, được cung cấp dưới dạng microservice NVIDIA NIM™, tận dụng sức mạnh của dòng GPU GeForce RTX™ 50 Series mới. Với hiệu suất AI lên tới 3.352 nghìn tỷ phép toán mỗi giây và 32GB VRAM, GPU RTX 50 Series được xây dựng dựa trên kiến trúc Blackwell, hỗ trợ tính toán FP4, giúp tăng gấp đôi hiệu suất suy luận AI so với thế hệ trước.
Công nghệ này cho phép các mô hình AI tạo sinh chạy cục bộ với dung lượng bộ nhớ nhỏ hơn, giảm phụ thuộc vào các trung tâm dữ liệu lớn. NVIDIA nhấn mạnh rằng các GPU GeForce RTX từ lâu đã là nền tảng quan trọng cho các nhà phát triển AI. Với dòng RTX AI PC và công cụ mới như AnythingLLM hay Langflow, người dùng từ nhà phát triển đến người dùng phổ thông có thể dễ dàng triển khai AI vào các quy trình công việc phức tạp mà không cần viết mã phức tạp.
Nền tảng microservice NIM và ứng dụng thực tế
NVIDIA giới thiệu microservice NIM như một công cụ linh hoạt để triển khai các mô hình AI tiên tiến. Những dịch vụ này bao gồm nhiều ứng dụng như mô hình ngôn ngữ lớn (LLM), nhận diện hình ảnh, xử lý ngôn ngữ tự nhiên, và trích xuất dữ liệu từ PDF. Những AI Blueprint đi kèm với NIM microservice cung cấp các quy trình tham khảo sẵn sàng sử dụng, giúp người dùng tạo ra nội dung số, phát triển nhân vật số và tối ưu hóa quy trình sáng tạo.
Một ví dụ nổi bật là NVIDIA Llama Nemotron, một dòng mô hình AI mở với khả năng thực hiện các tác vụ như viết mã, tính toán, hội thoại và gọi hàm. Các mô hình này được tối ưu hóa để hoạt động trên PC RTX AI hoặc máy trạm, giúp AI dễ dàng tiếp cận hơn cho cả nhà phát triển và người dùng phổ thông.
Robin Rombach, CEO của Black Forest Labs, nhận xét: “GPU GeForce RTX 50 Series với tính toán FP4 mở ra khả năng chạy nhiều mô hình AI trực tiếp trên PC, trước đây chỉ giới hạn ở các trung tâm dữ liệu.”
Công nghệ AI mới trên PC RTX AI
Ngoài việc tối ưu hóa cho Windows 11 và nền tảng Windows Subsystem for Linux (WSL), NVIDIA cũng triển khai các công cụ như NVIDIA ChatRTX để mang lại trải nghiệm AI trực quan hơn. Một trong những dự án nổi bật là Project R2X, một avatar số thông minh, có khả năng hỗ trợ người dùng trong hội nghị video, đọc và tóm tắt tài liệu, và cung cấp thông tin một cách linh hoạt. Avatar này được vận hành bởi NVIDIA RTX Neural Faces và công nghệ NVIDIA Audio2Face™-3D, tạo ra các cử động miệng và giọng nói chân thực.
Dành cho các nhà sáng tạo nội dung, NVIDIA cung cấp các AI Blueprint như công cụ biến PDF thành podcast hoặc hỗ trợ tạo hình ảnh dựa trên bố cục 3D. Ví dụ, AI Blueprint “PDF to Podcast” có thể tự động chuyển đổi nội dung từ tài liệu PDF thành kịch bản podcast, thậm chí ghi âm bằng giọng nói người dùng.
Ra mắt sản phẩm và kế hoạch phát hành
Các microservice NIM và AI Blueprint sẽ chính thức có mặt vào tháng 2, hỗ trợ dòng GPU GeForce RTX 50 Series, RTX 4090, RTX 4080, và các GPU chuyên nghiệp NVIDIA RTX 6000, 5000. Đồng thời, các PC RTX AI sẵn sàng sử dụng sẽ được phân phối bởi các nhà sản xuất hàng đầu như Acer, ASUS, Dell, HP, Lenovo, và nhiều thương hiệu khác.
Với những cải tiến mạnh mẽ từ dòng RTX 50 Series và hệ sinh thái AI mở rộng, NVIDIA đặt mục tiêu phổ biến công nghệ AI tạo sinh đến mọi người dùng, từ nhà phát triển chuyên nghiệp đến người dùng phổ thông.