HomeAINVIDIA ra mắt dòng mô hình AI mở Nemotron 3 với hiệu...

NVIDIA ra mắt dòng mô hình AI mở Nemotron 3 với hiệu năng gấp 4 lần

Published on

NVIDIA vừa công bố dòng mô hình Nemotron 3 gồm ba phiên bản, tích hợp kiến trúc MoE tiên tiến giúp tăng tốc độ xử lý và tối ưu hóa chi phí.

A scatter plot titled 'Intelligence vs. Output Speed' shows 'gpt-oss-20B (high)' from OpenAI and 'NVIDIA Nemotron 3 Nano' in the most attractive quadrant, indicating high output speed and intelligence index.

NVIDIA đã chính thức giới thiệu gia đình mô hình mở (open models) mới nhất mang tên Nemotron 3, bao gồm dữ liệu và các thư viện hỗ trợ được thiết kế để thúc đẩy phát triển AI tác nhân (agentic AI) minh bạch và hiệu quả trên nhiều ngành công nghiệp.

Dòng sản phẩm này ra mắt với ba kích thước khác nhau gồm Nano, Super và Ultra, giới thiệu kiến trúc chuyên gia hỗn hợp tiềm ẩn (hybrid latent Mixture-of-Experts – MoE) mang tính đột phá. Công nghệ này hỗ trợ các nhà phát triển xây dựng và triển khai các hệ thống đa tác nhân tin cậy ở quy mô lớn.

The image shows an announcement for the NVIDIA Nemotron 3 family of models: 'Nano' (30B-A3B) available now, 'Super' (~100B-A10B) coming Q1 2026, and 'Ultra' (~500B-A50B) coming 1H 2026, with additional sections on '

Động thái này cũng củng cố nỗ lực phát triển AI chủ quyền của NVIDIA, cho phép các tổ chức từ châu Âu đến Hàn Quốc xây dựng hệ thống AI phù hợp với dữ liệu và quy định riêng biệt. Hiện tại, nhiều doanh nghiệp lớn như Accenture, Oracle Cloud Infrastructure, Siemens và Zoom đã bắt đầu tích hợp các mô hình Nemotron vào quy trình làm việc.

Cải tiến kiến trúc và hiệu suất vượt trội

Phiên bản Nemotron 3 Nano, hiện đã có sẵn, là mô hình tối ưu nhất về chi phí tính toán với 30 tỷ tham số (trong đó có 3 tỷ tham số kích hoạt). Mô hình này được thiết kế cho các tác vụ mục tiêu như gỡ lỗi phần mềm, tóm tắt nội dung và trợ lý AI. Nhờ kiến trúc MoE lai độc đáo, Nemotron 3 Nano đạt thông lượng token cao gấp 4 lần so với phiên bản Nemotron 2 Nano tiền nhiệm.

A bar chart titled 'Output Speed' shows the NVIDIA Nemotron 3 Nano outperforming other models with a score of 377 tokens per second.

Đồng thời, khả năng tạo token suy luận giảm tới 60%, giúp tiết kiệm đáng kể chi phí vận hành. Với cửa sổ ngữ cảnh lên tới 1 triệu token, phiên bản Nano có khả năng ghi nhớ tốt hơn, đảm bảo độ chính xác khi kết nối thông tin trong các tác vụ dài và phức tạp. Tổ chức đánh giá độc lập Artificial Analysis đã xếp hạng đây là mô hình mở hiệu quả nhất trong phân khúc cùng kích thước.

Phân khúc cao cấp và lộ trình phát hành

Bên cạnh phiên bản Nano, dòng sản phẩm còn bao gồm Nemotron 3 Super và Ultra. Phiên bản Super sở hữu khoảng 100 tỷ tham số (10 tỷ kích hoạt), chuyên dụng cho các ứng dụng đa tác nhân đòi hỏi độ trễ thấp. Trong khi đó, Nemotron 3 Ultra là động cơ suy luận mạnh mẽ nhất với 500 tỷ tham số (50 tỷ kích hoạt), phục vụ các quy trình công việc phức tạp yêu cầu nghiên cứu sâu và lập kế hoạch chiến lược.

Cả hai phiên bản này đều sử dụng định dạng huấn luyện NVFP4 4-bit siêu hiệu quả trên kiến trúc NVIDIA Blackwell, giúp giảm yêu cầu bộ nhớ và tăng tốc độ huấn luyện mà không làm giảm độ chính xác.A scatter plot titled 'Artificial Analysis Openness Index vs. Artificial Analysis Intelligence Index' shows NVIDIA products like 'Nemotron Nano 12B v2 VL' and 'Nemotron 3 Nano' in the most attractive quadrant.

Về khả năng tiếp cận, Nemotron 3 Nano hiện đã có mặt trên Hugging Face và các nhà cung cấp dịch vụ suy luận như AWS (thông qua Amazon Bedrock), Google Cloud và Coreweave. Mô hình này cũng được cung cấp dưới dạng vi dịch vụ NVIDIA NIM để đảm bảo tính bảo mật. Hai phiên bản cao cấp hơn là Nemotron 3 Super và Ultra dự kiến sẽ chính thức ra mắt vào nửa đầu năm 2026.

Nguồn: wccftech

tin mới nhất

AMD Instinct MI355X vượt mốc 1 triệu token mỗi giây trong bài kiểm tra MLPerf 6.0

GPU AMD Instinct MI355X đạt hơn 1 triệu token/giây tại MLPerf 6.0, khẳng định...

Người dùng có thể kích hoạt sớm tính năng Nvidia Dynamic Multi-Frame Generation qua OTA

Tính năng Nvidia Dynamic Multi-Frame Generation có thể được kích hoạt sớm qua bản...

Lexar hướng tới lưu trữ AI, kỷ niệm 30 năm

Đánh dấu cột mốc ba thập kỷ phát triển, Lexar không chỉ nhìn lại...

Bo mạch chủ Asus ROG X870E APEX đạt mức ép xung DDR5-8800 trên Ryzen 9 9950X3D2

Asus ROG X870E APEX vừa thể hiện khả năng ép xung bộ nhớ đạt...

DJI ra mắt flycam Avata 360 hỗ trợ quay video 360 độ 8K HDR 60fps

DJI chính thức giới thiệu thiết bị bay không người lái Avata 360 với...

tin liên quan

Người dùng có thể kích hoạt sớm tính năng Nvidia Dynamic Multi-Frame Generation qua OTA

Tính năng Nvidia Dynamic Multi-Frame Generation có thể được...

NVIDIA giới thiệu DGX Spark cho workload AI agent và mô hình 700B tham số

NVIDIA công bố DGX Spark, nền tảng máy trạm...

NVIDIA công bố DLSS 5 với công nghệ dựng hình thần kinh thế hệ mới

DLSS 5 nâng cấp chất lượng đồ họa bằng...

NVIDIA công bố GPU Feynman với công nghệ xếp chồng 3D và HBM tùy biến

NVIDIA tiết lộ thêm chi tiết về nền tảng...