spot_img
HomeAINVIDIA ra mắt DGX Spark và Station cho nhà phát triển AI

NVIDIA ra mắt DGX Spark và Station cho nhà phát triển AI

Published on

Tại GTC 2025, NVIDIA giới thiệu dòng siêu máy tính cá nhân (personal supercomputers) DGX mới, gồm DGX Spark và DGX Station, sử dụng nền tảng Grace Blackwell. Hai hệ thống này được thiết kế cho nhà phát triển (developer), nhà nghiên cứu, nhà khoa học dữ liệu và sinh viên, cho phép thử nghiệm, tinh chỉnh và suy luận (inference) mô hình AI lớn ngay trên máy để bàn (desktop).

Người dùng có thể vận hành mô hình cục bộ hoặc triển khai lên NVIDIA DGX Cloud, đám mây tăng tốc (accelerated cloud) hoặc trung tâm dữ liệu mà không cần chỉnh sửa nhiều mã nguồn. Các nhà sản xuất toàn cầu như ASUS, Dell Technologies, HP và Lenovo sẽ phát triển hai dòng máy này.

NVIDIA ra mắt DGX Spark và Station cho nhà phát triển AI

DGX Spark, trước đây là Project DIGITS, được xem là siêu máy tính AI nhỏ nhất thế giới. Máy tích hợp siêu chip (superchip) GB10 Grace Blackwell, tối ưu cho dạng máy để bàn, với GPU Blackwell thế hệ thứ năm, hỗ trợ FP4 và lõi Tensor, đạt tới 1.000 nghìn tỷ phép tính mỗi giây. Hiệu suất này phù hợp để xử lý các mô hình AI suy luận mới như NVIDIA Cosmos Reason và GR00T N1 cho robot. Công nghệ NVLink-C2C kết nối CPU và GPU, mang lại băng thông gấp 5 lần PCIe thế hệ năm, tối ưu cho khối lượng công việc AI nặng về bộ nhớ.

DGX Station mang hiệu suất cấp trung tâm dữ liệu xuống máy để bàn. Đây là hệ thống đầu tiên dùng siêu chip GB300 Grace Blackwell Ultra Desktop, với bộ nhớ mạch lạc (coherent memory) 784GB, tăng tốc huấn luyện và suy luận quy mô lớn. GB300 kết hợp GPU Blackwell Ultra và CPU Grace qua NVLink-C2C, đảm bảo giao tiếp hệ thống hiệu quả. Máy còn trang bị ConnectX-8 SuperNIC, hỗ trợ mạng tốc độ 800Gb/s, cho phép kết nối nhiều DGX Station để xử lý khối lượng công việc lớn hơn và truyền dữ liệu nhanh qua mạng cho tác vụ AI.

IMG 2112 MMOSITE - Thông tin công nghệ, review, thủ thuật PC, gaming

Jensen Huang, CEO NVIDIA, cho biết DGX Spark và Station mở rộng AI từ đám mây sang máy để bàn và ứng dụng biên (edge applications). DGX Spark hướng tới hàng triệu nhà phát triển robot, khoa học dữ liệu, hỗ trợ AI tạo sinh (generative AI) và AI vật lý (physical AI) với hiệu suất cao. Nền tảng AI toàn diện của NVIDIA giúp người dùng DGX Spark chuyển mô hình từ máy để bàn sang DGX Cloud hoặc hạ tầng khác mà không cần thay đổi nhiều, đơn giản hóa quá trình thử nghiệm và tinh chỉnh.

DGX Station, với sự kết hợp CUDA-X AI, đáp ứng nhu cầu phát triển AI của nhóm lớn hơn trên máy để bàn. Người dùng cả hai dòng máy được truy cập microservices NIM qua phần mềm NVIDIA AI Enterprise, cung cấp dịch vụ suy luận tối ưu và hỗ trợ cấp doanh nghiệp. Tuy nhiên, để tận dụng hết khả năng, người dùng cần kỹ năng kỹ thuật và hạ tầng mạng phù hợp, đặc biệt với ConnectX-8 trên DGX Station.

DGX Spark hiện mở đặt trước từ ngày công bố. DGX Station dự kiến ra mắt cuối năm 2025 qua các đối tác như ASUS, BOXX, Dell, HP, Lambda và Supermicro. Grace Blackwell, vốn chỉ dùng trong trung tâm dữ liệu, nay được thu gọn cho máy cá nhân, nhưng chưa có thông tin chi tiết về giá cả hay hiệu suất thực tế so với các hệ thống khác.

DGX Spark phù hợp cho cá nhân hoặc nhóm nhỏ nhờ thiết kế nhỏ gọn và siêu chip GB10 tiết kiệm năng lượng. Ngược lại, DGX Station nhắm đến khối lượng công việc lớn như huấn luyện mô hình AI phức tạp, với bộ nhớ lớn và kết nối mạng tốc độ cao. Cả hai đều yêu cầu người dùng hiểu biết về triển khai mô hình AI để tận dụng tối đa sức mạnh phần cứng.

NVIDIA chưa công bố dữ liệu hiệu suất cụ thể khi so với các dòng máy khác, nhưng nhấn mạnh hai hệ thống này đáp ứng xu hướng AI bản địa (AI-native). NVLink-C2C và ConnectX-8 tăng hiệu quả giao tiếp nội bộ và mạng, nhưng đòi hỏi hạ tầng tương thích để hoạt động tối ưu. Các nhà phát triển cần xem xét khả năng tích hợp với công cụ hiện có trước khi đầu tư. Thông tin chi tiết sẽ được các đối tác sản xuất cập nhật trong thời gian tới.

tin mới nhất

ASUS nâng cấp AI POD tại GTC 2025, mở rộng danh mục máy chủ AI hiệu suất cao

Tại hội nghị GPU Technology Conference 2025, ASUS công bố phiên bản nâng cấp...

[GTC 2025]NVIDIA dùng AI-Q kết nối AI xử lý tác vụ phức tạp

Tại hội nghị GTC 2025, NVIDIA công bố AI-Q – một kế hoạch chi...

[GTC 2025] NVIDIA hợp tác cùng Alphabet Google để phát triển AI vật lý

Tại hội nghị GTC 2025, NVIDIA cùng Alphabet và Google công bố các sáng...

GPU NVIDIA RTX PRO 6000 “Blackwell” nhanh hơn RTX 5090 trong bài kiểm tra Pure Path Tracing

Những con số điểm chuẩn đầu tiên về GPU RTX PRO 6000 "Blackwell" vừa...

[GTC 2025] NVIDIA công bố GPU Feynman thế hệ tiếp theo trong lộ trình ra mắt tương lai

NVIDIA vừa đặt tên cho GPU thế hệ tiếp theo của mình là Feynman...

tin liên quan