HomeAIMô hình Google Gemma 4 chính thức hoạt động trên card đồ...

Mô hình Google Gemma 4 chính thức hoạt động trên card đồ họa Nvidia RTX

Published on

Mô hình nguồn mở Google Gemma 4 hiện hỗ trợ triển khai trên phần cứng Nvidia RTX, cung cấp hiệu năng tối ưu cho các tác vụ AI tự chủ.

Các mô hình ngôn ngữ mở đang thúc đẩy làn sóng trí tuệ nhân tạo trực tiếp trên thiết bị, đưa những đổi mới công nghệ vượt ra khỏi ranh giới điện toán đám mây truyền thống. Giá trị cốt lõi của các mô hình này phụ thuộc vào khả năng truy cập dữ liệu cục bộ theo thời gian thực để đưa ra phản hồi chính xác.

eevee nv blog 1280x680 1 1 MMOSITE - Thông tin công nghệ

Google và Nvidia vừa chính thức công bố thỏa thuận hợp tác tối ưu hóa dòng mô hình Gemma 4 cho các hệ thống sử dụng đơn vị xử lý đồ họa (GPU) Nvidia. Việc triển khai mang lại hiệu suất vận hành ổn định trên nhiều nền tảng phần cứng khác nhau, từ các trung tâm dữ liệu quy mô lớn, máy tính cá nhân và máy trạm tích hợp GPU RTX, siêu máy tính AI cá nhân DGX Spark cho đến các mô-đun AI biên Jetson Orin Nano.

Đa dạng phiên bản và khả năng xử lý đa phương thức

Dòng mô hình nguồn mở Gemma 4 được phân chia thành bốn biến thể chính bao gồm E2B, E4B, 26B và 31B. Các phiên bản này được tinh chỉnh để phục vụ nhiều mục đích triển khai từ thiết bị biên đến hệ thống phần cứng hiệu năng cao.

Thế hệ mô hình nhỏ gọn mới hỗ trợ toàn diện các tác vụ phức tạp như suy luận logic, lập trình mã nguồn, gỡ lỗi phần mềm và cung cấp hỗ trợ gốc cho các hệ thống AI tự chủ thông qua chức năng gọi công cụ. Gemma 4 sở hữu năng lực xử lý đa phương thức ấn tượng, cho phép nhận diện hình ảnh, nhận dạng giọng nói tự động và phân tích tài liệu hoặc video. Người dùng có quyền kết hợp văn bản và hình ảnh theo bất kỳ trình tự nào trong một câu lệnh duy nhất.

A bar chart titled 'Up to 2.7x Gemma 4 Inference Performance on NVIDIA GPUs with llama.cpp' shows NVIDIA RTX 5090 outperforming M3 Ultra in various Gemma-4 configurations.

Hệ thống hỗ trợ sẵn hơn 35 ngôn ngữ và được đào tạo trước trên tập dữ liệu gồm 140 ngôn ngữ khác nhau. Biến thể E2B và E4B hướng đến quá trình suy luận độ trễ thấp trên thiết bị biên, hoạt động hoàn toàn ngoại tuyến trên các nền tảng như Jetson Nano. Trong khi đó, biến thể 26B và 31B tập trung vào khả năng suy luận hiệu năng cao, tối ưu hóa cho các hệ thống GPU RTX và DGX Spark để vận hành môi trường lập trình và các quy trình làm việc do AI tự chủ điều khiển.

Ứng dụng thực tiễn và phương thức triển khai

Sự phát triển của AI tự chủ cục bộ tạo điều kiện cho các ứng dụng như OpenClaw vận hành trợ lý ảo liên tục trên thiết bị cá nhân. Dòng Gemma 4 tương thích hoàn toàn với OpenClaw, giúp người dùng xây dựng các tác nhân nội bộ có khả năng trích xuất ngữ cảnh từ tệp tin cá nhân để tự động hóa công việc. Để hỗ trợ quá trình cài đặt, Nvidia đã hợp tác cùng Ollama và llama.cpp nhằm cung cấp trải nghiệm triển khai thuận lợi nhất.

Người dùng có thể tải xuống phần mềm Ollama hoặc cài đặt llama.cpp kết hợp cùng tệp trọng số GGUF trên nền tảng Hugging Face. Nền tảng Unsloth cung cấp hỗ trợ tức thời thông qua các mô hình đã được lượng tử hóa để tinh chỉnh cục bộ qua công cụ Unsloth Studio. Việc vận hành các mô hình mở như Gemma 4 trên phần cứng Nvidia mang lại hiệu năng tối đa nhờ lõi Tensor chuyên dụng giúp tăng tốc độ xử lý suy luận.

Ngăn xếp phần mềm CUDA đảm bảo khả năng tương thích rộng rãi trên các khung làm việc hàng đầu, cho phép dòng mô hình mới mở rộng quy mô hoạt động từ thiết bị biên đến máy trạm di động mà không yêu cầu quá trình tinh chỉnh phức tạp.

Nguồn: wccftech

tin mới nhất

AMD Instinct MI355X vượt mốc 1 triệu token mỗi giây trong bài kiểm tra MLPerf 6.0

GPU AMD Instinct MI355X đạt hơn 1 triệu token/giây tại MLPerf 6.0, khẳng định...

Người dùng có thể kích hoạt sớm tính năng Nvidia Dynamic Multi-Frame Generation qua OTA

Tính năng Nvidia Dynamic Multi-Frame Generation có thể được kích hoạt sớm qua bản...

Lexar hướng tới lưu trữ AI, kỷ niệm 30 năm

Đánh dấu cột mốc ba thập kỷ phát triển, Lexar không chỉ nhìn lại...

Bo mạch chủ Asus ROG X870E APEX đạt mức ép xung DDR5-8800 trên Ryzen 9 9950X3D2

Asus ROG X870E APEX vừa thể hiện khả năng ép xung bộ nhớ đạt...

DJI ra mắt flycam Avata 360 hỗ trợ quay video 360 độ 8K HDR 60fps

DJI chính thức giới thiệu thiết bị bay không người lái Avata 360 với...

tin liên quan

Người dùng có thể kích hoạt sớm tính năng Nvidia Dynamic Multi-Frame Generation qua OTA

Tính năng Nvidia Dynamic Multi-Frame Generation có thể được...

NVIDIA giới thiệu DGX Spark cho workload AI agent và mô hình 700B tham số

NVIDIA công bố DGX Spark, nền tảng máy trạm...

NVIDIA công bố DLSS 5 với công nghệ dựng hình thần kinh thế hệ mới

DLSS 5 nâng cấp chất lượng đồ họa bằng...

NVIDIA công bố GPU Feynman với công nghệ xếp chồng 3D và HBM tùy biến

NVIDIA tiết lộ thêm chi tiết về nền tảng...

Nvidia ra mắt mô hình Nemotron 3 Super mã nguồn mở tối ưu cho OpenClaw

Nvidia giới thiệu mô hình Nemotron 3 Super mã...