Mô hình Google Gemma 4 chính thức hoạt động trên card đồ họa Nvidia RTXc

Mô hình nguồn mở Google Gemma 4 hiện hỗ trợ triển khai trên phần cứng Nvidia RTX, cung cấp hiệu năng tối ưu cho các tác vụ AI tự chủ.

Các mô hình ngôn ngữ mở đang thúc đẩy làn sóng trí tuệ nhân tạo trực tiếp trên thiết bị, đưa những đổi mới công nghệ vượt ra khỏi ranh giới điện toán đám mây truyền thống. Giá trị cốt lõi của các mô hình này phụ thuộc vào khả năng truy cập dữ liệu cục bộ theo thời gian thực để đưa ra phản hồi chính xác.

eevee nv blog 1280x680 1 1 MMOSITE - Thông tin công nghệ

Google và Nvidia vừa chính thức công bố thỏa thuận hợp tác tối ưu hóa dòng mô hình Gemma 4 cho các hệ thống sử dụng đơn vị xử lý đồ họa (GPU) Nvidia. Việc triển khai mang lại hiệu suất vận hành ổn định trên nhiều nền tảng phần cứng khác nhau, từ các trung tâm dữ liệu quy mô lớn, máy tính cá nhân và máy trạm tích hợp GPU RTX, siêu máy tính AI cá nhân DGX Spark cho đến các mô-đun AI biên Jetson Orin Nano.

Đa dạng phiên bản và khả năng xử lý đa phương thức

Dòng mô hình nguồn mở Gemma 4 được phân chia thành bốn biến thể chính bao gồm E2B, E4B, 26B và 31B. Các phiên bản này được tinh chỉnh để phục vụ nhiều mục đích triển khai từ thiết bị biên đến hệ thống phần cứng hiệu năng cao.

Thế hệ mô hình nhỏ gọn mới hỗ trợ toàn diện các tác vụ phức tạp như suy luận logic, lập trình mã nguồn, gỡ lỗi phần mềm và cung cấp hỗ trợ gốc cho các hệ thống AI tự chủ thông qua chức năng gọi công cụ. Gemma 4 sở hữu năng lực xử lý đa phương thức ấn tượng, cho phép nhận diện hình ảnh, nhận dạng giọng nói tự động và phân tích tài liệu hoặc video. Người dùng có quyền kết hợp văn bản và hình ảnh theo bất kỳ trình tự nào trong một câu lệnh duy nhất.

A bar chart titled 'Up to 2.7x Gemma 4 Inference Performance on NVIDIA GPUs with llama.cpp' shows NVIDIA RTX 5090 outperforming M3 Ultra in various Gemma-4 configurations.

Hệ thống hỗ trợ sẵn hơn 35 ngôn ngữ và được đào tạo trước trên tập dữ liệu gồm 140 ngôn ngữ khác nhau. Biến thể E2B và E4B hướng đến quá trình suy luận độ trễ thấp trên thiết bị biên, hoạt động hoàn toàn ngoại tuyến trên các nền tảng như Jetson Nano. Trong khi đó, biến thể 26B và 31B tập trung vào khả năng suy luận hiệu năng cao, tối ưu hóa cho các hệ thống GPU RTX và DGX Spark để vận hành môi trường lập trình và các quy trình làm việc do AI tự chủ điều khiển.

Ứng dụng thực tiễn và phương thức triển khai

Sự phát triển của AI tự chủ cục bộ tạo điều kiện cho các ứng dụng như OpenClaw vận hành trợ lý ảo liên tục trên thiết bị cá nhân. Dòng Gemma 4 tương thích hoàn toàn với OpenClaw, giúp người dùng xây dựng các tác nhân nội bộ có khả năng trích xuất ngữ cảnh từ tệp tin cá nhân để tự động hóa công việc. Để hỗ trợ quá trình cài đặt, Nvidia đã hợp tác cùng Ollama và llama.cpp nhằm cung cấp trải nghiệm triển khai thuận lợi nhất.

Người dùng có thể tải xuống phần mềm Ollama hoặc cài đặt llama.cpp kết hợp cùng tệp trọng số GGUF trên nền tảng Hugging Face. Nền tảng Unsloth cung cấp hỗ trợ tức thời thông qua các mô hình đã được lượng tử hóa để tinh chỉnh cục bộ qua công cụ Unsloth Studio. Việc vận hành các mô hình mở như Gemma 4 trên phần cứng Nvidia mang lại hiệu năng tối đa nhờ lõi Tensor chuyên dụng giúp tăng tốc độ xử lý suy luận.

Ngăn xếp phần mềm CUDA đảm bảo khả năng tương thích rộng rãi trên các khung làm việc hàng đầu, cho phép dòng mô hình mới mở rộng quy mô hoạt động từ thiết bị biên đến máy trạm di động mà không yêu cầu quá trình tinh chỉnh phức tạp.

Nguồn: wccftech

MMOSITE - Thông tin công nghệ

Mô hình Google Gemma 4 chính thức hoạt động trên card đồ họa Nvidia RTX

Mô hình nguồn mở Google Gemma 4 hiện hỗ trợ triển khai trên phần cứng Nvidia RTX, cung cấp hiệu năng tối ưu cho các tác vụ AI tự chủ.

tin mới nhất

HKC công bố thông số bộ đôi màn hình RGB Mini LED đầu tiên trên thế giới

AMD ra mắt bộ sưu tập phần cứng giới hạn Valorant VCTCN 2026

AMD ấn định ngày ra mắt vi xử lý máy chủ Zen 6 EPYC

VESA công bố tiêu chuẩn DisplayHDR True Black 1400 cho màn hình OLED thế hệ mới

Xu hướng Build PC tối giản gọi tên KINGMAX DDR5 Horizon

tin liên quan

Valve xác nhận hợp tác cùng NVIDIA, đưa SteamOS tiếp cận đông đảo game thủ PC

NVIDIA chuẩn bị ra mắt GeForce RTX 5060 Ti và RTX 5060 bản 9GB VRAM

Người dùng có thể kích hoạt sớm tính năng Nvidia Dynamic Multi-Frame Generation qua OTA

NVIDIA giới thiệu DGX Spark cho workload AI agent và mô hình 700B tham số

NVIDIA công bố DLSS 5 với công nghệ dựng hình thần kinh thế hệ mới

NVIDIA công bố GPU Feynman với công nghệ xếp chồng 3D và HBM tùy biến