Black Forest Labs phát hành bộ mô hình FLUX.2 với công nghệ lượng tử hóa FP8, giúp giảm tải VRAM và tăng 40% hiệu suất trên GPU NVIDIA RTX.
Phòng thí nghiệm nghiên cứu AI Black Forest Labs vừa chính thức công bố FLUX.2, dòng mô hình tạo sinh hình ảnh thế hệ mới với nhiều cải tiến vượt bậc về công nghệ và tính năng. Phiên bản này được tích hợp các công cụ tiên tiến, bao gồm khả năng đa tham chiếu (multi-reference) cho phép tạo ra hàng chục biến thể hình ảnh tương tự nhau với độ chi tiết chân thực và khả năng hiển thị phông chữ rõ ràng hơn ngay cả ở quy mô lớn.

Hình ảnh được tạo bởi FLUX.2 đạt độ phân giải lên đến 4 megapixel, tái tạo ánh sáng và vật lý thực tế nhằm loại bỏ cảm giác nhân tạo thường thấy trên các sản phẩm AI trước đây. Các mô hình mới cũng bổ sung tính năng kiểm soát tư thế trực tiếp, giúp người dùng chỉ định cụ thể dáng điệu của chủ thể hoặc nhân vật.
Khả năng hiển thị văn bản cũng được nâng cấp để văn bản trở nên sạch sẽ và dễ đọc trên các thiết kế đồ họa thông tin, màn hình giao diện người dùng và nội dung đa ngôn ngữ. Đặc biệt, tính năng đa tham chiếu cho phép nghệ sĩ chọn tối đa sáu hình ảnh mẫu để giữ nhất quán về phong cách hoặc chủ thể, loại bỏ nhu cầu tinh chỉnh mô hình phức tạp.
Thách thức phần cứng và giải pháp tối ưu hóa
Mặc dù sở hữu năng lực xử lý ấn tượng, FLUX.2 đặt ra yêu cầu phần cứng rất cao. Mô hình này vận hành với 32 tỷ tham số, đòi hỏi tới 90GB VRAM để tải hoàn toàn. Ngay cả khi sử dụng chế độ lowVRAM, mức yêu cầu vẫn nằm ở con số 64GB, vượt quá khả năng của hầu hết các card đồ họa tiêu dùng hiện nay.

Để giải quyết rào cản này và mở rộng khả năng tiếp cận, NVIDIA đã hợp tác cùng Black Forest Labs và ComfyUI để thực hiện lượng tử hóa mô hình sang định dạng FP8. Giải pháp này giúp giảm 40% yêu cầu về bộ nhớ VRAM trong khi vẫn giữ được chất lượng hình ảnh tương đương, đồng thời cải thiện hiệu suất xử lý thêm 40%.
Hỗ trợ trên nền tảng ComfyUI và GPU GeForce
NVIDIA cũng phối hợp với ComfyUI, ứng dụng phổ biến để chạy các mô hình AI tạo sinh trên máy tính cá nhân, nhằm cải thiện tính năng giảm tải RAM (weight streaming). Tính năng nâng cấp này cho phép người dùng chuyển một phần dữ liệu mô hình sang bộ nhớ hệ thống, giúp mở rộng bộ nhớ khả dụng trên GPU.

Mặc dù việc sử dụng bộ nhớ hệ thống có tốc độ chậm hơn so với bộ nhớ GPU, giải pháp này cho phép các dòng card GeForce RTX có thể vận hành được mô hình FLUX.2 một cách hiệu quả. Hiện tại, người dùng có thể trải nghiệm ngay các mô hình mới bằng cách cập nhật ComfyUI và sử dụng các mẫu FLUX.2 có sẵn, hoặc tải xuống trọng số mô hình trực tiếp từ trang Hugging Face của Black Forest Labs. Các tối ưu hóa cho điểm kiểm tra (checkpoints) FP8 cũng đã được hoàn thiện để đảm bảo hiệu năng tốt nhất trên hệ sinh thái phần cứng của NVIDIA.



