HomeAI NVIDIA ra mắt model LATTE3D có khả năng biến văn bản...

[GTC 2024] NVIDIA ra mắt model LATTE3D có khả năng biến văn bản thành hình ảnh 3D

Published on

NVIDIA vừa đẩy nhanh quá trình biến đổi các mô tả văn bản thành hình dạng 3D chất lượng cao với mô hình AI tạo sinh mới có tên là LATTE3D

Mô hình LATTE3D, giống như một máy in 3D ảo, chuyển đổi các lời nhắn văn bản thành biểu diễn 3D của đối tượng và động vật chỉ trong vòng một giây.

Các hình dạng được tạo ra có thể dễ dàng được sử dụng trong môi trường ảo để phát triển trò chơi video, chiến dịch quảng cáo, dự án thiết kế, hoặc làm bãi đào tạo ảo cho robot.

Sanja Fidler, phó chủ tịch nghiên cứu AI tại NVIDIA, cho biết: “Một năm trước, mô hình AI mất một giờ để tạo ra các hình ảnh 3D có chất lượng này — và hiện tại, trạng thái của nghệ thuật giờ đây là khoảng 10 đến 12 giây. Chúng tôi giờ đây có thể tạo ra kết quả nhanh hơn gấp mười lần, đưa việc tạo hình 3D từ văn bản đến gần thực tế hơn cho các nhà sáng tạo từ nhiều ngành nghề.”

LATTE3D có thể tạo ra hình dạng 3D gần như tức thì khi chạy suy luận trên một GPU đơn, như NVIDIA RTX A6000.

Thay vì bắt đầu thiết kế từ đầu hoặc tìm kiếm trong thư viện thông tin 3D, người sáng tạo có thể sử dụng LATTE3D để tạo ra các đối tượng chi tiết càng nhanh càng tốt.

Mô hình này tạo ra một số lựa chọn hình dạng 3D dựa trên mỗi lời nhắn văn bản, cung cấp cho người sáng tạo nhiều lựa chọn. Các đối tượng được chọn có thể được tối ưu hóa để có chất lượng cao hơn trong vài phút. Sau đó, người dùng có thể xuất hình dạng vào các ứng dụng phần mềm đồ họa hoặc nền tảng như NVIDIA Omniverse.

NVIDIA đã huấn luyện LATTE3D sử dụng GPU NVIDIA A100 Tensor Core. Ngoài hình dạng 3D, mô hình cũng được huấn luyện trên các lời nhắn văn bản đa dạng được tạo ra bằng ChatGPT để cải thiện khả năng xử lý các cụm từ mà người dùng có thể nghĩ ra để mô tả một đối tượng 3D cụ thể.

NVIDIA Research bao gồm hàng trăm nhà khoa học và kỹ sư trên toàn thế giới, với các nhóm tập trung vào các chủ đề bao gồm AI, đồ họa máy tính, thị giác máy tính, xe tự lái và robot.

tin mới nhất

Nghịch lý Game Việt: Vươn tầm thế giới nhưng “hụt hơi” trên đường đua doanh thu

Ngành công nghiệp game Việt Nam đang đứng trước một ngưỡng cửa kỳ lạ....

TCL CSOT phát triển màn hình chế độ kép với tần số quét lên đến 640Hz

TCL CSOT đang phát triển màn hình chế độ kép mới, nổi bật với...

FUJISOFT ỨNG DỤNG AI VÀ NỀN TẢNG AMD NÂNG CẤP HỆ THỐNG AN TOÀN CÔNG NGHIỆP

Fujisoft phát triển hệ thống an ninh AI trên nền tảng AMD Embedded+, giúp...

ASUS RA MẮT CÁP NGUỒN ROG EQUALIZER BẢO VỆ ĐẦU NỐI CARD ĐỒ HỌA

Asus giới thiệu cáp nguồn ROG Equalizer chuẩn ATX 3.1, giúp cân bằng tải...

GPU INTEL ARC PRO B70 TIÊU THỤ 720W TRONG TÁC VỤ SUY LUẬN AI

Thử nghiệm của Hardware Luxx xác nhận cụm bốn card Intel Arc Pro B70...

tin liên quan

Người dùng có thể kích hoạt sớm tính năng Nvidia Dynamic Multi-Frame Generation qua OTA

Tính năng Nvidia Dynamic Multi-Frame Generation có thể được...

NVIDIA giới thiệu DGX Spark cho workload AI agent và mô hình 700B tham số

NVIDIA công bố DGX Spark, nền tảng máy trạm...

NVIDIA công bố DLSS 5 với công nghệ dựng hình thần kinh thế hệ mới

DLSS 5 nâng cấp chất lượng đồ họa bằng...

NVIDIA công bố GPU Feynman với công nghệ xếp chồng 3D và HBM tùy biến

NVIDIA tiết lộ thêm chi tiết về nền tảng...