HomeAI NVIDIA ra mắt model LATTE3D có khả năng biến văn bản...

[GTC 2024] NVIDIA ra mắt model LATTE3D có khả năng biến văn bản thành hình ảnh 3D

Published on

NVIDIA vừa đẩy nhanh quá trình biến đổi các mô tả văn bản thành hình dạng 3D chất lượng cao với mô hình AI tạo sinh mới có tên là LATTE3D

Mô hình LATTE3D, giống như một máy in 3D ảo, chuyển đổi các lời nhắn văn bản thành biểu diễn 3D của đối tượng và động vật chỉ trong vòng một giây.

Các hình dạng được tạo ra có thể dễ dàng được sử dụng trong môi trường ảo để phát triển trò chơi video, chiến dịch quảng cáo, dự án thiết kế, hoặc làm bãi đào tạo ảo cho robot.

Sanja Fidler, phó chủ tịch nghiên cứu AI tại NVIDIA, cho biết: “Một năm trước, mô hình AI mất một giờ để tạo ra các hình ảnh 3D có chất lượng này — và hiện tại, trạng thái của nghệ thuật giờ đây là khoảng 10 đến 12 giây. Chúng tôi giờ đây có thể tạo ra kết quả nhanh hơn gấp mười lần, đưa việc tạo hình 3D từ văn bản đến gần thực tế hơn cho các nhà sáng tạo từ nhiều ngành nghề.”

LATTE3D có thể tạo ra hình dạng 3D gần như tức thì khi chạy suy luận trên một GPU đơn, như NVIDIA RTX A6000.

Thay vì bắt đầu thiết kế từ đầu hoặc tìm kiếm trong thư viện thông tin 3D, người sáng tạo có thể sử dụng LATTE3D để tạo ra các đối tượng chi tiết càng nhanh càng tốt.

Mô hình này tạo ra một số lựa chọn hình dạng 3D dựa trên mỗi lời nhắn văn bản, cung cấp cho người sáng tạo nhiều lựa chọn. Các đối tượng được chọn có thể được tối ưu hóa để có chất lượng cao hơn trong vài phút. Sau đó, người dùng có thể xuất hình dạng vào các ứng dụng phần mềm đồ họa hoặc nền tảng như NVIDIA Omniverse.

NVIDIA đã huấn luyện LATTE3D sử dụng GPU NVIDIA A100 Tensor Core. Ngoài hình dạng 3D, mô hình cũng được huấn luyện trên các lời nhắn văn bản đa dạng được tạo ra bằng ChatGPT để cải thiện khả năng xử lý các cụm từ mà người dùng có thể nghĩ ra để mô tả một đối tượng 3D cụ thể.

NVIDIA Research bao gồm hàng trăm nhà khoa học và kỹ sư trên toàn thế giới, với các nhóm tập trung vào các chủ đề bao gồm AI, đồ họa máy tính, thị giác máy tính, xe tự lái và robot.

tin mới nhất

Samsung kỳ vọng nhu cầu chip nhớ bùng nổ, hé lộ công nghệ HBM mới

Lãnh đạo Samsung dự báo nhu cầu bộ nhớ từ các công ty AI...

Samsung Display ra mắt công nghệ QD-OLED Penta-Tandem với cấu trúc phát quang 5 lớp

Samsung Display giới thiệu thương hiệu QD-OLED Penta-Tandem, ứng dụng cấu trúc 5 lớp...

AOC ra mắt bộ đôi màn hình gaming 24G4ZR và 27G4ZR tần số quét 260Hz giá rẻ

AOC vừa mở rộng dải sản phẩm màn hình gaming phổ thông với hai...

Colorful giới thiệu X3D AI Turbo, tăng 8% hiệu năng game trên bo mạch chủ CVN 800-series

Tính năng mới từ Colorful giúp tối ưu hóa vi xử lý Ryzen X3D,...

Rò rỉ hiệu năng Intel Core Ultra 5 250K Plus: 18 nhân, xung nhịp đạt 5.3 GHz

Intel Core Ultra 5 250K Plus vừa xuất hiện trên Geekbench, hé lộ cấu...

tin liên quan

AMD: Hạ tầng cần sẵn sàng cho kỷ nguyên Agentic AI

Ông Alexey Navolokin từ AMD nhận định sự trỗi...

NVIDIA tung bộ mô hình Earth‑2 mở hoàn toàn cho dự báo thời tiết AI

NVIDIA ra mắt gia đình mô hình Earth‑2 —...

NVIDIA ra mắt DLSS 4.5 với công nghệ tạo khung hình 6x và Dynamic Frame-Gen

NVIDIA giới thiệu DLSS 4.5 mang đến khả năng...

Khủng hoảng AI trên smartphone và tương lai của giao diện tác nhân

Các công cụ AI hiện tại trên di động...

Máy chủ NVIDIA GB300 dự kiến tăng trưởng mạnh, dẫn đầu hạ tầng AI năm 2026

NVIDIA GB300 dự kiến thống trị thị trường máy...