HomeAICông cụ AI mới của Microsoft mang tên VASA-1 với khả năng...

Công cụ AI mới của Microsoft mang tên VASA-1 với khả năng tạo video từ hình ảnh đáng kinh ngạc (hay đáng lo)

Published on

Trong bối cảnh công nghệ AI ngày càng tiên tiến, Microsoft vừa giới thiệu một công cụ mới có khả năng tạo ra video từ một bức ảnh duy nhất, đánh dấu một bước tiến ấn tượng (và đáng sợ) trong lĩnh vực này. Công cụ này có tên là VASA-1, là mô hình AI chuyển đổi từ ảnh sang video có thể sinh ra video chỉ từ một bức ảnh và một đoạn âm thanh nói, với các chuyển động mặt và môi được đồng bộ hóa cùng với “một loạt nét mặt tinh tế và chuyển động đầu tự nhiên, góp phần làm tăng tính chân thực và sống động.”

Trên trang web nghiên cứu của mình, Microsoft giải thích cách thức hoạt động của công nghệ này. “Những đổi mới cốt lõi bao gồm mô hình tạo động lực khuôn mặt toàn diện và chuyển động đầu hoạt động trong không gian tiềm ẩn của khuôn mặt, cùng với sự phát triển của không gian tiềm ẩn khuôn mặt biểu cảm và tách biệt này dựa trên video. Thông qua các thí nghiệm rộng rãi bao gồm đánh giá trên một loạt các tiêu chuẩn mới, chúng tôi cho thấy phương pháp của mình vượt trội hơn hẳn các phương pháp trước đây theo nhiều chiều cạnh khác nhau. Phương pháp của chúng tôi không chỉ cung cấp chất lượng video cao với động lực khuôn mặt và đầu thực tế mà còn hỗ trợ tạo video trực tuyến 512×512 lên đến 40 FPS với độ trễ khởi động gần như không đáng kể, mở đường cho sự tương tác thời gian thực với các avatar sống động mô phỏng hành vi giao tiếp của con người.”

 

Nói cách khác, công cụ này có khả năng tạo ra video deepfake dựa trên một bức ảnh đơn lẻ. Đáng chú ý là Microsoft khẳng định công cụ này chỉ là “một minh chứng nghiên cứu và không có kế hoạch phát hành sản phẩm hay API.” Dường như trong một nỗ lực để giảm bớt lo ngại, công ty cho biết VASA-1 sẽ không sớm được đưa vào tay người dùng.

Từ AI Sora đến Will Smith ăn mỳ Ý, chúng ta đã chứng kiến nhiều nội dung video do AI tạo ra với đủ mọi hình thức kỳ lạ và tuyệt vời (nhưng hầu hết là kỳ lạ), và chúng chỉ sẽ càng trở nên chân thực hơn.

tin mới nhất

NVIDIA tiết lộ ChatRTX được hỗ trợ bởi LLM, giúp tìm kiếm hình ảnh và nhận dạng giọng nói

NVIDIA vừa tiết lộ chatbot AI ChatRTX độc quyền, đây là một sản phẩm...

Adobe công bố Firefly Image 3, công cụ AI sáng tạo dựa trên hình ảnh đời thực

Hiện nay, chúng ta có thể bắt gặp rất nhiều công cụ hình ảnh...

Chatbot AI của Roblox có thể giúp các nhà phát triển sáng tạo game

Roblox Assistant đã được công bố tại Roblox Developers Conference (RDC), chatbot này có...

NVIDIA và Meta thúc đẩy sức mạnh AI với mô hình ngôn ngữ Llama 3

NVIDIA hôm nay đã công bố việc tối ưu hóa trên tất cả các...

Galaxy AI sắp có mặt trên dòng Galaxy S22, Tab S8 và các dòng điện thoại gập 2022

Dòng S24 đã ra mắt cùng Galaxy AI, bộ công cụ AI được tùy...

tin liên quan