HomeAICông cụ AI mới của Microsoft mang tên VASA-1 với khả năng...

Công cụ AI mới của Microsoft mang tên VASA-1 với khả năng tạo video từ hình ảnh đáng kinh ngạc (hay đáng lo)

Published on

Trong bối cảnh công nghệ AI ngày càng tiên tiến, Microsoft vừa giới thiệu một công cụ mới có khả năng tạo ra video từ một bức ảnh duy nhất, đánh dấu một bước tiến ấn tượng (và đáng sợ) trong lĩnh vực này. Công cụ này có tên là VASA-1, là mô hình AI chuyển đổi từ ảnh sang video có thể sinh ra video chỉ từ một bức ảnh và một đoạn âm thanh nói, với các chuyển động mặt và môi được đồng bộ hóa cùng với “một loạt nét mặt tinh tế và chuyển động đầu tự nhiên, góp phần làm tăng tính chân thực và sống động.”

Trên trang web nghiên cứu của mình, Microsoft giải thích cách thức hoạt động của công nghệ này. “Những đổi mới cốt lõi bao gồm mô hình tạo động lực khuôn mặt toàn diện và chuyển động đầu hoạt động trong không gian tiềm ẩn của khuôn mặt, cùng với sự phát triển của không gian tiềm ẩn khuôn mặt biểu cảm và tách biệt này dựa trên video. Thông qua các thí nghiệm rộng rãi bao gồm đánh giá trên một loạt các tiêu chuẩn mới, chúng tôi cho thấy phương pháp của mình vượt trội hơn hẳn các phương pháp trước đây theo nhiều chiều cạnh khác nhau. Phương pháp của chúng tôi không chỉ cung cấp chất lượng video cao với động lực khuôn mặt và đầu thực tế mà còn hỗ trợ tạo video trực tuyến 512×512 lên đến 40 FPS với độ trễ khởi động gần như không đáng kể, mở đường cho sự tương tác thời gian thực với các avatar sống động mô phỏng hành vi giao tiếp của con người.”

 

Nói cách khác, công cụ này có khả năng tạo ra video deepfake dựa trên một bức ảnh đơn lẻ. Đáng chú ý là Microsoft khẳng định công cụ này chỉ là “một minh chứng nghiên cứu và không có kế hoạch phát hành sản phẩm hay API.” Dường như trong một nỗ lực để giảm bớt lo ngại, công ty cho biết VASA-1 sẽ không sớm được đưa vào tay người dùng.

Từ AI Sora đến Will Smith ăn mỳ Ý, chúng ta đã chứng kiến nhiều nội dung video do AI tạo ra với đủ mọi hình thức kỳ lạ và tuyệt vời (nhưng hầu hết là kỳ lạ), và chúng chỉ sẽ càng trở nên chân thực hơn.

tin mới nhất

AMD ra mắt phần mềm AI mở ROCm 6.1.3 cùng với GPU Radeon PRO W7900 Dual Slot

AMD đã chính thức ra mắt bộ phần mềm AI tính toán mở ROCm...

Apple M4 sẽ có gấp đôi bộ điều khiển Thunderbolt so với chip M3

Apple M4 vừa được ra mắt trên dòng iPad Pro mới, giới thiệu một...

Audi E-Tron GT 2024 ra mắt với động cơ 912 HP và phạm vi di chuyển lên đến 600 km

Audi đã một lần nữa phá bỏ ranh giới của hiệu suất xe điện...

Zephyr ra mắt GPU GeForce RTX 4070 ITX với màu hồng siêu xinh

Zephyr, nhà sản xuất GPU Trung Quốc, đã tiết lộ phiên bản một quạt...

tin liên quan