HomeMobileGemini Live: Trợ lý AI có thể “tương tác” trực tiếp trên...

Gemini Live: Trợ lý AI có thể “tương tác” trực tiếp trên màn hình và nói chuyện tự nhiên hơn

Published on

Google vừa công bố loạt tính năng mới cho Gemini Live – trợ lý AI hội thoại thời gian thực. Điểm nổi bật là khả năng tô sáng trực tiếp trên màn hình khi dùng camera, giúp người dùng dễ dàng nhận diện vật thể hoặc công cụ mà AI đang nhắc tới.

Tính năng trực quan đầu tiên trên Pixel 10

Theo công bố, tính năng mới sẽ xuất hiện cùng dòng Pixel 10 ra mắt ngày 28/8. Google cũng sẽ bắt đầu triển khai cho các thiết bị Android khác ngay trong thời điểm đó, trước khi mở rộng sang iOS trong vài tuần kế tiếp.

gemini-live-tro-ly-ai-co-the-tuong-tac-truc-tiep

Tích hợp sâu hơn với ứng dụng hệ thống

Gemini Live sắp có khả năng tương tác với nhiều ứng dụng như Tin nhắn, Điện thoại và Đồng hồ. Người dùng có thể chuyển mạch hội thoại một cách linh hoạt. Ví dụ: khi đang hỏi đường nhưng nhận ra mình sẽ trễ hẹn, bạn có thể nói: “Lộ trình này ổn rồi. Giờ hãy nhắn cho Alex rằng tôi sẽ đến muộn 10 phút”. Ngay lập tức, Gemini sẽ soạn tin nhắn và gửi đi thay bạn.

Giọng nói AI ngày càng giống người thật

Google đồng thời tung ra mô hình âm thanh mới cho Gemini Live, hứa hẹn cải thiện mạnh mẽ cách AI mô phỏng ngữ điệu, nhịp điệu và cao độ trong giọng nói. Trợ lý có thể tự điều chỉnh tông giọng phù hợp với ngữ cảnh, chẳng hạn trở nên nhẹ nhàng hơn khi trả lời những câu hỏi liên quan đến chủ đề căng thẳng.

Gemini Live will place a box around what it wants you to look at.

Người dùng còn có thể tùy chỉnh tốc độ nói – nhanh hoặc chậm – tương tự như cách ChatGPT cho phép thay đổi phong cách giọng đọc. Đặc biệt, nếu bạn yêu cầu Gemini kể lại một câu chuyện theo phong cách kịch tính hay dưới góc nhìn của một nhân vật lịch sử, AI thậm chí có thể sử dụng giọng điệu hoặc chất giọng đặc biệt để tạo nên trải nghiệm kể chuyện sinh động.

Với những cải tiến này, Gemini Live đang dần tiến gần hơn tới hình mẫu một trợ lý ảo toàn năng, vừa hiểu ngữ cảnh, vừa tương tác trực quan, vừa biết “thổi hồn” vào từng cuộc trò chuyện.

Nguồn: theverge

tin mới nhất

AMD Instinct MI355X vượt mốc 1 triệu token mỗi giây trong bài kiểm tra MLPerf 6.0

GPU AMD Instinct MI355X đạt hơn 1 triệu token/giây tại MLPerf 6.0, khẳng định...

Người dùng có thể kích hoạt sớm tính năng Nvidia Dynamic Multi-Frame Generation qua OTA

Tính năng Nvidia Dynamic Multi-Frame Generation có thể được kích hoạt sớm qua bản...

Lexar hướng tới lưu trữ AI, kỷ niệm 30 năm

Đánh dấu cột mốc ba thập kỷ phát triển, Lexar không chỉ nhìn lại...

Bo mạch chủ Asus ROG X870E APEX đạt mức ép xung DDR5-8800 trên Ryzen 9 9950X3D2

Asus ROG X870E APEX vừa thể hiện khả năng ép xung bộ nhớ đạt...

DJI ra mắt flycam Avata 360 hỗ trợ quay video 360 độ 8K HDR 60fps

DJI chính thức giới thiệu thiết bị bay không người lái Avata 360 với...

tin liên quan

Google tích hợp công cụ tạo ảnh Nano Banana vào ứng dụng Maps

Mã nguồn mới cho thấy Google đang thử nghiệm...

Google mở rộng tương thích AirDrop cho điện thoại Android trong năm 2026

Google xác nhận tính năng chia sẻ tệp tương...

Google trở thành đối tác đám mây ưu tiên của Apple

Tuyên bố mới từ Google về việc trở thành...

Chip Tensor của Google dự báo tăng trưởng mạnh nhất 2026

Google và Samsung được dự báo sẽ ngược dòng...