Google vừa công bố loạt tính năng mới cho Gemini Live – trợ lý AI hội thoại thời gian thực. Điểm nổi bật là khả năng tô sáng trực tiếp trên màn hình khi dùng camera, giúp người dùng dễ dàng nhận diện vật thể hoặc công cụ mà AI đang nhắc tới.
Tính năng trực quan đầu tiên trên Pixel 10
Theo công bố, tính năng mới sẽ xuất hiện cùng dòng Pixel 10 ra mắt ngày 28/8. Google cũng sẽ bắt đầu triển khai cho các thiết bị Android khác ngay trong thời điểm đó, trước khi mở rộng sang iOS trong vài tuần kế tiếp.

Tích hợp sâu hơn với ứng dụng hệ thống
Gemini Live sắp có khả năng tương tác với nhiều ứng dụng như Tin nhắn, Điện thoại và Đồng hồ. Người dùng có thể chuyển mạch hội thoại một cách linh hoạt. Ví dụ: khi đang hỏi đường nhưng nhận ra mình sẽ trễ hẹn, bạn có thể nói: “Lộ trình này ổn rồi. Giờ hãy nhắn cho Alex rằng tôi sẽ đến muộn 10 phút”. Ngay lập tức, Gemini sẽ soạn tin nhắn và gửi đi thay bạn.
Giọng nói AI ngày càng giống người thật
Google đồng thời tung ra mô hình âm thanh mới cho Gemini Live, hứa hẹn cải thiện mạnh mẽ cách AI mô phỏng ngữ điệu, nhịp điệu và cao độ trong giọng nói. Trợ lý có thể tự điều chỉnh tông giọng phù hợp với ngữ cảnh, chẳng hạn trở nên nhẹ nhàng hơn khi trả lời những câu hỏi liên quan đến chủ đề căng thẳng.

Người dùng còn có thể tùy chỉnh tốc độ nói – nhanh hoặc chậm – tương tự như cách ChatGPT cho phép thay đổi phong cách giọng đọc. Đặc biệt, nếu bạn yêu cầu Gemini kể lại một câu chuyện theo phong cách kịch tính hay dưới góc nhìn của một nhân vật lịch sử, AI thậm chí có thể sử dụng giọng điệu hoặc chất giọng đặc biệt để tạo nên trải nghiệm kể chuyện sinh động.
Với những cải tiến này, Gemini Live đang dần tiến gần hơn tới hình mẫu một trợ lý ảo toàn năng, vừa hiểu ngữ cảnh, vừa tương tác trực quan, vừa biết “thổi hồn” vào từng cuộc trò chuyện.
Nguồn: theverge



