HomeAIMẫu AI mới nhất của Google có thể sử dụng trình duyệt...

Mẫu AI mới nhất của Google có thể sử dụng trình duyệt web như con người

Published on

Google vừa giới thiệu mẫu trí tuệ nhân tạo Gemini 2.5 Computer Use, một hệ thống có khả năng nhấp chuột, cuộn trang và gõ văn bản trong cửa sổ trình duyệt, cho phép AI tự thao tác trong các giao diện được thiết kế cho con người – chứ không chỉ cho máy.

Gemini 2.5 Computer Use: AI biết “lướt web” và điền biểu mẫu

Theo Google, mô hình này sử dụng năng lực hiểu và suy luận thị giác để phân tích yêu cầu của người dùng, sau đó tự động thực hiện nhiệm vụ – chẳng hạn như điền và gửi biểu mẫu trực tuyến.

mau-ai-moi-nhat-cua-google-su-dung-web-nhu-con-nguoi

Điều này đặc biệt hữu ích khi làm việc với các giao diện người dùng (UI) không có API hoặc kết nối trực tiếp — chẳng hạn trong kiểm thử phần mềm hoặc tự động hóa các quy trình trên web.

Những phiên bản trước của công nghệ này từng được Google thử nghiệm trong AI Mode và Project Mariner, một nguyên mẫu nghiên cứu cho phép AI tự động thao tác trên trình duyệt — ví dụ như thêm sản phẩm vào giỏ hàng dựa trên danh sách nguyên liệu mà người dùng cung cấp.

Cạnh tranh trực tiếp với ChatGPT Agent và Claude

Thông báo này được đưa ra chỉ một ngày sau sự kiện Dev Day của OpenAI, nơi ChatGPT ra mắt tính năng Agent mới cho phép AI tự động hoàn thành các nhiệm vụ phức tạp. Trong khi đó, Anthropic – công ty đứng sau Claude AI – đã tung ra phiên bản có khả năng “sử dụng máy tính” từ năm ngoái.

Google cho biết Gemini 2.5 Computer Use “vượt trội hơn các đối thủ hàng đầu trong nhiều bài kiểm tra web và di động.” Tuy nhiên, khác với ChatGPT Agent hoặc Claude, AI của Google chỉ hoạt động trong trình duyệt web, chứ chưa thể kiểm soát toàn bộ môi trường máy tính.

Công ty lưu ý rằng mô hình này “chưa được tối ưu cho việc điều khiển hệ điều hành ở cấp độ máy tính để bàn,” và hiện chỉ hỗ trợ 13 thao tác cơ bản — bao gồm mở trình duyệt, nhập văn bản, kéo–thả phần tử và cuộn trang.

Cách trải nghiệm mô hình mới

Gemini 2.5 Computer Use hiện được cung cấp cho các nhà phát triển thông qua Google AI Studio và Vertex AI. Ngoài ra, Google còn cung cấp bản demo trên nền tảng Browserbase, nơi người dùng có thể quan sát AI thực hiện các tác vụ như:

  • “Chơi trò 2048”
  • “Duyệt Hacker News để tìm chủ đề đang được tranh luận nhiều nhất”

Các video minh họa mà Google đăng tải cho thấy AI thao tác trực tiếp trong trình duyệt, được tua nhanh gấp ba lần so với tốc độ thực tế.

Bước tiến mới trong tự động hóa tác vụ

Với Gemini 2.5 Computer Use, Google đang mở rộng khả năng của AI từ việc trả lời câu hỏi sang hành động trực tiếp trong môi trường thực – nơi giao diện vốn dành cho con người. Đây là bước tiến quan trọng trong xu hướng “AI tác nhân” (agentic AI), khi AI không chỉ hiểu mà còn thực thi công việc một cách chủ động và trực quan hơn bao giờ hết.

Nguồn: theverge

tin mới nhất

AMD ra mắt vi xử lý máy chủ EPYC 8005 hiệu năng cao

Dòng vi xử lý máy chủ AMD EPYC 8005 mới ra mắt cung cấp...

Kingston Đánh Dấu Cột Mốc Quan Trọng Với 100 Triệu Ổ Cứng SSD SATA A400 Được Xuất Xưởng Trên Toàn Cầu

Kingston Technology, công ty hàng đầu thế giới về các giải pháp bộ nhớ...

Samsung ra mắt màn hình Odyssey G8 OLED 6K, 5K và 4K mới

Samsung giới thiệu ba mẫu màn hình Odyssey G8 OLED cao cấp, nổi bật...

AMD Nâng Tầm Máy Trạm Doanh Nghiệp Với Dòng Vi Xử Lý Ryzen PRO 9000

AMD vừa chính thức công bố dòng vi xử lý máy tính để bàn...

Googlebook cao cấp có thể trang bị chip Intel Panther Lake với 12 nhân Xe3

Tài liệu vận chuyển rò rỉ cho thấy dòng máy tính Googlebook cao cấp...

tin liên quan

Google giới thiệu Gemini Intelligence và máy tính Googlebook tại sự kiện I/O

Google vừa công bố bộ công cụ Gemini Intelligence...

GOOGLE AI MODE MỞ RỘNG TÍNH NĂNG ĐẶT BÀN NHÀ HÀNG TỰ ĐỘNG

Google Search AI Mode chính thức hỗ trợ người...

Google tích hợp công cụ tạo ảnh Nano Banana vào ứng dụng Maps

Mã nguồn mới cho thấy Google đang thử nghiệm...

Google mở rộng tương thích AirDrop cho điện thoại Android trong năm 2026

Google xác nhận tính năng chia sẻ tệp tương...

AMD: Hạ tầng cần sẵn sàng cho kỷ nguyên Agentic AI

Ông Alexey Navolokin từ AMD nhận định sự trỗi...