Hôm nay, Google đã công bố Gemini, đây là mô hình AI mới của Bard. Ngay từ đầu, nó đã được xây dựng theo hướng multimodal và do đó, nó có thể khái quát hóa và hiểu các loại thông tin khác nhau – văn bản, hình ảnh, âm thanh, video và mã – cùng một lúc. Điều này cho phép nó phân tích các sắc thái tốt hơn và giúp trả lời các câu hỏi liên quan đến các chủ đề phức tạp tốt hơn. Vì vậy, nó đặc biệt hữu ích trong việc giải thích lý luận trong những môn học phức tạp như toán và vật lý.
Gemini có ba kích cỡ – Ultra, Pro và Nano. Ultra là “mô hình lớn nhất và mạnh mẽ nhất cho các tác vụ có độ phức tạp cao”, Pro là “mô hình tốt nhất để mở rộng quy mô trên nhiều tác vụ”, trong khi Nano là “mô hình tối ưu nhất cho các tác vụ trên thiết bị”.
Gemini Ultra có thể hiểu, giải thích và tạo mã chất lượng cao bằng Python, Java, C++ và Go. Nó có thể hoạt động trên nhiều ngôn ngữ và suy luận về những thông tin phức tạp. Nó vượt trội trong một số tiêu chuẩn mã hóa, bao gồm HumanEval và Natural2Code, bộ dữ liệu nội bộ của Google, sử dụng các nguồn do tác giả tạo thay vì thông tin dựa trên web.
Bard AI của Google hiện đang sử dụng “fine-tuned version” của Gemini Pro. Google cho biết điều này sẽ mang lại cho Bard khả năng “lý luận, lập kế hoạch, hiểu biết nâng cao và hơn thế nữa”.
Người dùng có thể dùng thử Bard với Gemini Pro ngay hôm nay, dựa trên văn bản bằng tiếng Anh ở 170 vùng lãnh thổ, không phải Châu Âu (sắp ra mắt), trong khi đầu năm tới Gemini Ultra sẽ mang đến “trải nghiệm Bard Advanced”.
Nguồn: gsmarena