Phòng thí nghiệm trí tuệ nhân tạo Trung Quốc DeepSeek, với mô hình trí tuệ nhân tạo R1 đã gây sốt, khi có quyền truy cập vào hàng chục nghìn GPU của NVIDIA để đào tạo. DeepSeek R1 là một trong những mô hình AI tiên tiến nhất trên thế giới và ngang hàng với các nền tảng hàng đầu của Mỹ như o1 của OpenAI và Llama của Meta.
Các chip Hopper của NVIDIA là GPU được sử dụng rộng rãi nhất trên thế giới. Những thông tin chi tiết mới nhất đã được chia sẻ bởi người sáng lập kiêm CEO của Scale AI, Alexandr Wang trong một cuộc phỏng vấn với CNBC vào đầu tuần này, với Wang nói thêm rằng R1 đã đáp ứng hoặc đánh bại tất cả các mô hình AI có hiệu suất cao nhất trong bài kiểm tra AI đầy thách thức nhất của công ty ông.
Khi được hỏi về cuộc cạnh tranh AI giữa Hoa Kỳ và Trung Quốc, Wang bình luận rằng “thực tế từ lâu cho thấy Hoa Kỳ đã dẫn trước”. Tuy nhiên, ông nói thêm rằng các mô hình mới nhất của DeepSeek đang cố gắng thay đổi phép tính.
Sau đó, cuộc trò chuyện chuyển sang số lượng GPU mà DeepSeek và các công ty AI Trung Quốc có thể có cho các mô hình AI của họ. GPU của NVIDIA là một trong những sản phẩm được săn đón nhiều nhất trên thế giới do tiềm năng của chúng, hoạt động xuất khẩu của chúng cũng được chính phủ Hoa Kỳ quản lý. Dòng GPU Hopper thế hệ hiện tại của công ty bao gồm GPU H100 và H200.
Sự khác biệt chính giữa hai mẫu GPU này là tốc độ xung nhịp bộ nhớ và dung lượng của chúng. Chính quyền Biden đã hạn chế việc bán các GPU này cho Trung Quốc vào năm 2022.
Theo Wang, khi nói đến việc người Trung Quốc tiếp cận các GPU tiên tiến của NVIDIA, “thực tế là có và không. Bạn biết đấy, các phòng thí nghiệm của Trung Quốc, họ có nhiều H100 hơn những gì mọi người nghĩ.” Ông nói thêm và chia sẻ rằng “hiểu biết của ông là DeepSeek có khoảng năm mươi nghìn H100”. Wang đã nêu rõ, “rõ ràng là họ không thể tiết lộ điều đó vì nó vi phạm các biện pháp kiểm soát xuất khẩu mà Hoa Kỳ đã áp dụng”.
Nguồn: wccftech