Bài viết nổi bật

Chi phí đào tạo AI của DeepSeek cao hơn 400 lần so với công bố

Published on

02/02/2025

Quảng cáo

Thị trường AI đã dậy sóng nhiều ngày vừa qua vì mô hình R1 của DeepSeek và mộ trong những yếu tố gây tranh cãi là chi phí đào tạo AI thấp được công ty này công bố nhưng có vẻ như đã có nhiều sự lừa xoanh quanh vấn đề này, vì con số thực tế cao hơn rất nhiều.

Công ty nghiên cứu SemiAnalysis đã tiến hành một phân tích sâu rộng về những bí ẩn của DeepSeek, bác bỏ tuyên bố rằng R1 đã trở nên hiệu quả đến mức các tài nguyên tính toán từ NVIDIA và các công ty khác là không cần thiết.

Trước khi đi sâu vào phần cứng thực tế mà DeepSeek sử dụng, chúng ta hãy cùng xem xét những gì mà ngành công nghiệp nhận thức. Những tuyên bố cho rằng DeepSeek chỉ sử dụng “5 triệu đô la” cho mô hình R1 của mình, ngang với o1 của OpenAI GPT và điều này đã gây ra sự hoảng loạn trong thị trường bán lẻ, được phản ánh qua thị trường chứng khoán Hoa Kỳ. Tuy nhiên, những con số thực tế lại khác xa.

DeepSeek được cho là một dự án phụ của quỹ đầu cơ High-Flyer của Trung Quốc và báo cáo của SemiAnalysis tuyên bố rằng họ đã mua 10.000 đơn vị A100 của NVIDIA vào năm 2021, khi các hạn chế xuất khẩu chưa quá nghiêm ngặt. Sau đó, DeepSeek đã phát triển thành một thực thể riêng biệt kể từ khi công ty mẹ High-Flyer quyết định tách dự án ra và đó là lúc mọi thứ thực sự cất cánh.

chi-phi-dao-tao-ai-cua-deepseek-cao-hon-400-lan

Báo cáo cho biết DeepSeek có khoảng 10.000 GPU AI H800 “dành riêng cho Trung Quốc” của NVIDIA và 10.000 chip AI H100 cao cấp hơn. Hơn nữa, công ty đã đầu tư vào các bộ tăng tốc AI H20 của NVIDIA và họ có một “nhóm” tài nguyên đang được chia sẻ giữa DeepSeek và High-Flyer để “giao dịch, suy luận, đào tạo và nghiên cứu”. Điều này tương đương với khoảng 1,6 tỷ đô la CapEx cho DeepSeek, với chi phí hoạt động được đồn đoán là khoảng 944 triệu đô la. Các con số này tương đương với khoảng bốn trăm lần cao hơn so với thị trường ban đầu nhận định.

ad 4nxdo9s dgh7jmgxca7iokus f mtxprp178laz5 kjcid9kr2skwb50ujp h7nhzpjithftfjfkoz mpljbcjyyvsofjclviyhsewj w5tsesmzswic 3ywrr4oxb4 jrbukkomeuq MMOSITE - Thông tin công nghệ

Để làm rõ, con số ban đầu được cho là “một phần cụ thể” của chi phí đào tạo có thể liên quan đến việc chạy mô hình cuối cùng. Một điều mà DeepSeek thực sự giỏi là tận dụng tài năng địa phương, thông qua các sự kiện tuyển dụng tại các trường đại học hàng đầu Trung Quốc, với mức lương hơn 1,3 triệu đô la cho các nhân viên cụ thể.

Những bộ não đằng sau mô hình R1 của DeepSeek thực sự có khả năng đưa ra một giải pháp hiệu quả để cạnh tranh với những công ty như OpenAI nhưng các số liệu tài chính “báo cáo sai” đã đóng vai trò là chất xúc tác trong sự kiện thiên nga đen tuần trước.

Nguồn: wccftech

Tags
DeepSeek

MMOSITE - Thông tin công nghệ

Bài viết nổi bật

Chi phí đào tạo AI của DeepSeek cao hơn 400 lần so với công bố

Tin mới

Cadence giới thiệu AuraStack AI Super Agent, nền tảng Agentic AI đầu tiên cho PCB

ASRock âm thầm xác nhận card đồ họa Radeon RX 9050 với hai phiên bản 4GB và 8GB

COLORFUL Ra Mắt Laptop Rimbook L1 Plus

AMD Ra Mắt Hệ Sinh Thái Điện Toán Toàn Diện Cho Kỷ Nguyên AI

Biwin M560 PCIe 5.0 SSD: Mang đến cách tiếp cận cân bằng hơn cho lưu trữ thế hệ mới

Snapdragon 8 Elite Gen 6 Pro: Đột phá công nghệ AI Frame Fusion

Mùa Back To School 2026 khác biệt của ASUS

Huawei khởi động chương trình Back To School 2026 “Ready – Set – Sync”

Galaxy Z Fold8 dùng màn hình 4:3, giá từ 46,99 triệu đồng tại Việt Nam

Philips Evnia 32M2N6901A: Màn hình QD-OLED 4K định hình không gian giải trí cao cấp

tin liên quan

DeepSeek từ chối “vắt sữa” người dùng, lối đi khác biệt so với Thung lũng Silicon

Dự án “FlashMLA” mới nhất của DeepSeek cho thấy Trung Quốc không cần các máy gia tốc “tiên tiến” để tiến triển với AI

Các cụm AI của Trung Quốc hoạt động hết công suất khi mô hình AI của DeepSeek ra đời

Phòng thí nghiệm AI DeepSeek của Trung Quốc có đến 50.000 GPU AI NVIDIA H100

AI Trung Quốc DeepSeek đối đầu ChatGPT khi sở hữu 50.000 GPU NVIDIA H100