NVIDIA GeForce RTX 4080 sẽ là chiếc card đồ họa flagship thế hệ tiếp theo, NVIDIA cung cấp kiến trúc đồ họa mới nhất dựa trên GPU Ada Lovelace. Card đồ họa này dự kiến sẽ thay thế RTX 3080 – một card đồ họa chơi game rất phổ biến.
Mặc dù không thể phủ nhận sự quan tâm nhiệt tình xung quanh dòng card đồ họa GeForce RTX 4090 cao cấp hơn mang đến hiệu suất chơi game tốt nhất, nhưng dòng card đồ họa RTX 4080 vẫn đủ sức mạnh để các game thủ chuyên nghiệp không nhận ra sự khác biệt, không quá đắt đỏ như dòng RTX 4090 mà vẫn mang lại hiệu suất chơi game rất tốt. Dòng RTX 4090 sẽ hướng đến những người dùng muốn có những thứ tốt nhất mà không lo lắng về số tiền họ đang bỏ ra trong khi dòng RTX 4080 hướng đến những người dùng muốn có hiệu suất chơi game tốt nhất cùng mức giá hợp lí nhất có thể.
GeForce RTX 3080 trước đó đã được chào hàng để cung cấp một số cải tiến lớn so với RTX 2080 và mặc dù tuyên bố đó có hơi phóng đại, có vẻ như RTX 4080 có tiềm năng vượt xa người tiền nhiệm của nó do một số lý do sẽ được làm rõ ràng sau đây.
Bắt đầu với cấu hình GPU, dòng card đồ họa NVIDIA GeForce RTX 4080 được cho là sử dụng lõi GPU AD103. Hãy nghĩ về AD103 như một phiên bản được tối ưu hóa của AD102 nằm giữa GPU AD102 và AD104.
GPU NVIDIA Ada Lovelace AD103 dự kiến sẽ có tối đa 7 GPC (Cụm xử lý đồ họa). Đây là số lượng GPC giống như GPU Ampere GA102 và một GPC bổ sung so với GPU GA103. Mỗi GPU sẽ bao gồm 6 TPC và 2 SM có cùng cấu hình với chip hiện có. Mỗi SM (Bộ xử lý đa luồng) sẽ chứa bốn lõi phụ, cũng giống như GPU GA102. Điều thay đổi là cấu hình lõi FP32 và INT32. Mỗi lõi phụ sẽ bao gồm 128 đơn vị FP32 nhưng các đơn vị FP32 + INT32 kết hợp sẽ tăng lên đến 192. Điều này là do các đơn vị FP32 không chia sẻ cùng lõi phụ như các đơn vị IN32. 128 lõi FP32 tách biệt với 64 lõi INT32.
Vì vậy, tổng cộng, mỗi lõi phụ sẽ bao gồm 32 FP32 cộng với 16 đơn vị INT32 cho tổng số 48 đơn vị. Mỗi SM sẽ có tổng cộng 128 đơn vị FP32 cộng với 64 đơn vị INT32 cho tổng số 192 đơn vị. Và vì có tổng cộng 84 đơn vị SM (12 đơn vị trên mỗi GPC), chúng tôi đang xem xét 10.752 đơn vị FP32 và 5.376 đơn vị INT32 cho tổng số 18.432 lõi. Mỗi SM cũng sẽ bao gồm hai Lịch trình quấn (32 luồng / CLK) cho 64 kết thúc mỗi SM. Đây là mức tăng 50% đối với các lõi (FP32 + INT32) và tăng 33% về Wraps / Threads so với GPU GA102.
Thông số kỹ thuật sơ bộ về GPU NVIDIA Ada Lovelace ‘AD103’ :
GPU Name | AD103 | GA102 | GA103 | TU102 |
---|---|---|---|---|
GPC | 7 (Per GPU) | Same | 1.16x | 1.16x |
TPC | 6 (Per GPC) | Same | 1.20x | Same |
SM | 2 (Per TPC) | Same | Same | Same |
Sub-Core | 4 (Per SM) | Same | Same | Same |
FP32 | 128 (Per SM) | Same | Same | 2x |
FP32+INT32 | 192 (Per SM) | 1.5x | 1.5x | 1.5x |
Warps | 64 (Per SM) | 1.33x | 1.33x | 2x |
Threads | 2048 (Per SM) | 1.33x | 1.33x | 2x |
L1 Cache | 192 KB (Per SM) | 1.5x | 1.5x | 2x |
L2 Cache | 64 MB (Per GPU) | 10.6x | 16x | 10.6x |
ROPs | 32 (Per GPC) | 2x | 2x | 2x |
Chuyển sang bộ nhớ đệm, đây là một phân khúc khác mà NVIDIA đã tăng cường mạnh mẽ so với các GPU Ampere hiện có. GPU Ada Lovelace sẽ đóng gói 192 KB bộ nhớ đệm L1 cho mỗi SM, tăng 50% so với Ampere. Đó là tổng cộng 2,5 MB bộ nhớ đệm L1 trên GPU AD103 hàng đầu. Bộ nhớ đệm L2 sẽ được tăng lên 64 MB như đã đề cập trong các tin rò rỉ. Đây là mức tăng 10,6 lần so với GPU Ampere GA102 chỉ lưu trữ 6 MB bộ nhớ đệm L2. Bộ nhớ đệm sẽ được chia sẻ đến GPU.
Dự đoán về dòng sản phẩm Card đồ họa NVIDIA GeForce RTX 40 Series :
Graphics Card | GPU | PCB Variant | SM Units / Cores | Memory / Bus | Memory Clock / Bandwidth | TGP | Power Connectors |
---|---|---|---|---|---|---|---|
NVIDIA GeForce RTX 4090 Ti | AD102-350? | TBD | 144 / 18432? | 48 GB / 384-bit | 24 Gbps / 1.15 TB/s | ~600W | 1x 16-pin |
NVIDIA GeForce RTX 4090 | AD102-300? | PG137/139 SKU330 | 126 / 16128? | 24 GB / 384-bit | 21 Gbps / 1.00 TB/s | ~450W | 1x 16-pin |
NVIDIA GeForce RTX 4080 | AD103-300? | TBD | >84 / 10752? | 16 GB / 256-bit | 21 Gbps / 672 GB/s | ~350W | 1x 16-pin |
NVIDIA GeForce RTX 4070 | AD104-400? | PG141-310 SKU341 | >60 / 7680 | 12 GB / 192-bit | 18 Gbps / 432 GB/s | ~300W | 1x 16-pin |
Thông số dự kiến của NVIDIA RTX 4080 :
NVIDIA GeForce RTX 4080 sẽ là một cấu hình cắt giảm với nhiều lõi giống như phần GA102 hiện có nhưng được điều chỉnh với tần số cao hơn nhiều hoặc giữa 9000-1000 lõi, điều này hẳn là để chừa chỗ cho biến thể ‘Ti’ trong tương lai với cấu hình hoàn thiện hơn. GPU sẽ đi kèm với 64 MB bộ nhớ đệm L2 và lên đến 224 ROP, điều này đơn giản là điên rồ.
The clock speeds vẫn chưa được xác nhận nhưng xem xét rằng quy trình TSMC 4N đang được sử dụng, chúng tôi mong đợi clocks trong khoảng 2.0-3.0 GHz. Sự gia tăng tốc độ xung nhịp cao hơn bình thường đến từ việc NVIDIA đang thực hiện một bước nhảy khi xem xét các GPU Ampere với mức 8nm của Samsung trên thực tế là một mức quy trình 10nm với một số tối ưu hóa. NVIDIA đang bỏ qua 7nm và đi thẳng vào mức 5nm và thậm chí không phải là biến thể vanilla mà là một phiên bản được tối ưu hóa của nó. Với Pascal trên mức TSMC 16nm, NVIDIA đã mang lại một bước nhảy vọt về tần số và chúng ta có thể mong đợi vào khoảng thời gian này.
Về thông số kỹ thuật bộ nhớ, GeForce RTX 4080 dự kiến sẽ cung cấp dung lượng 16 GB GDDR6X có thể đạt tốc độ 21 Gbps nhanh hơn trên giao diện 256-bit bus. Điều này sẽ cung cấp băng thông lên đến 672 GB / s. Giờ đây, tất cả các thông số kỹ thuật được tăng cường này cũng sẽ dẫn đến mức tiêu thụ điện năng cao hơn và chiếc card flagship này dự kiến sẽ hoạt động ở mức TBP khoảng 350W.
Nguồn : wccftech