HomeCông NghệNVIDIA vẽ ra tương lai của “AI Compute” với sự góp mặt...

NVIDIA vẽ ra tương lai của “AI Compute” với sự góp mặt của Silicon Photonics & 3D GPU/DRAM Stacking

Published on

NVIDIA đã trình bày phương pháp tiếp cận của mình với các bộ tăng tốc AI thế hệ tiếp theo, giới thiệu cách triển khai “silicon photonic” sáng tạo tại hội nghị IEDM 2024.

Với các kỹ thuật hiện đại, ngành công nghiệp bán dẫn đã đạt đến điểm mà nhu cầu đổi mới là rất cấp thiết, vì nhu cầu điện toán AI đang tăng mạnh theo thời gian. Bất cứ khi nào có cuộc thảo luận về tương lai của bao bì, quang tử silicon (SiPh) là một phương pháp được coi là giải pháp thay thế khả thi cho các phương pháp thông thường.

Điều thú vị là tại hội nghị IEDM 2024, NVIDIA đã trình bày một chiến lược độc đáo (thông qua Ian Cutress) cho các bộ tăng tốc thế hệ tiếp theo, bao gồm sử dụng một SiPh interpose và xếp chồng các ô GPU theo chiều dọc cho một sản phẩm điện toán lớn như vậy.

nvidia-ve-ra-tuong-lai-cua-ai-compute

Việc triển khai của Team Green đề xuất tích hợp các silicon xen kẽ quang tử, thay thế các kết nối điện hiện có. Việc sử dụng SiPh mang lại một số lợi ích, như cấp băng thông cao hơn và độ trễ thấp hơn, cùng với việc là phương pháp tiết kiệm năng lượng hơn nhiều so với các phương pháp khác. Không chỉ các bộ xen kẽ, mà NVIDIA còn có kế hoạch sử dụng 12 SiPh trong giao tiếp nội chip và liên chip, tối ưu hóa luồng dữ liệu giữa các ô GPU riêng lẻ, điều này rất quan trọng đối với khả năng mở rộng và hiệu suất.

Điều thú vị là kỹ thuật xếp chồng GPU lại trở thành tâm điểm hấp dẫn nhất trong tầm nhìn của NVIDIA, vì công ty đã tiết lộ việc sử dụng “xếp chồng 3D” hoặc xếp chồng nhiều ô GPU theo chiều dọc, để tăng mật độ chip và giảm diện tích chiếm dụng. Team Green gọi cấu hình này là “tầng GPU”, với bốn ô GPU trong một tầng, tất cả được xếp chồng theo chiều dọc, để giảm độ trễ kết nối và có thể triển khai cổng nguồn. Không chỉ có GPU, mà NVIDIA cũng sẽ xếp chồng chip DRAM 3D.

AL22 Rong slide 920 1 MMOSITE - Thông tin công nghệ

Nhà phân tích Ian Cutress nhận thấy việc triển khai các công nghệ này sẽ diễn ra trong vòng năm năm tới, có thể là từ năm 2028 đến năm 2030, do quá trình phát triển rất phức tạp.

Nguồn: wccftech

tin mới nhất

Vi xử lý Intel Core Ultra 7 251HX đạt điểm PassMark ngang ngửa 255HX

Vi xử lý 18 lõi Intel Core Ultra 7 251HX vừa ghi nhận điểm...

CHẤT ÂM PHÒNG THU – RAZER SEIREN V3 PRO

RAZER SEIREN V3 PRO là microphone điện động phân khúc chuyên nghiệp hỗ trợ...

Yandex báo cáo: Website du lịch Thành phố Đà Nẵng ghi nhận hơn 1,1 triệu lượt tương tác

Cổng thông tin du lịch Thành phố Đà Nẵng (Danang Fantasticity) của Sở Văn...

Hãng xe BYD ra mắt trạm sạc siêu tốc Flash Charger tại châu Âu

BYD giới thiệu hệ thống trạm sạc Flash Charger tại châu Âu, hỗ trợ...

Google giảm giá gói cước AI Plus và tăng dung lượng đám mây

Google chính thức giảm giá gói đăng ký AI Plus xuống còn 5 USD...

tin liên quan

NVIDIA chuẩn bị ra mắt GeForce RTX 5060 Ti và RTX 5060 bản 9GB VRAM

NVIDIA dự kiến giới thiệu hai phiên bản GeForce...

Người dùng có thể kích hoạt sớm tính năng Nvidia Dynamic Multi-Frame Generation qua OTA

Tính năng Nvidia Dynamic Multi-Frame Generation có thể được...

NVIDIA giới thiệu DGX Spark cho workload AI agent và mô hình 700B tham số

NVIDIA công bố DGX Spark, nền tảng máy trạm...

NVIDIA công bố DLSS 5 với công nghệ dựng hình thần kinh thế hệ mới

DLSS 5 nâng cấp chất lượng đồ họa bằng...

NVIDIA công bố GPU Feynman với công nghệ xếp chồng 3D và HBM tùy biến

NVIDIA tiết lộ thêm chi tiết về nền tảng...