HomeCông NghệAWS và NVIDIA công bố Hợp tác chiến lược để cung cấp...

AWS và NVIDIA công bố Hợp tác chiến lược để cung cấp cơ sở hạ tầng, phần mềm và dịch vụ siêu máy tính mới cho nhu cầu  Generative AI 

Published on

Tại sự kiện AWS re:Invent, Amazon Web Services,  Inc. (AWS) – một công ty con của Amazon.com, Inc. (NASDAQ: AMZN) và NVIDIA  (NASDAQ: NVDA) hôm nay đã công bố việc mở rộng hợp tác chiến lược để cung cấp  cơ sở hạ tầng, phần mềm và dịch vụ tiên tiến nhất nhằm hỗ trợ những đổi mới về trí  tuệ nhân tạo tạo sinh (Generative AI) cho khách hàng của họ. 

Các công ty này skết hp nhng công nghtt nht ca NVIDIA và AWS—tcác hthng đa node mi nht ca NVIDIA bao gm GPU, CPU và phn mm AI thế htiếp  theo, đến các gii pháp bo mt và o hóa nâng cao ca AWS Nitro System, kết ni  Elastic Fabric Adapter (EFA) cũng như UltraCluster khnăng mrng—lý tưởng cho  vic đào to các mô hình nn tng và xây dng các ng dng Generative AI.

Shp tác mrng được xây dng da trên mi quan hlâu dài đã thúc đy knguyên Generative AI bng cách cung cp cho nhng người tiên phong vhc máy  (ML) sm hiu sut tính toán cn thiết đnâng cao tính năng tiên tiến trong các  công nghnày. 

NVIDIA DGX Cloud image result MMOSITE - Thông tin công nghệ, review, thủ thuật PC, gaming

Như mt phn ca shp tác mrng nhm tăng cường AI có khnăng to ra siêu  năng lc trên tt ccác ngành: 

  • AWS slà nhà cung cp đám mây đu tiên đưa Siêu chip NVIDIA GH200  Grace Hopper vi công nghNVLink đa nút mi lên đám mây. Nn tng đa  nút NVIDIA GH200 NVL32 kết ni 32 Siêu chip Grace Hopper vi công nghNVIDIA NVLink và NVSwitch vào mt phiên bn. Nn tng này scó sn trên  các phiên bn Amazon Elastic Computing Cloud (Amazon EC2) được kết ni  vi mng mnh m(EFA) ca Amazon, được htrbi o hóa nâng cao (AWS  Nitro System) và phân cm siêu quy mô (Amazon EC2 UltraClusters), cho  phép các khách hàng chung mrng quy mô ti hàng nghìn siêu chip GH200. 
  • NVIDIA và AWS scng tác đlưu trNVIDIA DGX Clouddch vđào to  AI ca NVIDIA—trên AWS. Đây slà Đám mây DGX đu tiên có GH200 NVL32,  cung cp cho các nhà phát trin bnhdùng chung ln nht trong mt phiên  bn duy nht. DGX Cloud trên AWS stăng tc đào to AI tiên tiến và các mô  hình ngôn ngln có thđt ti hơn 1 nghìn ttham s
  • NVIDIA và AWS đang hp tác trong Project Ceiba đxây dng siêu máy tính  AI htrGPU nhanh nht thế gii – mt hthng quy mô ln vi kết ni  GH200 NVL32 và Amazon EFA do AWS tchc cho nhóm nghiên cu và phát  trin ca NVIDIA. Siêu máy tính đu tiên này – có 16.384 Siêu chip NVIDIA  GH200 và có khnăng xlý 65 exaflop AI – sđược NVIDIA sdng đthúc  đy làn sóng đi mi AI to sinh tiếp theo ca mình. 
  • AWS sgii thiu thêm ba phiên bn Amazon EC2 mi: phiên bn P5e, được  htrbi NVIDIA H200 Tensor Core GPUs, dành cho khi lượng công vic AI  và HPC tng hp quy mô ln và tiên tiến, cũng như các phiên bn G6 và G6e,  được htrbi NVIDIA L4 GPUs NVIDIA L40S GPUs, tương ng, dành cho  mt lot ng dng như tinh chnh AI, suy lun, khi lượng công vic đha và video. Phiên bn G6e đc bit thích hp đphát trin quy trình làm vic 3D,  bn sao kthut svà các ng dng khác sdng NVIDIA Omniverse, mt  nn tng đkết ni và xây dng các ng dng 3D tng hp htrAI. 

“AWS và NVIDIA đã hp tác hơn 13 năm, bt đu vi phiên bn đám mây GPU đu  tiên trên thế gii. Ngày nay, chúng tôi cung cp nhiu gii pháp GPU NVIDIA nht  cho khi lượng công vic bao gm đha, chơi game, đin toán hiu năng cao,  machine learning và giđây là AI tng hp” Adam Selipsky – Giám đốc điều hành của  AWS chia sẻ. “Chúng tôi tiếp tc đi mi vi NVIDIA đbiến AWS trthành nơi chy  GPU tt nht, kết hp Siêu chip NVIDIA Grace Hopper thế htiếp theo vi mng  mnh mEFA ca AWS, phân cm siêu quy mô ca EC2 UltraClusters và khnăng o  hóa nâng cao ca Nitro.” 

Jensen Huang – người sáng lập và Giám đốc điều hành của NVIDIA cho biết: “Generative AI đang chuyn đi khi lượng công vic trên đám mây và đt đin toán  tăng tc làm nn tng cho vic to ra ni dung đa dng”.

“Được thúc đy bi smnh  chung là cung cp AI to hin đi, tiết kim chi phí cho mi khách hàng, NVIDIA và  AWS đang cng tác trên toàn bhthng đin toán, mrng cơ shtng AI, thư vin tăng tc, mô hình nn tng cho đến các dch vAI tng hp ” 

Các phiên bn Amazon EC2 mi kết hp công nghtiên tiến nht tNVIDIA và  AWS 

AWS slà nhà cung cp đám mây đu tiên cung cp Siêu chip NVIDIA GH200 Grace  Hopper vi công nghNVLink đa nút. Mi Superchip GH200 kết hp CPU Grace da  trên Arm vi GPU kiến trúc NVIDIA Hopper trên cùng mt mô-đun. Mt phiên bn  Amazon EC2 duy nht vi GH200 NVL32 có thcung cp bnhdùng chung lên ti  20 TB đcung cp năng lượng cho khi lượng công vic quy mô Terabyte. 

What is Amazon AWS EC2? – Elastic Compute Cloud | AllCode

Các phiên bn này stn dng kết ni Elastic Fabric Adapter (EFA) thế hthba ca  AWS, cung cp tc đlên ti 400 Gbps trên mi Superchip vi thông lượng mng có đtrthp, băng thông cao, cho phép khách hàng mrng quy mô lên ti hàng  nghìn Siêu chip GH200 trong EC2 UltraClusters. 

Các phiên bn AWS vi GH200 NVL32 scung cp cho khách hàng quyn truy cp  theo yêu cu vào hiu năng cp siêu máy tính, điu này rt quan trng đi vi khi  lượng công vic AI/ML quy mô ln cn được phân phi trên nhiu nút cho khi lượng  công vic AI tng hp phc tp—tri dài FM, hthng đxut và cơ sdliu vectơ

Các phiên bn EC2 chy trên nn tng NVIDIA GH200 scó bnhHBM3e 4,5 TB— tăng 7,2 ln so vi các phiên bn EC2 P5d chy trên nn tng H100 thế hhin ti— cho phép khách hàng chy các mô hình ln hơn, đng thi ci thin hiu sut đào  to. Ngoài ra, kết ni bnhCPU-GPU cung cp băng thông cao hơn ti 7 ln so vi  PCIe, cho phép giao tiếp gia chip vi chip giúp mrng tng bnhkhdng cho  các ng dng. 

Phiên bn AWS vi GH200 NVL32 slà cơ shtng AI đu tiên trên AWS có tính  năng làm mát bng cht lng nhm giúp đm bo các giá máy chdày đc có thhot đng hiu quvi hiu sut ti đa. 

Các phiên bn EC2 vi GH200 NVL32 cũng sđược hưởng li tHthng AWS  Nitro, nn tng cơ bn cho các phiên bn EC2 thế htiếp theo. Hthng Nitro gim  ti I/O cho các chc năng tCPU/GPU chsang phn cng chuyên dng đmang li  hiu sut n đnh hơn, đng thi bo mt nâng cao bo vmã và dliu ca khách  hàng trong quá trình xlý. 

AWS ln đu tiên lưu trđám mây bng NVIDIA DGX Cloud htrbi Grace  Hopper 

NVIDIA Launches DGX Cloud, Giving Every Enterprise Instant Access to AI  Supercomputer From a Browser | NVIDIA Newsroom

AWS shp tác vi NVIDIA đlưu trNVIDIA DGX Cloud được htrbi cơ shtng GH200 NVL32 NVLink. NVIDIA DGX Cloud là dch vsiêu máy tính AI giúp  doanh nghip truy cp nhanh vào siêu máy tính đa nút đđào to các mô hình LLM và AI to sinh phc tp nht, vi phn mm NVIDIA AI Enterprise tích hp và quyn  truy cp trc tiếp vào các chuyên gia AI ca NVIDIA. 

Siêu máy tính dán ln Ceiba được sdng đtăng cường phát trin AI ca  NVIDIA 

Siêu máy tính Project Ceiba mà AWS và NVIDIA đang xây dng sđược tích hp vi  các dch vAWS, chng hn như mng mã hóa Amazon Virtual Private Cloud (VPC)  và blưu trkhi hiu sut cao ca Amazon Elastic Block Store, cho phép NVIDIA  truy cp vào bkhnăng AWS toàn din. 

NVIDIA ssdng siêu máy tính đnghiên cu và phát trin nhm ci tiến AI cho  LLM, đha và mô phng, sinh hc kthut s, robot, xe tlái, dđoán khí hu  Earth-2, v.v. 

NVIDIA và AWS nâng cp mnh mGenerative AI, HPC, Thiết kế và Mô phng Đhtrquá trình phát trin, đào to và suy lun ca các LLM ln nht, các phiên  bn AWS P5e scó GPU H200 mi nht ca NVIDIA cung cp bnhGPU HBM3e  141 GB, ln hơn 1,8 ln và nhanh hơn 1,4 ln so vi GPU H100. Stăng cường bnhGPU này, cùng vi tc đkết ni mng EFA lên ti 3.200 Gbps do Hthng AWS  Nitro htr, scho phép khách hàng tiếp tc xây dng, đào to và trin khai các mô  hình tiên tiến ca htrên AWS. 

Đcung cp các gii pháp tiết kim năng lượng, tiết kim chi phí cho khi lượng công  vic video, AI và đha, AWS đã công bcác phiên bn Amazon EC2 G6e mi có GPU  NVIDIA L40S và phiên bn G6 được htrbi GPU L4. Các dch vmi có thgiúp  các công ty khi nghip, doanh nghip và nhà nghiên cu đáp ng nhu cu vAI và  đha có đtrung thc cao. 

Phiên bn G6e được xây dng đxlý các khi lượng công vic phc tp như AI to  sinhvà ng dng bn sao kthut s. Bng cách sdng NVIDIA Omniverse, mô  phng 3D quang hc có thđược phát trin, ngcnh hóa và nâng cao bng cách sdng dliu thi gian thc tcác dch vnhư AWS IoT TwinMaker, chatbot thông  minh, trlý, tìm kiếm và tóm tt. Amazon Robotics và Amazon Fulfillment Center scó thtích hp cp song sinh kthut sđược xây dng bng NVIDIA Omniverse và  AWS IoT TwinMaker đti ưu hóa thiết kế và quy trình kho hàng, đào to thêm trlý  robot thông minh hơn và ci thin vic giao hàng cho khách hàng. 

GPU L40S cung cp hiu sut FP8 lên ti 1,45 petaflop và có lõi Ray Tracing cung  cp hiu sut dò tia lên ti 209 teraflop. GPU L4 có trong các phiên bn G6 smang  li gii pháp tiết kim năng lượng, chi phí thp hơn đtrin khai các mô hình AI nhm  xlý ngôn ngtnhiên, dch ngôn ng, phân tích hình nh và video AI, nhn dng  ging nói và cá nhân hóa. GPU L40S cũng tăng tc khi lượng công vic đha,  chng hn như to và hin thđha thi gian thc, cht lượng đin nh và phát trc  tuyến trò chơi. Tt cba phiên bn sđược bán ra trong năm ti. 

Phn mm NVIDIA trên AWS tăng cường phát trin AI sáng to

Ngoài ra, NVIDIA đã công bphn mm trên AWS đthúc đy quá trình phát trin  Generative AI. NVIDIA NeMo Retriever microservice scung cp các công cmi  đto ra chatbot và công ctng hp có đchính xác cao bng cách sdng khnăng truy xut ngnghĩa được tăng tc. NVIDIA BioNeMo, đã có mt trên Amazon  SageMaker và sp có mt trên AWS trên NVIDIA DGX Cloud scho phép các công ty  dược phm tăng tc đphát trin thuc bng cách đơn gin hóa và tăng tc vic đào  to các mô hình bng cách sdng dliu ca chính h

Phn mm NVIDIA trên AWS đang giúp Amazon mang đến nhng ci tiến mi cho  các dch vvà hot đng ca mình. AWS đang sdng NVIDIA NeMo framework đđào to các LLM Amazon Titan thế htiếp theo được chn lc. Amazon Robotics đã  và đang tn dng NVIDIA Omniverse Isaac đxây dng bn sao kthut snhm tđng hóa, ti ưu hóa và lp kế hoch cho các kho ttrca mình trong môi trường o  trước khi trin khai chúng vào thế gii thc.

tin mới nhất

AMD Instinct MI300X hiện là GPU nhanh nhất theo điểm chuẩn OpenCL của Geekbench

Điểm chuẩn đầu tiên của GPU Instinct MI300X 192 GB của AMD trong phần...

Samsung công bố Galaxy Watch FE, cấu hình hấp dẫn nhưng vẫn có mức giá dễ chịu

Hôm nay, Galaxy Watch FE chính thức được Samsung giới thiệu, đây là một...

SMIC của Trung Quốc đánh bại GlobalFoundries và trở thành nhà sản xuất chip lớn thứ 3 thế giới

Nhà sản xuất chip lớn nhất Trung Quốc, SMIC đã vươn lên vị trí...

Ransomware tái xuất hiện ở Việt Nam: các bước để đảm bảo an toàn

Các cơ quan, tổ chức, doanh nghiệp đang đối mặt với hàng loạt mối...

MediaTek đang phát triển chip ARM cho Microsoft

Microsoft đang nỗ lực đưa Windows-on-ARM trở thành xu hướng phổ biến với loạt...

tin liên quan