Loading market data...

NVIDIA CUDA 13.3 Adds Tile-Based GPU Programming in C++

NVIDIA CUDA 13.3 Adds Tile-Based GPU Programming in C++

NVIDIA ka lëshuar CUDA 13.3, një version që sjell programim GPU të bazuar në tile direkt në C++. Përditësimi synon të shfrytëzojë më mirë Tensor Cores duke reduktuar kompleksitetin e shkrimit të kerneleve.

Si funksionon programimi i bazuar në tile

Programimi i bazuar në tile e ndan një llogaritje në blloqe të vogla me madhësi fikse të quajtura tile. Këto tile përputhen me modelet e brendshme të rrjedhës së të dhënave të GPU-së, duke e bërë më të lehtë mbajtjen e hardware-it të zënë. Në versionet e mëparshme të CUDA-s, zhvilluesit duhet ta menaxhonin vetë atë hartë. Tani përpiluesi e trajton atë, të paktën për shumë modele të zakonshme.

Tensor Cores janë hardware i specializuar brenda GPU-ve NVIDIA që përshpejtojnë operacionet e shumëzim-akumulimit të matricave. Ato janë thelbësore për trajnimin dhe inferencën e AI. Por për të marrë performancë maksimale prej tyre, shpesh kërkohej akordim manual i ndërlikuar. Abstraksioni i tile-ve në CUDA 13.3 automatikisht ndan operacionet e matricave në tile në mënyrë që ato të prekin Tensor Cores më shpesh. Zhvilluesit shkruajnë kod më të thjeshtë dhe përsëri marrin xhiro të mirë.

Zhvillimi i kerneleve bëhet më i thjeshtë

Një nga pikat më të dhimbshme në programimin GPU është menaxhimi i threads, memories së përbashkët dhe sinkronizimit. Modeli i ri i bazuar në tile i abstrakton ato detaje. Në vend që të shkruhet një kernel që krijon mijëra threads dhe koordinon qasjen e tyre në memorien e përbashkët, një programues mund ta shprehë llogaritjen si operacione mbi tile. Përpiluesi CUDA më pas i harton ato tile në hardware-in themelor. Kjo duhet të zvogëlojë gabimet dhe të përshpejtojë zhvillimin, veçanërisht për ekipet e reja në llogaritjen GPU.

Disponueshmëria

CUDA 13.3 është tashmë i disponueshëm për shkarkim nga faqja e zhvilluesve të NVIDIA-s. Ai mbështet të gjitha arkitekturat aktuale të GPU-ve NVIDIA, duke përfshirë linjat Hopper dhe Blackwell. Zhvilluesit mund të fillojnë të eksperimentojnë me API-në e bazuar në tile menjëherë.

Përditësimi nuk i vjetëron qasjet e vjetra, por vendos një rrugë të re të paracaktuar për shkrimin e kodit efikas GPU. Nëse komuniteti më i gjerë do ta miratojë shpejt këtë do të varet nga sa mirë përpiluesi i harton operacionet e tile-ve në hardware-in real — dhe nëse performanca përputhet me kernelet e akorduara manualisht në ngarkesat kritike të punës.