Nvidia Vera keičia DI serverių architektūros kryptį

Duomenų centrai retai pasikeičia per vieną naktį. Tačiau kai taip nutinka, tai išduoda jų ūžesys. Stelažai tampa tankesni. Delsa mažėja. Sąnaudos persiskirsto. Nvidia stato už tai, kad šis ūžesys netrukus turės naują vardą: Vera.

Nvidia teigia, kad Vera užtikrina maždaug 1,8 karto didesnį našumą nei pirmaujantys x86 lustai. Tai pagrindinė žinia. O ją palaikanti aparatinė įranga yra tai, nuo ko prasideda tikroji diskusija. Vera yra Vera Rubin platformos CPU dalis, jungianti ARM pagrindu sukurtą procesorių su Rubin GPU darbo krūviams, kuriems reikia itin didelio atminties pralaidumo ir glaudaus CPU bei GPU koordinavimo.

Kodėl Vera keičia požiūrį į DI serverius

Vera sukurta naudojant 88 Olympus branduolius su Spatial Multithreading technologija, todėl viename lizde siūlo 176 gijas. Atmintis čia nėra antraeilis elementas: vieną CPU galima derinti su iki 1,5 terabaito LPDDR5X atminties, pasiekiant apie 1,2 terabaito per sekundę pralaidumą. DI inferencijai ir agentiniams modeliams, kurie intensyviai apdoroja kontekstą bei svorius, toks pralaidumas tampa išlikimo rodikliu.

Pagalvokite apie mastą. Nvidia pademonstravo Vera CPU Rack sprendimą, kuriame viename korpuse telpa 256 CPU. Tai reiškia 22 528 branduolius ir 45 056 gijas. Būtent tokio tankio siekia debesijos paslaugų teikėjai, bandydami perkelti didelius modelius iš brangių vien tik GPU salų į lankstesnes, į CPU labiau orientuotas architektūras.

Vera taip pat puikiai dera su Rubin GPU. NVL72 konfigūracija sujungia 36 Vera CPU su 72 Rubin GPU, o Nvidia pabrėžia 1,8 terabaito per sekundę NVLink-C2C jungtį tarp jų. Tikslas nėra pakeisti GPU, bet pertvarkyti pagrindinio procesoriaus ir spartintuvo santykį taip, kad duomenys judėtų greičiau, o programinė įranga susidurtų su mažiau siaurų vietų.

Naudojimo sritys pažįstamos, bet sparčiai plečiasi: agentinis DI, pastiprinamasis mokymasis, sudėtinga analitika ir mastelio DI inferencija. Vera gali veikti kaip savarankiškas skaičiavimo mazgas tokioms užduotims arba kaip pagrindinis procesorius, kuris užtikrina Rubin GPU apkrovimą duomenimis ir sinchronizavimą.

Diegimas jau prasidėjo. Anthropic, OpenAI ir SpaceXAI įsipareigojo naudoti šią platformą savo modelių darbo krūviams, o hipermastelio debesijos dalyviai, tokie kaip ByteDance, CoreWeave ir Oracle Cloud Infrastructure, taip pat prisijungė. Sistemų pusėje Dell, HP, Lenovo ir Supermicro siūlys Vera pagrindu sukurtus serverius. Didieji gamintojai, įskaitant Asus, Compal, Foxconn, Gigabyte, Pegatron, Quanta Cloud Technology, Wistron ir Wiwynn, gamins aparatinę įrangą, sukurtą aplink šį lustą.

Dėmesį rodo net netradiciniai klientai. Niujorko vertybinių popierių birža, per dieną apdorojanti maždaug 1,1 trilijono pranešimų, kartu su partneriais Redpanda ir HP nagrinėja Vera galimybes iš naujo įvertinti delsai jautrią infrastruktūrą. Toks susidomėjimas rodo, kad platforma vertinama ne tik modelių mokymui; į ją žiūrima ir kaip į sprendimą realaus laiko, didelio pralaidumo sistemoms, kuriose svarbi kiekviena mikrosekundė.

Nvidia atveju Vera pratęsia jau pažįstamą strategiją: patirtį, sukauptą diegiant į GPU orientuotus DI sprendimus, pritaikyti CPU projektavimui. Anksčiau bendrovė savo DI patirtį integravo į tokius produktus kaip RTX Spark, kuris į dėmesio centrą iškėlė Grace CPU ir Blackwell GPU su LPDDR5X atmintimi. Dabar pokalbis pasislinko nuo vieno mazgo GPU našumo prie visos sistemos balanso ir pralaidumo.

Ar Vera išstums x86 iš duomenų centrų? Ne per vieną naktį. Tačiau ši architektūra taikosi į konkrečias DI darbo krūvių problemas: atminties pralaidumą, gijų tankį ir greitą CPU bei GPU jungtį. Inžinieriams ir architektams, kurie sprendžia modelių sąnaudų ir pralaidumo klausimus, tai yra praktiška pradžia.

Austėja Kavaliauskaitė

„Technologijos visada mane žavėjo – nuo išmaniųjų telefonų iki dirbtinio intelekto proveržių. Džiaugiuosi galėdama dalintis naujienomis su jumis kiekvieną dieną.“

Nvidia Vera keičia DI serverių architektūros kryptį

Kodėl Vera keičia požiūrį į DI serverius

Palikti komentarą

Komentarai