NVIDIA patvirtina Rubin — kitos kartos AI architektūrą su HBM4 ir chiplet dizainu

NVIDIA generalinis direktorius Jensen Huang patvirtino, kad įmonė aktyviai rengia savo kitos kartos Rubin dirbtinio intelekto architektūrą TSMC. Vidaus dokumentuose apibūdinamas kaip revoliucinis žingsnis skaičiavimų srityje, Rubin reiškia iš esmės pertvarkytą NVIDIA duomenų centro architektūrą — nuo atminties ir litografijos iki pakuotės ir tarpusavio jungčių. Huang nurodė, kad NVIDIA jau atliko šešių Rubin lustų tape-out, kurie šiuo metu yra TSMC gamyklose ir ruošiasi bandomajam gamybos etapui.

Ką paskelbė Jensen Huang

Savo vizito Taivane metu Huang vietos žiniasklaidai sakė, kad Rubin yra "labai pažengęs" ir kad šeši atskiri Rubin lustai buvo užbaigti (tape-out) ir perduoti TSMC. Tai apima naujus CPU ir GPU die'us bei specializuotus silicinius sprendimus skalei ir ryšiui. Paskelbimas rodo plataus masto platformos atnaujinimą, o ne tik paviršinį patobulinimą.

Lustai, patvirtinti tape-out

Dedikuotas CPU die
Kitos kartos GPU (laukiama R100 šeima)
Scale-up NVLink perjungiklis didesnės pralaidumo daugia-GPU skalavimui
Silicio fotonikos procesorius optiniam I/O
Papildomi interposer/tilto die'ai chiplet integracijai palaikyti
Pakuotės ir perjungimo logikos lustai

Techninės savybės ir naujovės

Rubin apjungia kelis reikšmingus patobulinimus AI skaičiavimams. NVIDIA planuoja naudoti HBM4 atmintį R100 GPU varikliams, tai yra žymus žingsnis už dabartinio HBM3E standarto ribų. Dizainas remsis TSMC 3 nm klasės N3P procesu ir pažangia CoWoS-L pakuote. Svarbu tai, kad Rubin pereina prie chiplet architektūros — tai pirmas toks NVIDIA sprendimas tokio masto — ir naudoja 4x retikle išdėstymą, palyginti su Blackwell maždaug 3,3x retikliu, leidžiantį didesnes bendras die sritis ir modularų mastelio didinimą. Silicio fotonikos procesoriaus ir scale-up NVLink perjungiklio integracija pabrėžia dėmesį didelės pralaidumo ir mažo delsos tarpusavio jungtims paskirstytoms AI apkrovoms.

Palyginimas: Rubin prieš Blackwell ir Hopper

Tuo tarpu, kai Blackwell Ultra (GB300) atstovavo trumpalaikį NVIDIA dabartinės gairės viršūnę, Rubin siekia būti kartos šuoliu, panašiu į tai, ką anksčiau atnešė Hopper. Rubin pereinant prie chipletų, HBM4, N3P ir CoWoS-L pakuotės reiškia našumo, energinio efektyvumo ir skalavimo patobulinimus tiek treniravimui, tiek inferencijai. Architektūriniai pokyčiai yra gilesni nei paprastas procesų mazgo atnaujinimas — jie liečia atminties architektūrą, fizinę pakuotę ir tarpusavio jungčių topologiją.

Privalumai ir taikymo sritys

Rubin yra optimizuotas didelio masto AI treniravimui, masyviems kalbos modeliams ir aukštos spartos skaičiavimams, kai atminties pralaidumas ir tarpusavio ryšys tampa ribojančiais veiksniais. Silicio fotonika ir scale-up NVLink perjungiklis daro Rubin patraukliu sprendimu hyperscaleriams ir verslo AI klasteriams, kuriems reikalinga tanki ir mazos delsos tinklo infrastruktūra. Chiplet požiūris taip pat gali pagerinti išeigą ir pagreitinti skirtingų SKU pateikimą į rinką, skirtų treniravimui, inferencijai ir kraštinių (edge) serverių pagreičiui.

Rinkos svarba ir laiko juosta

Atsižvelgiant į tape-out ir TSMC bandomąją gamybą, Rubin komercinis debiutas preliminariai tikimasi 2026–2027 metais, priklausomai nuo kvalifikacijos ir išeigos didinimo. Debesų paslaugų tiekėjams, OEM gamintojams ir AI infrastruktūros tiekėjams Rubin žymi strategišką tašką: jis gali pertvarkyti našumo etalonus AI serverių rinkoje ir paskatinti naujus aparatūros atnaujinimus duomenų centruose.

Išvada

NVIDIA Rubin, panašu, gali tapti kertine architektūra: derindama HBM4 atmintį, TSMC 3 nm procesą, chipletų modularumą, CoWoS-L pakuotę ir optinį I/O, ji siekia pateikti pažangesnę platformą AI ir HPC užduotims. Kadangi šeši tape-out jau yra TSMC, pramonė atidžiai stebės bandomąją gamybą, kai Rubin artės prie tikėtino 2026–2027 m. paleidimo.

Viltė Petrauskaitė

Sveiki! Esu Viltė, kasdien sekanti technologijų naujienas iš viso pasaulio. Mano darbas – pateikti jums svarbiausius ir įdomiausius IT pasaulio įvykius aiškiai ir glaustai.