NVIDIA Rubin Superchip: gamyba, HBM4 ir AI infrastruktūra

NVIDIA Rubin Superchip: gamyba, HBM4 ir AI infrastruktūra

Viltė Petrauskaitė Viltė Petrauskaitė . 2 Komentarai

8 Minutės

GTC 2025 renginyje NVIDIA pirmą kartą viešai pristatė Vera Rubin Superchip — du milžiniškus GPU, sukrautus kartu su Vera CPU ir dideliu kiekiu LPDDR atminties kraštuose. Dabar pranešama, kad Rubin žengia iš laboratorinių demonstracijų į gamybos linijas, o NVIDIA gavo HBM4 atminties mėginius iš visų svarbiausių DRAM gamintojų. Toks poslinkis signalizuoja, kad Rubin projektas gali tapti viena pagrindinių naujos kartos AI platformų dalimi, skirtą hiperskalės duomenų centrams, kuriuose reikalingas aukštas pralaidumas, maža delsos atmintis ir didelis skaičiavimo tankis. Šiame straipsnyje aptariame, ką reiškia Rubin patekimą į gamybą, kokią rolę atlieka TSMC ir HBM4 tiekėjai, bei ką tai gali reikšti AI infrastruktūros ateičiai.

Iš demonstracijos į surinkimo liniją: kas pasikeitė

Per neseną vizitą TSMC, generalinis direktorius Jensen Huang, kaip pranešama, patvirtino, kad Rubin GPU jau pastebėti gamybos linijoje. Tai seka po ankstesnio NVIDIA pranešimo apie laboratorinius pavyzdžius — netikėtai greitas perėjimas nuo prototipo prie matomo gamybinio etapo. Jei šie pranešimai yra tikslūs, tai reiškia, kad laiko grafikas Rubin projektui gali būti spartesnis nei manyta, o tai gali pagreitinti Rubin tapimą pagrindiniu AI akseleratoriumi dideliems duomenų centrams.

Pereinant nuo demonstracijos prie gamybos linijos, pagrindiniai poslinkiai dažnai apima kelis techninius ir logistikos veiksnius: paketo ir aušinimo sprendimų vertinimą, PCB ir interposer dizaino patvirtinimą, taip pat testų automatizavimą, kad būtų užtikrinta aukšta išėjimo kokybė. Rubin Superchip, kuris jungia du galingus GPU su Vera CPU ir LPDDR kraštinėse, reikalauja sudėtingo pakavimo ir integracijos sprendimo, o sėkmingas bandymas gamybos linijoje rodo, kad šie sprendimai pasiekti. Be to, gamybinių eilučių pastebėjimas dažnai reiškia, jog rizikos gamybos (angl. risk-production) ar pilotiniai bėgiai jau vyksta — tai leidžia surinkti realaus pasaulio duomenis apie pralaidumą, galimus defektus ir terminavimo elgesį prieš masinę gamybą.

Nepaisant to, svarbu atskirti ankstyvuosius gamybos etapus nuo faktinės masinės gamybos: pirmieji pavyzdžiai ir pilotinės linijos padeda validuoti silikoną, pakuotes ir gamybos procesus, tačiau plataus masto tiekimai prasideda tik tada, kai tiekimus ir kokybę galima užtikrinti nuosekliai. Rubin atsidūrimas ant gamybos linijos — ypač tokio sudėtingumo projektui — yra reikšmingas žingsnis, bet dar ne galutinė sustojimo stotis. NVIDIA, kol kas, išlaiko diskretiškumą dėl tikslių kiekių ir laiko grafikų, tačiau pranešimai apie gamybos linijų užpildymą jau priviliojo dėmesį iš debesų paslaugų tiekėjų, OEM ir AI tyrimų laboratorijų.

Tiekimo grandinės pokyčiai: TSMC didina pajėgumus, atkeliauja HBM4

NVIDIA Blackwell šeimos produktams poreikis išlieka itin didelis, ir TSMC dirba, kad galėtų patenkinti šį augantį užsakymų srautą. Kaip pranešama, gamybos įmonė padidino savo 3 nm technologijos pajėgumus maždaug 50 %, siekdama palaikyti NVIDIA užsakymus. TSMC prezidentas C. C. Wei patvirtino, kad NVIDIA prašo žymiai daugiau plokštelių (wafers), nors tikslius skaičius jis pavadino „komercine paslaptimi“. Tokie pajėgumų didinimo sprendimai įtraukia tiek gamybinių linijų perskirstymą, tiek tiekimo grandinės optimizavimą, kad būtų sumažintas gamybos trikčių ir vėlavimų rizikos poveikis.

Atminties pusėje NVIDIA, kaip pranešama, gavo HBM4 atminties mėginius iš visų pagrindinių DRAM gamintojų. HBM4 (aukštos pralaidumo atminties ketvirtoji karta) yra sukurta teikti itin platų duomenų pralaidumą ir mažesnę delsa palyginti su tradicinėmis atminties architektūromis — tai būtina treniruojant ir vykdant didelius neuroninius tinklus. Gaunant HBM4 iš kelių tiekėjų, NVIDIA sumažina riziką, susijusią su vieno tiekėjo trūkumu ar pristatymo problemomis, taip pat išlaiko derybines galias dėl kainų ir tiekimo terminų. Daugelio tiekėjų įsitraukimas taip pat leidžia lanksčiai paskirstyti tiekimą tarp įvairių gamybos vietų ir palaikyti stabilesnę tiekimo grandinę, kai vyksta Rubin masinė gamyba.

HBM4 technologija siūlo ne tik didesnį pralaidumą, bet ir galimybes efektyviau spręsti energijos sąnaudų balansą, kai duomenų srautai tarp GPU branduolių ir atminties bloko yra itin dideli. Rubin architektūroje, kur vienas Superchip gali apimti du didžiulius GPU branduolius, HBM4 integracija gali reikšmingai pagerinti treniravimo ir inferencijos efektyvumą, sumažinti atminties užkimšimus ir padidinti skalę, kurią gali pasiekti dideli modeliai. Tokios savybės yra esminės įmonėms, planuojančioms didinti modelių dydį ir eksperimentuoti su daugiasluoksnėmis architektūromis, nes atminties pralaidumo trūkumai dažnai tampa pagrindiniu AI infrastruktūros įkaitimo tašku.

Laikas, masinė gamyba ir ko tikėtis

NVIDIA teigė, kad Rubin gali patekti į masinę gamybą apytiksliai 2026 m. III ketvirtį arba galbūt net anksčiau. Šiame laikotarpyje labai svarbu atskirti rizikos gamybos etapus nuo tikrosios masinės gamybos: pavyzdžiai ir pilotinės linijos padeda patikrinti silicijos elgseną, pakuotės patvarumą ir testavimo automatizaciją, o masinė gamyba yra momentas, kai galima pradėti tiekti didelius kiekius debesų paslaugų tiekėjams, paslaugų integratoriams ir OEM gamintojams.

Tikėtina, kad prieš absoliučią masinę gamybą NVIDIA vykdys kelis papildomus etapų ciklus — funkcinius testus, ilgaamžiškumo (burn-in) bandymus, temperatūros ciklų patikrinimus ir gamybos parametrų optimizavimą. Šie procesai yra būtini, kad Rubin būtų patikimas tiek verslo klientams, tiek kritinėms infrastruktūroms, kur prastovos ar gedimai gali tapti didelėmis finansinėmis našta. Be to, debesų paslaugų teikėjai dažnai reikalauja griežtų sertifikavimo kriterijų, todėl pirkinių grafikai gali priklausyti nuo to, kaip greitai Rubin praeis tiek techninius, tiek operacinius patikrinimus.

Rubin jau susietas su didelėmis komercinėmis statybinėmis žaidynėmis: NVIDIA kelių metų gairės ir apie kelis milijardus dolerių siekianti partnerystė su OpenAI, kaip pranešta, pabrėžia, kad nauji akseleratoriai gali tapti pagrindu kitai didelio masto AI diegimų bangai. Tokie komerciniai įsipareigojimai dažnai reiškia ir didesnį projektų prioritetą tiek gamintojų viduje, tiek gamybos partnerių atžvilgiu, o tai gali paveikti tiek tiekimo grandinės planavimą, tiek prioritetų paskirstymą tarp produktų linijų. Visgi tikroji sėkmė priklausys nuo to, ar NVIDIA sugebės suderinti didelį paklausos lygį su stabiliomis tiekimo grandinėmis ir nuoseklia gamybos kokybe.

Kodėl tai svarbu AI infrastruktūrai

Įsivaizduokite duomenų centrus, kurie plečiasi su Rubin klasės akseleratoriais ir HBM4 atmintimi: didesnis pralaidumas, sutrumpintas treniravimo laikas ir tankesnės inferencijos klasterių konfigūracijos. Tokios charakteristikos leidžia debesų paslaugų tiekėjams ir tyrimų centrams mažinti vieno treniravimo modelio laiką nuo savaičių iki dienų ar net valandų, priklausomai nuo darbo krūvio ir optimizacijų. Be to, didesnis atminties pralaidumas ir mažesnė delsą reiškia efektyvesnį modelių dalių paskirstymą tarp kelių procesorių arba tarp kelių Superchip‘ų viename skaičiavimo mazge.

Debesų paslaugų tiekėjams, lustų gamintojams ir AI laboratorijoms Rubin patekimą į gamybą kartu su TSMC pajėgumų didinimu ir daugiašaliu HBM4 tiekimu vertinti kaip sumažintą užsistovėjimo (angl. bottleneck) ir tiekimo riziką. Kai modelių dydžiai toliau auga, pralaidumo ir atminties spragos tampa ribiniais veiksniais — Rubin ir HBM4 gali prailginti ribą, kiek dideli modeliai gali veikti praktiškai ir ekonomiškai. Be to, tokios platformos skatina inovacijas programinės įrangos lygyje: nauji atminties modeliai, operatorių optimizacijos, skirstymo metodikos ir low-level bibliotekos gali būti kuriamos taip, kad pasinaudotų Rubin architektūros privalumais.

Ar Rubin pasirodys rinkoje spartesniu tempu, ar pereis į konservatyvesnį išleidimo grafiką, tai paveiks konkurenciją tarp GPU, CPU ir specializuotų akseleratorių gamintojų. Spartus išleidimas galėtų smarkiai pakeisti debesų infrastruktūros pasiūlą, priversdamas kitus tiekėjus greičiau reaguoti su savo produktų atnaujinimais. Tuo tarpu lėtesnis ir atsargesnis ciklas leistų konkurentams laukti ir bandyti išvengti didesnių investicijų tol, kol pagrindiniai tiekimo ir patikimumo klausimai bus tikrai išspręsti. Šiuo metu istorija yra apie stiprią paklausą, agresyvų gamyklų palaikymą ir atminties tiekėjus, kurie ruošiami tiekti kitą AI aparatūros kartą, todėl sektoriaus dalyviams verta stebėti šiuos rodiklius planuojant infrastruktūros atnaujinimus.

Šaltinis: wccftech

Sveiki! Esu Viltė, kasdien sekanti technologijų naujienas iš viso pasaulio. Mano darbas – pateikti jums svarbiausius ir įdomiausius IT pasaulio įvykius aiškiai ir glaustai.

Palikite komentarą

Komentarai

DaNoras

na, wow, jei tik tai - Rubin + HBM4 gali išties sumažint treniravimo laikus. Bet klausimas: energija, kainos ir tie tiekimo trikdžiai... bus įdomu sekti, greičio banga ar chaosas?

Tomas

Ar tai tikrai jau gamyboje? Skamba per greitai, dažnai būna 'pilot run' ir vėl atidėlioja. Jei Rubin rimtas, tai būtų didžiulis žingsnis, bet aš dar laukiu patikimų duomenų ir kainų...