8 Minutės
OpenAI žengia arčiau savo specializuotų dirbtinio intelekto (DI) procesorių kūrimo. Bendrovė sudarė didelės apimties, daugelio milijardų dolerių vertės susitarimą su Broadcom dėl pritaikytų lustų projektavimo, kuriuos planuoja diegti savo duomenų centruose, reaguodama į smarkiai augančius skaičiavimo poreikius.
Didelis statymas ant pritaikyto silicio
Remiantis pranešimais, OpenAI ir Broadcom pradėjo bendradarbiauti prieš maždaug 18 mėnesių ir neseniai įformino susitarimą, kurio tikslas – aprūpinti maždaug 10 gigavatų (GW) skaičiavimo talpos specialiais lustais. Wall Street Journal ir kiti leidiniai šį susitarimą apibūdino kaip vertą kelių milijardų dolerių; tokie pinigai būtų skirti tiek pritaikyto aparatūros dizainui, tiek ilgalaikei tiekimo grandinei OpenAI sparčiai augančiai infrastruktūrai.
Pritaikyti DI lustai (angl. custom AI silicon arba ASIC) leidžia optimizuoti našumą, energijos suvartojimą ir kainą vienetui skaičiavimo. Tokie sprendimai dažnai apima aparatūros ir programinės įrangos bendrą projektavimą (hardware-software co-design), didelės spartos atminties sąsajas (pavyzdžiui, HBM), pažangias jungčių topologijas ir pakavimo technologijas (chiplets, multi-die pakavimas). Tokiu būdu specializuoti DI procesoriai gali pasiekti geresnio performance-per-watt rodiklių nei bendro paskirtis skirtos grafikos plokštės tam tikroms mokymosi arba inferencijos užduotims.
Tokio dydžio susitarimas su Broadcom taip pat rodo, kad OpenAI siekia kontrolės ir stabilumo tiekimo grandinėje bei galimybės derinti aparatūros ypatybes su savo mokomaisiais modeliais. Nors detalės apie lustų architektūrą ir naudojamas gamybos technologijas oficialiai neatskleidžiamos, pramonėje dažnai užsimenama, kad aukščiausios klasės DI lustai gali pasinaudoti pažangiais gamybos procesais (pvz., 5 nm ar mažesniais mazgais), specializuotais neuroniniais varikliais ir didelio pralaidumo atmintimi. Tokių sprendimų kūrimas taip pat reiškia didelius inžinerinius išteklius – nuo fizinio projektavimo (layout), per testavimą (verification), iki programinės įrangos optimizacijos ir duomenų centro integracijos.
Grafikas, mastas ir kas laukia duomenų centruose
Broadcom turėtų pradėti montuoti aparatūros stakles ant lentynų ir instaliuoti rack’us antroje 2026 m. pusėje, o lustų projektavimas ir gamyba gali tęstis iki 2029 m. pabaigos. Toks etapinis diegimo planas atspindi tai, kaip įprastai vyksta debesų ir DI infrastruktūros plėtra: pirmiausia vykdomi ankstyvieji diegimai ir testavimai, o vėliau – pilno masto pajėgumų išaugimas.
Diegimo etapai dažnai apima kelis svarbius komponentus: prototipų bandymus ir validaciją, šilumos valdymo sprendimų įdiegimą (pvz., skysčio aušinimas ar užsandarintos kameros), elektros tiekimo ir tinklo paruošimą (aukštos galios laidai, transformatoriai, PDU), fizinių centrų (colocation) paruošimą ir ilgalaikius energijos tiekimo susitarimus. Kiekvienas etapas reikalauja koordinacijos tarp lustų tiekėjo, duomenų centro operatoriaus ir programinės įrangos komandos, kuri optimizuoja modelius pagal naują aparatūrą.
- Sutarties apimtis: pranešama apie kelių milijardų dolerių vertės kontraktą maždaug 10 GW lustų.
- Diegimas: rack’ų montavimas prasideda 2026 m. II pusėje.
- Dizainas/gamyba: tikėtina tęstis iki 2029 m. pabaigos.

Kaip tai dera su partnerystėmis su Nvidia ir AMD
OpenAI užtikrina skaičiavimo galimybes iš kelių tiekėjų. Pranešimuose nurodoma, kad Nvidia įsipareigojo tiekti infrastruktūrą – žiniasklaidoje minimos skaičiavimo apimtys susietos su maždaug 10 GW, o AMD pranešama sutarusi aprūpinti apie 6 GW. Kai kuriuose ataskaitose teigiama, kad OpenAI jau sumokėjo dešimtis milijardų dolerių AMD ir net gali būti pozicionuojama kaip reikšmingas šios įmonės akcininkas arba strateginis partneris.
Kodėl keli partneriai? Daugialypė tiekėjų strategija mažina tiekimo grandinės riziką, leidžia diversifikuoti aparatūros architektūras ir spartina plėtrą tuo metu, kai vienas tiekėjas negalėtų patenkinti milžiniškos paklausos. Be to, skirtingi akceleratoriai (GPU, TPU, pritaikyti ASIC) pasižymi skirtingomis stiprybėmis: vieni geresni modelių mokymui (training), kiti – inferencijai ar mažesnės delsos užklausoms.
Toks heterogeninis požiūris taip pat reikalauja suderintos programinės įrangos sluoksnio — bibliotekų, tvarkyklių ir optimizavimo įrankių, kurie gebėtų paskirstyti darbus tarp skirtingų architektūrų. Tai apima modelių šardavimo (model sharding), duomenų šardavimo (data parallelism) strategijas bei tinklo komunikacijos (RDMA, NVLink ar panašių sprendinių) integraciją, kad būtų sumažintas tarpusavio komunikacijos kaštas ir didintas bendra našumo sparta.
Ambicingas poreikis: 250 GW per aštuonerius metus
OpenAI vadovas Sam Altman darbuotojams nurodė, kad per artimiausius aštuonerius metus kompanijai gali prireikti maždaug 250 gigavatų skaičiavimo pajėgumo. Norint tai suprasti, 250 GW — tai maždaug penktadalis visos Jungtinių Amerikos Valstijų elektros gamybos galios (~1 200 GW). Tokio masto DI infrastruktūros sukūrimas reikalautų milžiniškų investicijų, kurias kai kurie ekspertai įvertina emsiai iki ~10 trilijonų dolerių, kas gerokai viršija bet kurio vieno aparatūros partnerio galimybes finansuoti.
Be didelių tiekėjų įsipareigojimų ir augančių pajamų — žiniasklaidos prognozės OpenAI einamųjų metų pajamoms mini apie 13 mlrd. USD — tokiam plėtros tempui finansuoti prireiks inovatyvių finansavimo mechanizmų ir naujų verslo modelių. Galimos strategijos apima ilgalaikes infrastruktūros nuomos sutartis (hardware-as-a-service), partnerystes su debesų tiekėjais, kapitalo pritraukimą iš institucionalių investuotojų arba net valstybinių ir regioninių energijos projektų įtraukimą siekiant užsitikrinti elektros tiekimą.
Tarp techninių iššūkių yra ir energijos vartojimo efektyvumas (PUE), aušinimo technologijų diegimas bei fizinių duomenų centrų plėtra. Norint pritaikyti 250 GW skaičiavimo pajėgumą, reikės naujų sprendimų: aukštesnės energijos tiekimo infrastruktūros, transformatorių stotelių, pažangios aušinimo architektūros (pvz., panardinimo skystyje arba tiesioginio skysčio aušinimo blokų), taip pat galimybių perdirbti šilumos energiją arba panaudoti ją šildymui ir pramoniniams procesams.
Galiausiai svarbus klausimas yra tvarumas: milžiniškas energijos poreikis kelia reikalavimą derinti plėtrą su atsinaujinančios energijos šaltiniais, ilgalaikėmis elektros pirkimo sutartimis (PPA) ir regionų tinklo modernizacija. Tai ne tik techninė, bet ir politinė bei ekonominė užduotis, reikalaujanti koordinacijos su energetikos bendrovėmis, vietos valdžia ir tarptautiniais partneriais.
Ką reikėtų stebėti toliau
Svarbiausi stebimi žingsniai – Broadcom diegimo etapai (rack’ų išskleidimas nuo 2026 m. II pusės), taip pat papildoma informacija apie pajėgumo pristatymus iš Nvidia ir AMD. Viešos ataskaitos apie pristatytų sistemų kiekį ir veikimą leis įvertinti, ar pritaikyti DI lustai ir daugiašalė tiekėjų strategija gali realiai patenkinti progresuojančią generatyvinio DI paslaugų paklausą.
Be to, verta stebėti tiek gamybos grandinės apribojimus (fabų pajėgumai, pakavimo įmonių resursai), tiek geopolitinius veiksnius (eksporto kontrolė, tarptautiniai ribojimai technologijų perdavimui), kurie gali turėti įtakos lustų tiekimui. Taip pat aktualu sekti kitų didžiųjų technologijų žaidėjų veiksmus: Google jau turi savo TPU liniją, Amazon investuoja į Trainium ir Inferentia sprendimus, o kiti gigantai ir startuoliai taip pat kuria specializuotus akceleratorius.
Programinės įrangos ekosistemos evoliucija — bibliotekos, kompilatoriai, orkestravimo įrankiai (pvz., Kubernetes plėtiniai DI darbo krūviams) — bus lemiamas faktorius, leidžiantis efektyviai išnaudoti heterogeninę aparatūrą. Su kiekvienu nauju aparatūros tipu reikės ir papildomų optimizacijų: tvarkyklių, modelių persirašymo arba automatizuotų optimizavimo įrankių, kurie padės perteikti didelius DI modelius per įvairias architektūras be didelių našumo nuostolių.
Galiausiai, reikėtų stebėti finansinius modelius ir produktų strategijas: ar OpenAI ims pardavinėti skaičiavimo pajėgumą, licencijuoti savo modelius didiesiems verslo klientams, ar sieks išlaikyti vertę per prenumeratas ir platformines paslaugas. Atsakymai į šiuos klausimus parodys, kaip kompanija derins aparatūros investicijas su verslo augimu ir pelningumu.
Apibendrinant, OpenAI ir Broadcom susitarimas yra reikšmingas žingsnis link specializuotos DI aparatūros diegimo platesniu mastu. Tačiau sėkmei reikės ne tik techninio išmanymo — būtini ir stabilūs tiekimo grandinės sprendimai, energijos tiekimo susitarimai, programinės įrangos optimizacijos bei tvarumo strategijos. Ateinančiais metais matysime, ar tokios kombinacijos gali patenkinti eksponentiškai augančią generatyvinio DI paklausą ir kokią įtaką tai turės visai puslaidininkių bei duomenų centrų pramonei.
Šaltinis: smarti

Komentarai
duomix
250 GW??? Skamba kaip mokslinė fantastika, rimtai. Kas mokės už tinklų atnaujinimą ir kur tas ~10 trilijonų? Broadcom įdomu, bet aš šiek tiek skeptiškas...
Palikite komentarą