ByteDance perka NVIDIA H200: investicija į AI mastą

ByteDance perka NVIDIA H200: investicija į AI mastą

Domantas Čepaitis Domantas Čepaitis . Komentarai

5 Minutės

ByteDance, Kinijos kompanija, valdanti TikTok, saugoma reputacijos dėl spartaus dirbtinio intelekto plėtros, ruošiasi didžiulei NVIDIA dirbtinio intelekto procesorių įsigijimo operacijai, stiprindama generatyviojo dirbtinio intelekto (generatyvusis AI) tyrimus ir infrastruktūrą. Pagal žiniasklaidos pranešimus, įmonė planuoja 2026 m. išleisti apie 100 milijardų juanių (maždaug 14 mlrd. USD) NVIDIA H200 grafinių procesorių (GPU) pirkimui, taip reikšmingai papildydama jau ir taip didelį NVIDIA įrangos parką.

Kodėl NVIDIA GPU vis dar svarbūs

Iš pirmo žvilgsnio toks žingsnis gali atrodyti prieštaringas: ByteDance vysto savo užsakomus lustus kartu su partneriais, tokiais kaip Broadcom ir TSMC, ir tuo pačiu metu masiškai perka užsienio GPU. Tačiau tai lemia tai, kaip skirtingos lustų klasės yra pritaikomos praktikoje. NVIDIA H200 ir panašūs GPU yra optimizuoti sudėtingiems, intensyviems treniravimo darbo krūviams, kurių metu formuojami pagrindiniai (foundation) modeliai — didelės apimties neuroniniai tinklai, kuriuos galima vėliau pritaikyti įvairioms užduotims. Tokie GPU pasižymi didžiule skaičiavimo sparta, dideliu atminties pralaidumu ir specializuotomis matricos skaičiavimo instrukcijomis, kurios pagreitina didžiųjų modelių mokymąsi ir leidžia efektyviai įdiegti paskirstytą treniravimą per daugiasluoksnius duomenų centrus ir interkonektus (pvz., NVLink).

Priešingai, vietinės (in-house) lustų platformos, kurias ByteDance kuria su gamintojais kaip Broadcom ir gamintojais puslaidininkių plokštėms kaip TSMC, dažniau orientuojamos į inference (modelių vykdymą arba aptarnavimą realiu laiku). Inference lustai — tai ASIC, NPU ar kitokios tipinės duomenų centro plokštės — yra optimizuoti energijos vartojimo efektyvumui, latencijai ir kainai vienetui paslaugų aptarnavimo metu. Tai leidžia palaikyti milijonines rekomendacijų, reklamų pateikimo ir moderavimo operacijas realiu laiku programėlėse kaip TikTok, kur greitis, našumas ir sąnaudos yra kritiškai svarbūs.

Nors ambicingi vietiniai dizainai, kurių pasirodymas prognozuojamas 2026 m., gali reikšmingai sumažinti priklausomybę nuo importinių GPU inference sluoksnyje, savos gamybos lustai vargu ar pakeis GPU kaip pagrindinį sprendimą didelių modelių treniravimui. Didelių kalbos ir vizualinių modellerių treniravimas reikalauja plataus masto skaičiavimo išteklių, pažangių programinės įrangos bibliotekų ir suderintų tiekimo grandinių — kur NVIDIA architektūra ir ekosistema (CUDA, cuDNN, ekosistema aplink ML frameworks) šiuo metu turi reikšmingą pranašumą. Todėl ByteDance strategija, apjungianti pritaikytą inference aparatinę įrangą su aukščiausios klasės GPU treniravimui, yra hibridinė prieiga, skirta subalansuoti kaštus, našumą ir kontrolę daugelio sluoksnių dirbtinio intelekto ekosistemoje.

Įmonė jau anksčiau parodė, kad pasirengusi rimtai investuoti į išorinę aparatūrą. Pagal pranešimus, 2025 m. ByteDance į NVIDIA lustus investavo apie 85 milijardus juanių. Tokia apimtis aiškiai atspindi didelio masto poreikį: turėdama rinkos vertę, besiribojančią su maždaug 500 mlrd. USD, ir produktą kaip TikTok, veikiantį kaip milžiniška inference variklis — tiekiantis turinio rekomendacijas, reklamos paskirstymą ir turinio moderavimo sprendimus — kompanijai reikalinga tiek treniravimo, tiek aptarnavimo (serving) pajėgų skalė. Šios pajėgos apima ne tik procesorių skaičių, bet ir energijos tiekimą, aušinimą, greitųjų tinklų infrastruktūrą, duomenų saugojimą bei programinę įrangą, kuri leidžia orkestruoti paskirstytą mokymą ir nuolatinį modelių atnaujinimą.

Politika, eksporto taisyklės ir pragmatiški sprendimai

Ši planuojama sandorių banga seka paskutinius pakeitimus JAV politikoje: Vašingtonas neseniai leido pardavimus NVIDIA H200 procesorių (paremtų senesne Hopper architektūra) į Kiniją. Tokia politika atvėrė galimybę pirkimams, kurie buvo apriboti platesnių eksporto kontrolės priemonių metu. Tai pakeitė tiek techninės galimybės, tiek tiekimo vertinimus globalioje rinkoje, ypač tais atvejais, kai įmonės turi užtikrinti spartų prieigą prie pažangios skaičiavimo įrangos be ilgo vietinio dizaino ir gamybos ciklo.

Be to, Pekinas taktiškai vertina šią dinamiką: Kinijos vyriausybė vedė pokalbius su vietinėmis technologijų įmonėmis, siekdama įvertinti realius poreikius duomenų centrų technologijoms ir paskatinti savarankiškumą, tuo pačiu išlaikant galimybes pirkti ribotą užsienio įrangą. Politinės ir reguliacinės aplinkybės verčia technologijų kompanijas kurti atsarginio planus: derinti investicijas į vietinius projektus, diversifikuoti tiekimo grandines ir ieškoti laikinų sprendimų, kurie užtikrintų veiklos tęstinumą.

ByteDance jau ėmėsi priemonių mažinti geopolitinę riziką. Apie prieš metus įmonė pradėjo nuomotis debesų (cloud) pajėgumą už Kinijos ribų — tai sprendimas, leidžiantis tęsti paslaugas ir modelių kūrimą sankcijų ar eksporto apribojimų sąlygomis. Išnuomotos cloud talpos suteikia galimybę vykdyti treniravimą, atlikti A/B testavimus, saugoti kopijas ir vykdyti tarptautines komandos sąveikas, tuo pačiu mažinant riziką, susijusią su griežtesnėmis vidaus taisyklėmis ar importo apribojimais.

Galiausiai, didelio masto NVIDIA pirkimas yra praktiškas atsakas į skubų techninį poreikį: masyvi ir ekonomiška GPU talpa leidžia greitai treniruoti ir iteruoti dirbtinio intelekto modelius, net tuo metu, kai kompanija plečia vietinių inference lustų gamybą ir orientuojasi į sudėtingą reguliacinę aplinką. Tokios investicijos taip pat rodo platesnį industrijos trendą: didelės technologijų kompanijos, siekdamos išlaikyti konkurencingumą generatyviojo AI srityje, naudoja mišrią strategiją — savo hardware kūrimas + didelės apimties perkamieji sprendimai treniravimui — ir taip optimizuoja kaštus, greitį ir inovacijų tempą.

Šaltinis: smarti

„Esu žaidimų entuziastas ir AI entuziastas. Rašau apie tai, kas svarbu – naujausius žaidimus, AI projektus ir tai, kaip šie du pasauliai jungiasi.“

Palikite komentarą

Komentarai