Kodėl ByteDance perka NVIDIA H200 GPU, nors kuria savo lustus?

ByteDance derina strategiją: NVIDIA H200 GPU yra pranašūs dideliems modelių treniravimams dėl skaičiavimo galios ir ekosistemos palaikymo (CUDA, ML bibliotekos), tuo tarpu vietiniai lustai labiau tinka inference užduotims. Taigi įsigijimai užtikrina greitą treniravimą, kol vyksta vietinių sprendimų diegimas.

Kokį vaidmenį vaidina eksporto taisyklės ir politika šioje pirkimų strategijoje?

JAV eksporto politikos pakeitimai, leidę parduoti H200 į Kiniją, atvėrė galimybes pirkimams, kurie anksčiau buvo apriboti. Tai suteikia laikiną prieigą prie pažangios įrangos, tačiau politinis kontekstas skatina diversifikaciją ir vietinių technologijų vystymą kaip ilgalaikę atsparumo priemonę.

Kaip tokia investicija veikia TikTok paslaugų veikimą ir kainodarą?

Papildoma GPU talpa leidžia greičiau treniruoti rekomendacijų ir moderavimo modelius, sumažina modelių atnaujinimo laiką ir padidina aptarnavimo našumą. Tai gali sumažinti vienetinės operacijos kaštus ir pagerinti vartotojo patirtį, tačiau reikalauja investicijų į energiją, aušinimą ir tinklo infrastruktūrą.

Kokie yra pagrindiniai techniniai skirtumai tarp treniravimo ir inference аппаратūros?

Treniravimui reikalinga didelė skaičiavimo galia, didelis atminties pralaidumas ir palaikymas paskirstytam mokymui — šiose srityse GPU, kaip NVIDIA H200, turi pranašumą. Inference aparatūra yra optimizuota energijos vartojimui, mažai latentacijai ir kaštams vienam užklausos apdorojimui — čia dažnai naudojami ASIC ar specializuoti NPU sprendimai.

ByteDance perka NVIDIA H200: investicija į AI mastą

5 Minutės

ByteDance, Kinijos kompanija, valdanti TikTok, saugoma reputacijos dėl spartaus dirbtinio intelekto plėtros, ruošiasi didžiulei NVIDIA dirbtinio intelekto procesorių įsigijimo operacijai, stiprindama generatyviojo dirbtinio intelekto (generatyvusis AI) tyrimus ir infrastruktūrą. Pagal žiniasklaidos pranešimus, įmonė planuoja 2026 m. išleisti apie 100 milijardų juanių (maždaug 14 mlrd. USD) NVIDIA H200 grafinių procesorių (GPU) pirkimui, taip reikšmingai papildydama jau ir taip didelį NVIDIA įrangos parką.

Kodėl NVIDIA GPU vis dar svarbūs

Iš pirmo žvilgsnio toks žingsnis gali atrodyti prieštaringas: ByteDance vysto savo užsakomus lustus kartu su partneriais, tokiais kaip Broadcom ir TSMC, ir tuo pačiu metu masiškai perka užsienio GPU. Tačiau tai lemia tai, kaip skirtingos lustų klasės yra pritaikomos praktikoje. NVIDIA H200 ir panašūs GPU yra optimizuoti sudėtingiems, intensyviems treniravimo darbo krūviams, kurių metu formuojami pagrindiniai (foundation) modeliai — didelės apimties neuroniniai tinklai, kuriuos galima vėliau pritaikyti įvairioms užduotims. Tokie GPU pasižymi didžiule skaičiavimo sparta, dideliu atminties pralaidumu ir specializuotomis matricos skaičiavimo instrukcijomis, kurios pagreitina didžiųjų modelių mokymąsi ir leidžia efektyviai įdiegti paskirstytą treniravimą per daugiasluoksnius duomenų centrus ir interkonektus (pvz., NVLink).

Priešingai, vietinės (in-house) lustų platformos, kurias ByteDance kuria su gamintojais kaip Broadcom ir gamintojais puslaidininkių plokštėms kaip TSMC, dažniau orientuojamos į inference (modelių vykdymą arba aptarnavimą realiu laiku). Inference lustai — tai ASIC, NPU ar kitokios tipinės duomenų centro plokštės — yra optimizuoti energijos vartojimo efektyvumui, latencijai ir kainai vienetui paslaugų aptarnavimo metu. Tai leidžia palaikyti milijonines rekomendacijų, reklamų pateikimo ir moderavimo operacijas realiu laiku programėlėse kaip TikTok, kur greitis, našumas ir sąnaudos yra kritiškai svarbūs.

Nors ambicingi vietiniai dizainai, kurių pasirodymas prognozuojamas 2026 m., gali reikšmingai sumažinti priklausomybę nuo importinių GPU inference sluoksnyje, savos gamybos lustai vargu ar pakeis GPU kaip pagrindinį sprendimą didelių modelių treniravimui. Didelių kalbos ir vizualinių modellerių treniravimas reikalauja plataus masto skaičiavimo išteklių, pažangių programinės įrangos bibliotekų ir suderintų tiekimo grandinių — kur NVIDIA architektūra ir ekosistema (CUDA, cuDNN, ekosistema aplink ML frameworks) šiuo metu turi reikšmingą pranašumą. Todėl ByteDance strategija, apjungianti pritaikytą inference aparatinę įrangą su aukščiausios klasės GPU treniravimui, yra hibridinė prieiga, skirta subalansuoti kaštus, našumą ir kontrolę daugelio sluoksnių dirbtinio intelekto ekosistemoje.

Įmonė jau anksčiau parodė, kad pasirengusi rimtai investuoti į išorinę aparatūrą. Pagal pranešimus, 2025 m. ByteDance į NVIDIA lustus investavo apie 85 milijardus juanių. Tokia apimtis aiškiai atspindi didelio masto poreikį: turėdama rinkos vertę, besiribojančią su maždaug 500 mlrd. USD, ir produktą kaip TikTok, veikiantį kaip milžiniška inference variklis — tiekiantis turinio rekomendacijas, reklamos paskirstymą ir turinio moderavimo sprendimus — kompanijai reikalinga tiek treniravimo, tiek aptarnavimo (serving) pajėgų skalė. Šios pajėgos apima ne tik procesorių skaičių, bet ir energijos tiekimą, aušinimą, greitųjų tinklų infrastruktūrą, duomenų saugojimą bei programinę įrangą, kuri leidžia orkestruoti paskirstytą mokymą ir nuolatinį modelių atnaujinimą.

Politika, eksporto taisyklės ir pragmatiški sprendimai

Ši planuojama sandorių banga seka paskutinius pakeitimus JAV politikoje: Vašingtonas neseniai leido pardavimus NVIDIA H200 procesorių (paremtų senesne Hopper architektūra) į Kiniją. Tokia politika atvėrė galimybę pirkimams, kurie buvo apriboti platesnių eksporto kontrolės priemonių metu. Tai pakeitė tiek techninės galimybės, tiek tiekimo vertinimus globalioje rinkoje, ypač tais atvejais, kai įmonės turi užtikrinti spartų prieigą prie pažangios skaičiavimo įrangos be ilgo vietinio dizaino ir gamybos ciklo.

Be to, Pekinas taktiškai vertina šią dinamiką: Kinijos vyriausybė vedė pokalbius su vietinėmis technologijų įmonėmis, siekdama įvertinti realius poreikius duomenų centrų technologijoms ir paskatinti savarankiškumą, tuo pačiu išlaikant galimybes pirkti ribotą užsienio įrangą. Politinės ir reguliacinės aplinkybės verčia technologijų kompanijas kurti atsarginio planus: derinti investicijas į vietinius projektus, diversifikuoti tiekimo grandines ir ieškoti laikinų sprendimų, kurie užtikrintų veiklos tęstinumą.

ByteDance jau ėmėsi priemonių mažinti geopolitinę riziką. Apie prieš metus įmonė pradėjo nuomotis debesų (cloud) pajėgumą už Kinijos ribų — tai sprendimas, leidžiantis tęsti paslaugas ir modelių kūrimą sankcijų ar eksporto apribojimų sąlygomis. Išnuomotos cloud talpos suteikia galimybę vykdyti treniravimą, atlikti A/B testavimus, saugoti kopijas ir vykdyti tarptautines komandos sąveikas, tuo pačiu mažinant riziką, susijusią su griežtesnėmis vidaus taisyklėmis ar importo apribojimais.

Galiausiai, didelio masto NVIDIA pirkimas yra praktiškas atsakas į skubų techninį poreikį: masyvi ir ekonomiška GPU talpa leidžia greitai treniruoti ir iteruoti dirbtinio intelekto modelius, net tuo metu, kai kompanija plečia vietinių inference lustų gamybą ir orientuojasi į sudėtingą reguliacinę aplinką. Tokios investicijos taip pat rodo platesnį industrijos trendą: didelės technologijų kompanijos, siekdamos išlaikyti konkurencingumą generatyviojo AI srityje, naudoja mišrią strategiją — savo hardware kūrimas + didelės apimties perkamieji sprendimai treniravimui — ir taip optimizuoja kaštus, greitį ir inovacijų tempą.

Šaltinis: smarti

Domantas Čepaitis

„Esu žaidimų entuziastas ir AI entuziastas. Rašau apie tai, kas svarbu – naujausius žaidimus, AI projektus ir tai, kaip šie du pasauliai jungiasi.“

ByteDance perka NVIDIA H200: investicija į AI mastą

Kodėl NVIDIA GPU vis dar svarbūs

Politika, eksporto taisyklės ir pragmatiški sprendimai

Palikite komentarą

Komentarai

Susijusios straipsniai

Samsung patentas: kišeninis telefonas virsta planšete

ASUS ROG Strix Scar 18: nešiojama galia be kompromisų

GTA 6 kaina kelia nerimą dar prieš išankstinę prekybą

Galaxy Z Fold 8 gali brangti dėl RAM ir gamybos kaštų

OnePlus N6: 5 min. įkrovimo ir 1,7 val. vaizdo įrašo

Lietuvos lazeriams – 60: technologijų eksporto jėga

OnePlus 15s gali nepasirodyti Indijos telefonų rinkoje

Apple palieka senesnius laikrodžius be visos watchOS 27

Snapdragon 8 Elite Gen 6: dvi atminties kryptys flagmanams

Amazfit Balance Ultra: titano laikrodis nuotykiams

Vieši grasinimai internete: ką nusprendė Vyriausybė

AI Lietuvos mokyklose: Šiaulių krašto klasės pamoka