Kodėl Kinijos AI spartintuvai vejasi JAV: nanosekundžių kova

Kodėl Kinijos AI spartintuvai vejasi JAV: nanosekundžių kova

Viltė Petrauskaitė Viltė Petrauskaitė . Komentarai

9 Minutės

Nvidia vykdomasis direktorius Jensen Huangas išsakė aštrią pastabą: Kinijos AI spartintuvai artėja prie JAV dizainų, o skirtumas matuojamas „keliais nanosekundėmis“. Tai skamba kaip smulkmena, bet šis pastebėjimas atskleidžia, kaip greitai keičiasi puslaidininkių lenktynės ir kodėl JAV mikroschemų gamintojai stebi Kiniją labiau nei bet kada anksčiau.

Kelios nanosekundės: kodėl tai svarbu?

Ant paviršiaus kelios nanosekundės gali atrodyti nereikšminga detalė. Tačiau aukštos klasės AI inferencijos ir mokymo užduotims mažos latencijos pagerėjimai kaupiami per milijardus ar trilijonus lygiagrečių operacijų. Įsivaizduokite: didžiulėse duomenų centro sistemose viena operacija vyksta per nanosekundes, o tokių operacijų skaičius ir jų tarpusavio priklausomybė reiškia, kad net kelių nanosekundžių pranašumas gali atnešti reikšmingą pervaldymą, mažesnes eksploatacines išlaidas ar geresnį energijos vartojimo efektyvumą.

Todėl Huangas pabrėžia ne vien tik transistorų skaičiaus ar GHz dažnio skirtumus. Jis kalba apie optimizaciją per visą staktą: tarpinius protokolus, atminties pralaidumą, I/O srautų valdymą, paketų sutvarkymą ir programinę įrangą, kuri sumažina globalią latenciją ir padidina pralaidumą. Kai kinų inžinierių komandos uždaro spragą iki „kelių nanosekundžių“, tai reiškia, kad konkurencinė pranašumo juosta traukiasi ir kova pereina į ekosistemų bei platformų lygmenį.

Sankcijos, tiekimo grandinės iššūkiai ir litografijos siauras kaklas

Kontrastas yra aiškus. JAV įvedė eksporto kontrolę, ribojančią Kinijos prieigą prie pažangių chipų gamybos įrankių, ypač ekstremalios ultravioletinės (EUV) litografijos mašinų, reikalingų sub-5 nm tranzistorių mazgams. Tokios priemonės skirtos sulėtinti pažangių gamyklų (fabs) vystymąsi Kinijoje. Tačiau valstybinis finansavimas, didelis talentų kiekis ir milžiniškas vidaus paklausos augimas padėjo Kinijos žaidėjams dalinai apeiti šias kliūtis.

Litografija yra vienas iš didžiausių technologinių barjerų. ASML gaminamos EUV mašinos yra brangios ir technologiškai sudėtingos; jų eksportas yra griežtai reguliuojamas. Neturint prieigos prie naujausių EUV sistemų, tie, kurie gamina lustus Kinijoje, turi investuoti į alternatyvas: senesnius DUV procesus, pažangesnį dizainą, didesnį fab-lygmens optimizavimą arba modulinius sprendimus, tokius kaip chiplet'ų pakavimas ir 2,5D integracija. Visa tai leidžia sumažinti priklausomybę nuo vieno konkretaus įrankio grandinės.

Politikos ir pramonės sinergija

Valstybės subsidijos ir strateginės investicijos į puslaidininkius leidžia Kinijai greičiau plėtoti savo tiekimo grandinę. Investicijos į mokslinius tyrimus ir plėtrą, universitetinius ryšius ir skaitmeninių centrų kūrimą – visa tai kuria aplinką, kurioje vietinės kompanijos gali iteruoti greitai. Be to, vidaus debesų tiekėjai ir įmonių klientai kelia didžiulį poreikį, leidžiantį eksperimentuoti ir diegti naujas architektūras be tarptautinių apribojimų. Tai savaime mažina kai kurių sankcijų poveikį: jei paklausa yra vidaus, kai kurie tiekimo trūkumai gali būti kompensuojami kitais kanalais.

Huawei sugrįžimas: Ascend 910B istorija

Huawei yra ryškus pavyzdys šio dinamizmo. Po ankstesnių skaudžių smūgių ir apribojimų bendrovė investavo į vidaus technologijų kūrimą. Ascend 910B AI spartintuvas dabar dominuoja Kinijos vietinėje AI lustų rinkoje, tai rodo, kaip greitai galima atgauti pozicijas, jei yra tinkamas finansavimas, talentai ir rinkos poreikis.

Šis sugrįžimas neįvyko iškart ar vien tik dėl asistencijos rinkoje. Jis apėmė nuoseklų lustų architektūros tobulinimą, bendradarbiavimą su vietinėmis fabrikomis ir platformų palaikymą, įskaitant programinės įrangos stack'us, optimizuotus AI sistemoms. Kai JAV taisyklės laikinai užblokavo tam tikrus Nvidia GPU pardavimus į Kiniją, atsirado vieta, kur Ascend ir kiti nacionaliniai sprendimai galėjo užimti vietą debesų tiekėjų ir įmonių diegimuose.

AI spartintuvai ir gamyba

Nvidia, CUDA ir ekosistemos užrakinimo kova

Kinijos pagrindiniai debesų tiekėjai – Baidu, Alibaba, Tencent ir ByteDance – turi milžinišką poreikį AI skaičiavimams. Daugelyje atvejų jie pirmenybę teikia Nvidia platformai dėl CUDA – seniai susiformavusio paralelinio skaičiavimo įrankio rinkinio, kuris pagreitina vystymą ir našumo optimizavimą Nvidia GPU aplinkoje. CUDA suteikia įrankius, bibliotekas ir ekosistemą, kurią sunku pakeisti per vieną kartą.

Tačiau Kinijoje vyksta stiprus judėjimas kuriant CUDA-nepriklausomą ekosistemą. Tikslas aiškus: sumažinti priklausomybę nuo užsienio intelektinės nuosavybės, sumažinti tiekimo politikos riziką ir sukurti ilgalaikį technologinį savarankiškumą. Ši kryptis apima vidaus programinės įrangos stack'us, atviro kodo iniciatyvas ir specializuotus I/O bei atminties optimizavimo sprendimus, kurie sujungia aparatūrą su aukštesnio lygio AI įrankiais.

Ekosistemos įtaka yra didelė, nes ji kuria inerciją. Kūrėjai, įgudę dirbti su CUDA, gauna pranašumų dėl įrankių ir optimizacijų. Tuo tarpu tie, kurie pasirenka vietinius ar atvirus sprendimus, siekia nepriklausomybės ir ilgalaikio saugumo nuo geopolitinių šokų. Huangas kartais ragina atvirą konkurenciją ir įspėja, kad pernelyg griežtos ribos gali sukelti ekonominį atmetimą – kai verslas per greitai praras prieigą prie technologijų, ekosistemos gali greitai persikelti kitur.

Rinkos matematika: kiek Kinija reiškia Nvidia?

Nvidia yra viešai nurodžiusi, kad prieš eksporto politikos pakeitimus maždaug 20–25% jos duomenų centrų pajamų kilo iš Kinijos. Tai – ne menkas gabalas pajamų, todėl nenuostabu, kad politikos niuansai ir laipsniškas leidimų suteikimas, pavyzdžiui, kai kurių H20 klasės AI spartintuvų pardavimas į Kiniją, buvo vertinami itin atsargiai. Tuo pačiu metu galingiausi lustai išlieka ribojami.

Bet yra dar daugiau skaičių, kuriuos verta įvertinti. Tai ne tik pajamos – tai ekosistemos vertė, mokslinių tyrimų partnerystės, debesų integracijos projektai ir ilgalaikės plugin'o bei library rinkos dalys. Kai įmonė pririšama prie tam tikros platformos, ji investuoja ir adaptuoja savo sprendimus pagal tą platformą, o tai kuriąs ilgalaikį konkurencinį pranašumą. Jeigu Kinijos tiekėjai pasiekia našumo panašumą keliomis nanosekundėmis, jie gali pradėti konkuruoti ir kainos, ir ekosistemos pritaikymo frontuose.

  • Huawei Ascend 910B dabar dominuoja Kinijos vidaus AI spartintuvų rinkoje.
  • Kinija pasinaudoja valstybės subsidijomis, talentų baze ir didžiule debesų paklausa.
  • JAV sankcijos riboja tam tikrus aukščiausios klasės įrankius, bet jos nesustabdė Kinijos progreso.
  • CUDA išlieka įtakinga, tačiau Kinija aktyviai kuria ir palaiko alternatyvas.

Techniniai niuansai: kur slypi nanosekundžių pranašumas?

Norint suprasti, kodėl kelių nanosekundžių skirtumas svarbus, reikia pažvelgti į AMD, Nvidia ir kinų dizainų techninius sprendimus. Latencija priklauso nuo kelių sluoksnių: procesoriaus branduolio apdorojimo greitis, vidinės atminties hierarchijos (cache pralaidumas ir vėlavimas), atminties magistralės pralaidumas, PCIe ar NVLink tipo ryšiai tarp lustų ir I/O greitis. Taip pat svarbūs programinės įrangos optimizacijos – kam skirtos duomenų srautų eilutės, kaip efektyviai užpildomas GPU SM ar matrix engine, ir kaip gerai veikia operatorių lygio optimizacijos (pavyzdžiui, Tensor Core ar matricos daugyba).

Inžinieriai siekia mažinti kiekvieną latencijos komponentą: sutrumpinti cache vėlavimą, optimizuoti atminties valdymą didelėms matricoms, sumažinti komunikacijos overhead'ą tarp lupimų ar paketų tvarkymo. Kiekvienas toks patobulinimas gali suteikti „keletą nanosekundžių“ pranašumo, o kartu per milijonus užklausų persekioja pastebimą konkurencinį skirtumą.

Pakavimas, chiplet'ai ir gamybos taktika

Dar vienas sritis, kur kinų gamintojai gali kompensuoti pažangios litografijos trūkumą – pažangus pakavimas ir chiplet architektūra. Vietoj to, kad viską spausdintų viename vienetekyje (monolithic die), gamintojai gali sujungti kelis mažesnius blokus per didelio pralaidumo interposer'ius ar 2,5D/3D pakavimo technologijas. Tai leidžia panaudoti geresnes proceso dalis ir kartu kurti didelės spartos skaičiavimo blokus, kurie funkcionaliai prilygsta pažangesniems vienetams.

Ekosistemos svarba: kas laimi, kai grandinė sutrinka?

Diskusija apie lustų našumą nėra vien apie silicio geometriją. Tai yra apie platformos savybes: bibliotekas, bendruomenę, paruoštus modelius, sertifikacijas, palaikymą debesyse ir integracijas su MLOps įrankiais. Įmonė, kuri valdo šią vertikalę, dažnai gauna tam tikrą konkurencinį užtvarą. Net jei hardware skirtumai nyksta, ekosistemos pranašumas gali išlikti dešimtmečius.

Taigi klausimas tampa: ar pramonė pereis prie heterogeninių architektūrų, kur kelios platformos egzistuoja kartu ir veikia tarpusavyje, ar pasikliaus keliais didžiaisiais tiekėjais? Kinijos pastangos kurti nepriklausomas alternatyvas rodo, kad ateitis gali būti labiau paskirstyta, ypač jei geopolitinė rizika išliks aukšta.

Kas toliau? Galimos pasekmės tiek technologijoms, tiek politikai

Jeigu skirtumas tarp JAV ir Kinijos AI spartintuvų tikrai sumažės iki kelių nanosekundžių, turime pertvarkyti tiek techninius, tiek strateginius prioritetus. Tai reikštų, kad konkurencija pereitų į platesnį lauką: programinės įrangos suderinamumą, patentų kovas, duomenų srautų valdymą ir tiekimo grandinės atsparumą. Vartotojai gali laimėti — dovanos didesnę kainos ir kokybės variaciją, o kūrėjai gaus daugiau įrankių pasirinkti.

Politiškai tai reikštų, kad eksporto kontrolė ir sankcijos taps detaliau nukreiptos ne tik į pačius įrankius, bet ir į programinės įrangos komponentus bei mokslinių tyrimų bendradarbiavimo sritis. Pramonė privalės plėtoti diversifikacijos strategijas: daugialypę tiekimo grandinę, partnerystes su regioniniais fabrikais ir investicijas į vidaus R&D, kad būtų mažinama priklausomybė nuo vieno tiekėjo.

Galiausiai, konkurencija paskatins inovacijas. Kai skirtumai sumažėja, startuoliai ir akademinės grupės gali pasinaudoti nišomis: specializuotais akceleratoriais, energijos efektyvumo sprendimais, optimizacijomis specifiniams AI modeliams ir naujomis atviro kodo bibliotekomis. Tai kelia klausimą: ar matome tik technologijų perskirstymą, ar prasideda naujas modelių ir verslo modelių era?

Vienas aišku: lenktynės nėra vien apie tranzistorius vienetui. Tai taip pat apie tai, kas valdo kūrėjų įrankius, kokias platformas pasirinks debesys, ir kokias strategijas priims vyriausybės. Jei nanosekundžių skirtumas taps nereikšmingas, kova už ekosistemų kontrolę tik įgaus pagreitį.

Ir nepamirškime praktikos: pakeitimai programinės įrangos ir optimizacijų lygyje gali užtrukti — todėl kompanijos, investuojančios laiku ir protingai, gali laimėti net jeigu jos neturi absoliučiai moderniausios litografijos. Kaip sakoma pramonėje: greitis diegti, o ne tik greitis spausdinti dažnai lemia pergalę.

Šaltinis: phonearena

Sveiki! Esu Viltė, kasdien sekanti technologijų naujienas iš viso pasaulio. Mano darbas – pateikti jums svarbiausius ir įdomiausius IT pasaulio įvykius aiškiai ir glaustai.

Palikite komentarą

Komentarai