Meta AI lustų projektas stringa dėl rimtų masto iššūkių

Meta AI lustų projektas stringa dėl rimtų masto iššūkių

Austėja Kavaliauskaitė Austėja Kavaliauskaitė . Komentarai

3 Minutės

Technologijų milžinės vaizdas, kai ji tyliai atideda itin ambicingą projektą, atrodo netikėtas. Meta įsigijo perspektyvų startuolį, kad sumažintų priklausomybę nuo išorinių GPU, tačiau panašu, jog projektas atsitrenkė į rimtą kliūtį.

Praėjusiais metais Meta įsigijo Rivos už maždaug 1,85 mlrd. eurų. Šis žingsnis turėjo sustiprinti bendrovę individualių lustų ir pasirinktinio silicio kūrimo kompetencijomis. Praėjus šešiems mėnesiams po sandorio užbaigimo, šaltinių teigimu, integracija pradėjo strigti. Daugiau nei ketvirtadalis prie Meta prisijungusių Rivos darbuotojų buvo atleisti, o lusto, skirto Meta dirbtinio intelekto modeliams mokyti, kūrimas pristabdytas.

Kai ambicijos susiduria su mastu

Rivos buvo kuriama aplink RISC-V, atvirą komandų rinkinio architektūrą, žadančią lankstumą. Iki įsigijimo startuolis buvo pritraukęs apie 345 mln. eurų ir net perdavęs su CUDA suderinamą procesorių TSMC bandomajai gamybai. Popieriuje tai skamba labai konkrečiai. Tačiau realybė kur kas sudėtingesnė.

Kodėl projektas sustojo? Priežasčių yra kelios ir jos nelengvos. Sukurti konkurencingą AI mokymo lustą reiškia ne tik pagaminti silicį. Reikia vientiso programinės įrangos paketo, glaudžios integracijos su duomenų centrų infrastruktūra, kompiliatorių, kurie išverstų aukšto lygio sistemas, ir daugelio metų našumo derinimo. Meta komandos turėjo suderinti aparatinę įrangą, žemo lygio programinę įrangą ir milžinišką infrastruktūrą įmonėje, kuri jau valdo vienus didžiausių mašininio mokymosi krūvių pasaulyje. Suderinti viską pasirodė gerokai sunkiau, nei tikėtasi.

Yra ir suderinamumo problema. Meta norėjo lustų, veikiančių su esamais CUDA pagrindu sukurtais įrankiais, kad jų diegimas būtų paprastesnis. Sukurti aparatinę įrangą, kuri elgtųsi kaip įsitvirtinę GPU, bet kartu užtikrintų didesnį efektyvumą ir mažesnę vieno mokymo ciklo kainą, yra techniškai sudėtinga ir rizikinga. Prie to prisideda gamybos partneriai, validavimo bandymai ir griežta terminų realybė. Todėl vėlavimai tampa beveik neišvengiami.

Strategiškai pati idėja buvo logiška. Individualūs lustai žadėjo mažesnes ilgalaikes sąnaudas ir daugiau kontrolės, palyginti su standartizuotų GPU pirkimu. Tačiau sąnaudų mažinimas tampa realus tik tada, kai aparatinė įranga pasiekia našumo ir patikimumo tikslus. Tai labai aukšta kartelė, ypač kai alternatyvūs tiekėjai, tokie kaip Nvidia, toliau sparčiai pristato naujas AI spartintuvų kartas.

Kas laukia toliau? Kol kas darbai pristabdyti, bet ne palaidoti. Meta gali persigrupuoti. Bendrovė galėtų susiaurinti projekto apimtį, labiau remtis partnerystėmis arba nukreipti talentus į artimesnio laikotarpio infrastruktūros laimėjimus. Taip pat tikėtina, kad dalis RISC-V eksperimentų bus tęsiami, o gamybiniams krūviams ir toliau bus naudojami patikrinti spartintuvai.

Meta siekis kurti individualų silicį susidūrė su rimta trintimi, tačiau ši pauzė labiau atspindi sudėtingą programinės įrangos, aparatinės įrangos ir masto suderinimą, o ne paprastą strategijos atsisakymą.

Šaltinis: smarti

„Technologijos visada mane žavėjo – nuo išmaniųjų telefonų iki dirbtinio intelekto proveržių. Džiaugiuosi galėdama dalintis naujienomis su jumis kiekvieną dieną.“

Palikite komentarą

Komentarai