Optiniai AI lustai: Neurophos ir fotoninės perspektyvos

Optiniai AI lustai: Neurophos ir fotoninės perspektyvos

Jokūbas Žilinskas Jokūbas Žilinskas . Komentarai

6 Minutės

JAV startuolis, kuriam parėmė Billo Gateso Gates Frontier Fund, pristatė eksperimentinį AI procesorių, veikiančią šviesa vietoj elektronų. Neurophos teigia, kad jų optinis lustas gali reikšmingai pagerinti našumą ir energijos efektyvumą, siūlydamas alternatyvų kelią dirbtinio intelekto masteliavimui, besiribojančiam su tradiciniais silicio GPU sprendimais. Ši koncepcija apima ne tik principinį aparatūros pakeitimą, bet ir naują sisteminį požiūrį į skaičiavimų architektūrą, duomenų srautus ir energijos valdymą duomenų centruose.

Nuo elektronų prie fotonų: kitoks skaičiavimo būdas

Vietoje elektronų siuntimo per tranzistorius, Neurophos sprendimas atlieka skaičiavimus su fotonais. Šviesa persijungia sparčiau ir generuoja žymiai mažiau šilumos nei krūvių judėjimas per silicį, o tai teoriškai leidžia pasiekti daug didesnį pralaidumą ir mažesnį energijos suvartojimą. Toks optinis skaičiavimas remiasi fotonikos komponentais — lazeriais, interferometrais, optiniais filtrais ir fotodetektoriais — kurie atlieka pagrindinius matricos daugybos ir sumavimo veiksmus, reikalingus neuroninių tinklų inferencijai ir tam tikroms mokymosi užduotims.

Įmonė teigia išsprendusi vieną pagrindinių optinės kompiuterijos kliūčių — ji sumažino optinių komponentų dydį iki tankio, suderinamo su esamomis lustų gamyklomis (foundries). Vietoj daugelio mažų elektroninių branduolių Neurophos siekia sutalpinti vieną labai didelę optinę skaičiavimo matricą ant vieno lusto. Tai gali sumažinti duomenų judėjimo sąnaudas chipe ir supaprastinti laikrodžiui panašius sinchronizavimo reikalavimus, ypač kai kalbama apie dideles matricas, kurios dažnai naudojamos neuroninių tinklų matematikoje.

Tokio tipo optinė architektūra taip pat susijusi su silicio fotonikos technologijomis — metodais, leidžiančiais gaminti optinius komponentus naudojant įprastas silicio gamybos linijas. Tai svarbu, nes foundry suderinamumas reiškia spartesnę gamybą, mažesnes vieneto sąnaudas ir galimybę integruoti optinius sprendimus į esamą puslaidininkių tiekimo grandinę. Tačiau realūs gamybos poreikiai apima ne tik mikrofotografiją ar nanostruktūras, bet ir pakuotes, jungtis, terminius sprendimus bei patikimumo bandymus – visos šios sritys reikalauja naujų sprendimų, kai pagrindinis signalo nešėjas tampa šviesa.

Ką tai reiškia, palyginti su šiandieniniais AI lustais

Nvidia ir kiti GPU gamintojai vis dar grindžia pagrindinius AI aritmetikos veiksmus elektroninėmis grandinėmis. Nvidia integruoja fotoniką, kad pagreitintų tarp lustų vykstančią komunikaciją (inter-chip interconnects), tačiau pati aritmetika — matricos daugyba, sukaupiami sumos ir aktyvacijos funkcijos — atliekama elektronų srautais. Neurophos siekia tikro optinio skaičiavimo, kur fotonai atlieka pagrindines matricines operacijas, naudojamas neuroniniuose tinkluose. Jei šis požiūris bus praktiškai įgyvendintas, tai gali pakeisti dabartines galios ir našumo kompromisų sąvokas, su kuriomis kovoja duomenų centrai ir debesų paslaugų operatoriai.

Praktinėje perspektyvoje optiniai AI lustai gali turėti didelį poveikį kelioms sritims: energijos sąnaudoms inferencijos metu, aušinimo infrastruktūrai, bendram rack tankiui duomenų centruose ir kainų modeliui operacijų mastu. Pavyzdžiui, dideli modeliai, atliekantys inferenciją realiu laiku arba masines užklausas, reikalauja pastovaus skaičiavimo pajėgumo ir gausių GPU klasterių su intensyviu energijos poreikiu. Optinė architektūra, sumažinusi nuostolingą šilumos generaciją ir padidinusi pralaidumą, teorijoje gali sumažinti elektros sąnaudas ir aušinimo reikalavimus, iš esmės pakeičiant duomenų centro veiklos sąnaudas.

  • Greiitesni persijungimo greičiai: fotonai gali keisti būsenas žymiai greičiau nei elektronai, todėl tam tikrų operacijų atveju galima pasiekti didesnius „laikrodinius“ dažnius ir trumpesnius vėlinimus — tai yra svarbu daugialypėje matricoje pagrįstiems skaičiavimams, kuriuose svarbus latencijos ir pralaidumo santykis.
  • Mažesnė šilumos generacija: mažesnė nuostolinga energija reiškia mažesnes aušinimo išlaidas ir geresnį energijos efektyvumą didelio masto inferencijos ar mokymosi sistemoms; tai ypač aktualu duomenų centrams, kur aušinimas ir HVAC sistemos sudaro reikšmingą eksploatacinių kaštų dalį.
  • Densesnė skaičiavimo struktūra: viena didelė optinė matrica gali supaprastinti duomenų judėjimą chipe lyginant su daugybe paskirstytų branduolių, sumažindama tarpinės atminties ir magistralių reikalavimus ir leidžiant optimizuoti laidumą bei pralaidumą tarp matricų blokų.

Realistinė peržiūra: iššūkiai išlieka

Nepaisant pažangių pareiškimų, Neurophos laukia daugybė inžinerinių darbų prieš masinę gamybą. Optiniai komponentai elgiasi kitaip nei tranzistoriai — jie yra dažnai analoginiai, jautrūs triukšmui, dengčiai ir fazės klaidoms. Be to, programinės įrangos įrankių rinkiniai, kompiliatoriai ir validacijos programos turi būti perrašyti arba adaptuoti, kad atitiktų optinės architektūros specifiką: kvantavimas, signalo triukšmo modeliavimas, klaidų korekcija ir kalibravimas tampa integraliomis grandinėmis, o tai reikalauja naujų įrankių ir standartų.

Integracija su esamomis duomenų centro ekosistemomis ir plataus masto patikimumo bandymai nėra menkas klausimas. Duomenų centro operatoriai reikalauja įrodymų dėl ilgaamžiškumo, diagnostikos, remonto galimybių ir integracijos su virtualizacija bei orkestracijos sprendimais. Taip pat reikalingi patikimi metodai, kurie užtikrintų, kad optiniai moduliai veiktų kartu su elektroniniais valdikliais, atmintimi ir tinklo infrastruktūra. Daugeliu atvejų tai reikš hibridinių sistemų atsiradimą — optinės skaičiavimo dalys, išdėstytos kartu su elektroniniais posistemiais, kurie teikia duomenų sinchronizaciją, valdymą ir kompleksinę logiką.

Vis dėlto Gates Frontier Fund parama ir pramonės kalbos — apie kurias pirmasis pranešė Tom's Hardware — rodo auginamą susidomėjimą alternatyvomis, kai silicio mastelėjimui ateina ribos. Įsivaizduokite didelės energijos sąnaudos inferencijos stojus, kuriuos būtų galima pakeisti kompaktiškais optiniais moduliais, sumažinančiais elektros sąskaitas ir šilumos išsiskyrimą: tai gali atrodyti futuristiška, tačiau tokių startuolių kaip Neurophos darbai stumia tą ateitį arčiau realybės. Svarbu pabrėžti, kad pereinamasis laikotarpis, greičiausiai, apims hibridines architektūras, kur optika ir elektronika kartu spręs specifines AI darbo krūvių dalis.

Kas laimi lustų lenktynėse?

Nvidia išlieka dominuojančia jėga ir, tikėtina, rinks rinką dar kelerius metus dėl brandos ekosistemos, programinės įrangos palaikymo ir gamybos masto. Jos platformos turi plačiai išvystytus bibliotekų paketus, optimizacijas neuroniniams tinklams ir debesų tiekėjų palaikymą, kurie sudaro didelį pranašumą. Tačiau optinė kompiuterija gali tapti stipria papildoma technologija: specializuoti optiniai akceleratoriai gali būti optimizuoti inferencijai arba tam tikriems didelės matricos darbo krūviams ir egzistuoti šalia elektroninių GPU, kurie toliau aptarnaus bendrojo paskyrimo mokymą ir suderinamumą su esamais modeliais.

Realesnis klausimas nėra „ar Nvidia žlugs“, o „kaip AI aparatūros ekosistema evoliucionuos“ — fotonika gali pakeisti našumo ir energijos rodiklius per artimiausią dešimtmetį. Kurenami hibridiniai sprendimai, standartizuotos sąsajos tarp optinių ir elektroninių blokų, bei naujos programinės įrangos paradigmės (pvz., kompilatoriai, automatinis kvantavimas ir pakeltas triukšmo toleravimas) bus kertiniai faktoriai, lemiantys, kurie žaidėjai įgaus konkurencinį pranašumą. Galiausiai rinka greičiausiai priims tiek elektroninius GPU, tiek specializuotus optinius akceleratorius, paskirstydama darbo krūvius pagal efektyvumą, kainą ir reikalingą suderinamumą su esamomis programomis.

Šaltinis: gizmochina

Esu Jokūbas – aistringas dirbtinio intelekto ir žaidimų pasaulio tyrinėtojas. Digin.lt dalinuosi naujienomis ir analizėmis, kurios padeda suprasti technologijų ateitį.

Palikite komentarą

Komentarai