FCI: anglies sąmoningas serverių planavimas mažina išmetimus

FCI: anglies sąmoningas serverių planavimas mažina išmetimus

Domantas Čepaitis Domantas Čepaitis . 1 Komentarai

8 Minutės

Duomenų centrai, palaikantys šiandieninį dirbtinio intelekto (DI) bumą, suvartoja milžiniškus kiekius energijos — ir nauja sistema, vadinama Federated Carbon Intelligence (FCI), žada suvaldyti šį apetitą. Tyrėjai teigia, kad šis DI pagrindu veikiantis planuotojas gali ženkliai sumažinti anglies dioksido emisijas ir tuo pačiu pratęsti serverių tarnavimo laiką, taip mažinant tiek tiesines, tiek paslėptas anglies sąnaudas.

DI, kuris galvoja apie anglies pėdsaką, ne tik apie skaičiavimus

Federated Carbon Intelligence (FCI) yra intelektualaus orkestravimo sluoksnis, kuris analizuoja aplinkos duomenis, vietinio elektros tinklo anglies intensyvumą ir realiuoju laiku gaunamą serverių būklės informaciją, kad nuspręstų, kur konkrečios DI užduotys turėtų būti vykdomos. Vietoje to, kad visos užduotys būtų siunčiamos į greičiausią arba naujausią mašiną, FCI nukreipia apkrovas į labiausiai tinkamus serverius — tuos, kurie tuo metu yra vėsesni, mažiau susidėvėję arba tiekiami švaresne elektra.

Toks požiūris praplečia tradicinį skaičiavimų optimizavimą: be našumo kriterijaus, į procesą įtraukiamas ir anglies dioksido mažinimas, serverių ilgaamžiškumas, bei resursų naudojimo efektyvumas. Šis DĮ orientuotas valdymas apima anglies sąmoningą vadybą (carbon-aware scheduling), kuri padeda suderinti verslo prioritetus su aplinkosaugos tikslais ir infrastruktūros sveikata.

Pavyzdžiui, ne skubūs mokymo (training) ar inferencijos (inference) darbai gali būti perkelti į šiek tiek senesnius, bet vėsesnius serverius tuo metu, kai elektros energija yra mažo anglies intensyvumo. Tokios permainos mažina stipraus aušinimo poreikį, apsaugo naujesnes mašinas nuo pernelyg didelio krūvio ir šiluminės įtampos, bei sumažina vandens ir energijos suvartojimą aušinimo sistemoms. Visa tai kartu reiškia žemiau esančią energetinę sąnaudą, mažesnį vandens naudojimą ir rečiau reikalingą aparatūros keitimą — taigi ir mažesnį anglies pėdsaką visoje serverių gyvavimo grandinėje.

Impresyvūs skaičiai iš simuliacijų — ir kodėl tai svarbu

Kalifornijos universiteto tyrėjų atliktos FCI simuliacijos rodo iki 45 % sumažėjimą duomenų centro CO2 emisijoms per penkerių metų laikotarpį, kartu vidutiniškai prailginant serverių eksploatacijos laiką apie 1,6 metų. Tokie skaičiai yra reikšmingi ne tik dėl iškart sumažėjusio anglies kiekio atmosferoje, bet ir dėl platesnio poveikio: ilgesnis įrangos tarnavimo laikas reiškia mažiau gamybos, mažiau transportavimo ir mažiau atliekų — tai visos svarbios sudedamosios tvaraus duomenų centro dalys.

Mihri Ozkan, tvarumo ir duomenų centrų energetikos tyrėja, pabrėžia, kad vien pasitikėti „švaria“ energija nepakanka. Hardware komponentai sensta, įkaista ir praranda efektyvumą — ši degradacija sukuria paslėptas anglies sąnaudas per visą įrenginių gyvavimo ciklą. FCI padeda neutralizuoti dalį šių sąnaudų, proaktyviai valdant krūvį, temperatūrą ir aparatūros senėjimo riziką.

Be to, simuliacijose įvertintos ir papildomos sąnaudos, tokios kaip aušinimo sistemas naudojantis vandens suvartojimas, elektros tinklo pėdsakas kompleksiškai priklausantis nuo tiekimo šaltinių ir laikotarpių, bei eksploatacinės išlaidos. Išplėstinis analizės modelis, įtraukiantis šiuos parametrus, leidžia labiau tikslinti sprendimus: ne tik „kur veikia greičiausia mašina“, bet „kur veikia mašina, kuri sumažins bendrą anglies pėdsaką ir išlaikys infrastruktūros sveikatą“.

Kaip FCI veikia praktikoje

  • Nuolatinis stebėjimas: FCI renka realaus laiko metrikas apie serverių amžių, temperatūrą, vibracijas ir nusidėvėjimo rodiklius.
  • Anglies sąmoningas planavimas: sprendimuose atsižvelgiama į vietinio tinklo anglies intensyvumą, dabartines darbo krūvių prioritetus ir SLA (service-level agreement) reikalavimus.
  • Adaptatyvus maršrutizavimas: užduotys dinamiškai skiriamos taip, kad sumažėtų apkrova ant silpniausių įrenginių ir būtų išnaudotos mažo anglies intensyvumo energijos langai.

FCI veikia kaip koordinuojantis programinės įrangos sluoksnis: jis nesiekia pakeisti esamos infrastruktūros fizinių komponentų, o integruotis su esamais orkestravimo įrankiais, debesijos platformų API ir vietinėmis valdymo sistemomis. Tai leidžia diegti FCI per programinį integravimą (software-level integrations) tiek viešajame debesyje, tiek privatuose on-prem diegimuose, be didelių kapitalinių išlaidų naujai aparatūrai.

Praktiniame diegime FCI gali būti prijungtas prie kelių šaltinių: energijos tiekimo duomenų (pvz., tinklo anglies intensyvumo API), įrangos telemetrijos (temperatūros, ventiliatorių greičio, energijos suvartojimo matavimo), darbo krūvių valdymo (kubernetes scheduler, batch job managers) bei verslo prioritetų pateikimo (SLA, prioritetų žymėjimas). Toks integruotas požiūris leidžia priimti sprendimus, kurie optimalūs ir pagal poveikį aplinkai, ir pagal verslo reikalavimus.

Tyrėjų komanda planuoja realaus pasaulio bandymus su dideliais debesų paslaugų tiekėjais, kad patvirtintų simuliacijų rezultatus gamybos apkrovose. Tokie bandymai yra svarbūs, nes simuliacijos negali pilnai atspindėti visų praktinių sąlygų — tinklo sutrikimų, nenumatytų srauto šuolių, skirtingų tiekėjų infrastruktūros ypatumų. Realūs eksperimentai padės suprasti FCI poveikį, matuojant tokias rodiklius kaip kiloWatt-hour (kWh) sutaupymai, CO2 ekvivalentas (CO2e), serverių prailgintas veikimo laikas ir bendras operacinis kintamumas.

Techniniai principai ir integracijos iššūkiai

FCI naudojasi keliomis techninėmis sritimis: telemetrija (metrics collection), pažangiais optimizavimo algoritmais (multi-objective scheduling), prognozėmis (pvz., numatomų anglies intensyvumo svyravimų prognozės) ir politika grįsta prioritetų valdymu. Tokia architektūra leidžia spręsti kelių tikslų optimizavimo uždavinį: minimizuoti anglies pėdsaką, išlaikyti SLA ir prailginti aparatūros eksploataciją.

Viena iš pagrindinių techninių problemų — duomenų kokybė ir sinchronizacija. Norint priimti patikimus sprendimus, reikia tiksliai žinoti tiekiono anglies intensyvumą, serverių temperatūras, darbo krūvius bei prioritetus realiu laiku. Be to, reikia užtikrinti saugumą ir konfidencialumą, kad FCI prieiga prie telemetrijos ir darbo krūvių metaduomenų neprieštarautų duomenų apsaugos reikalavimams.

Kitas iššūkis — interoperabilumas tarp skirtingų orkestratorių ir tiekėjų. FCI turi būti pakankamai lanksti, kad veikti tiek su k8s (Kubernetes), tiek su tradiciniais VM pagrindu veikiančiais valdikliais, ir tuo pačiu būti suderinama su įvairių tiekėjų energijos duomenų API. Standartizuoti telemetry protocols ir viešos, saugios anglies intensyvumo paslaugos gali palengvinti diegimą plačiau.

Kodėl ilgesnis serverių tarnavimo laikas padeda planetai

Serverių keitimas dėl gedimų arba pasenusios techninės įrangos turi aiškias finansines pasekmes — tačiau jis taip pat sukelia didelį anglies pėdsaką, kuris dažnai lieka nepastebėtas. Gaminių gamyba, komponentų tiekimas, transportavimas ir įrengimas yra intensyvios anglies šaltiniai. Sumažinus pakeitimų dažnumą, galima reikšmingai sumažinti šias įterptas (embodied) emisijas.

FCI prisideda prie šio tikslo dviem pagrindiniais būdais: pirmiausia, mažindamas persikrovų ir perkaitimo riziką, jis sumažina galimybes, kada aparatinė įranga patiria stresą, vedantį prie ankstyvos gedimo. Antra, nukreipdamas ne kritines užduotis į mažiau apkrautus arba vėsesnius serverius, FCI sumažina maksimalius temperatūros pikus — tai tiesiogiai susiję su komponentų patikimumu ir jų ilgaamžiškumu.

Be to, prailgintas eksploatacijos laikas pagerina išteklių panaudojimo rodiklius (resource utilization) ir mažina elektroninių atliekų kiekį (e‑waste). Ilgesnis tarnavimo laikas taip pat suteikia daugiau laiko techninei priežiūrai ir atnaujinimams, kurie gali būti ekonomiškai ir ekologiniu požiūriu tvaresni nei visiškas įrangos pakeitimas.

Kalbant apie klimato politiką ir įmonių tvarumo strategijas, priemonės panašios į FCI gali būti integruotos į platesnius veiksmų planus (angl. corporate decarbonization strategies). Organizacijos, kurios taiko anglies sąmoningą planavimą, gali geriau prognozuoti savo emisijas, optimizuoti energijos pirkimus ir argumentuoti investicijas į tvaresnę infrastruktūrą.

Galiausiai, nesustygavus augančiam DI poreikiui su tvarumo principais, visiškai pereiti prie žemo anglies intensyvumo skaičiavimo bus sudėtinga. Išmanios valdymo priemonės, tokios kaip FCI, veikia kaip tarpžingsnis ir leidžia pasiekti reikšmingų emisijų mažinimų, kol energetikos sektorius pereis prie visiškai atsinaujinančių šaltinių.

Poveikis industrijai ir konkurencinis pranašumas

Įmonės, kurios pirmos pradės naudoti anglies sąmoningą planavimą ir technologijas, kaip FCI, gali įgyti kelis konkurencinius pranašumus: mažesnes veiklos sąnaudas dėl energijos taupymo, mažesnį kapitalo poreikį serverių keitimams, bei pranašumą tvarumo ataskaitose ir rinkodaroje. Tokios priemonės taip pat gali palengvinti atitikimą griežtėjančioms reguliavimo reguliavimo taisyklėms dėl emisijų atskaitomybės.

Tačiau svarbu pažymėti, kad FCI nėra vienintelis sprendimas — tai vienas iš įrankių platesnėje priemonių rinkinyje: integruojant energijos pirkimo strategijas (pvz., PPA), atsinaujinančių energijos šaltinių įsigijimą, efektyvesnę aušinimo technologiją ir aparatinės įrangos optimizavimą galima pasiekti dar geresnių rezultatų.

Apibendrinant, FCI ir panašios technologijos turi didelį potencialą tapti neatskiriama duomenų centrų tvarumo strategijų dalimi, jei jos būtent bus diegiamos atsakingai, atsižvelgiant į operacinių poreikių, saugumo ir reglamentavimo reikalavimus.

Kaip paprasta idėja, protingesnis planavimas yra žemos pakabos vaisius („low-hanging fruit“) žalesniam DI: daugeliui organizacijų tai yra santykinai maža investicija su didelio poveikio galimybe. Ankstyvi įrodymai rodo, kad tokios intervencijos gali turėti svarbų poveikį, tačiau reikalingi plačiai taikomi realaus pasaulio bandymai, standartai ir atviros telemetrijos praktikos, kad šis poveikis būtų maksimaliai išnaudotas ir pritaikytas skirtingoms infrastruktūroms.

Šaltinis: smarti

„Esu žaidimų entuziastas ir AI entuziastas. Rašau apie tai, kas svarbu – naujausius žaidimus, AI projektus ir tai, kaip šie du pasauliai jungiasi.“

Palikite komentarą

Komentarai

Tomas

Na, neblogai.. jei FCI tikrai sumažintų CO2 45% — wow. Bet kiek kainuos integracija? ar nekils problemų su latency ir SLA? šiek tiek skeptiškas, bet verta bandyt