3 Minutės
Įmonės, stipriai investuojančios į generatyvinį DI
Tarptautinės organizacijos spartina investicijas į generatyvinį dirbtinį intelektą (GenAI), dažnai teikdamos prioritetą inovacijoms ir konkurenciniam pranašumui, o ne aplinkos ar operaciniams padariniams. Nauja pramonės apklausa rodo, kad 61% įmonių planuoja per artimiausius 12 mėnesių padidinti GenAI biudžetus, po to, kai pernai 88% padidino išlaidas DI technologijoms. Toks spartus augimas atspindi vis didėjančią verslo DI priėmimą — tačiau kartu kelia skubius klausimus apie tvarumą, išlaidų valdymą ir ilgalaikę investicijų grąžą (ROI).
Energijos suvartojimas ir tvarumo iššūkiai
Nors daug dėmesio skiriama DI platformų tiekėjams, galutiniai naudotojai taip pat generuoja didžiulę paklausą, kuri verčia duomenų centrus vartoti daugiau energijos. Pagrindiniai debesijos operatoriai pranešė apie staigius energijos augimo rodiklius: vienas tiekėjas užfiksavo beveik 27% duomenų centro galios padidėjimą tam tikrais 2024–25 m. laikotarpiais, o kitas nurodė reikšmingą bendrą energijos suvartojimo augimą per pastaruosius metus. Nepaisant šių rodiklių, daugiau nei pusė apklaustų įmonių mano, kad GenAI nauda nusveria jos poveikį aplinkai — požiūris ypač paplitęs tam tikruose regionuose.
DI anglies pėdsakas ir paslėptos išlaidos
Be tvarumo problemų, įmonės susiduria su netikėtomis išlaidomis, kai DI projektai plečiasi. Apie kas penkta organizacija praneša, kad yra nepatenkinta ankstyvais rezultatais ir dažnai patiria „sąskaitų šoką“, kai išteklių naudojimas viršija prognozes. Tai pabrėžia poreikį modeliuoti kaštus, užtikrinti observabilumą ir diegti valdymo mechanizmus prieš plačiai diegiant sprendimus.
Produkto funkcijos ir techniniai pasirinkimai
Įmonės tiria įvairius DI modelius ir diegimo šablonus, kad subalansuotų našumą, išlaidas ir privatumą:
- Dideli baziniai modeliai, skirti pažangiems gebėjimams ir aukštos kokybės generatyviniams rezultatams.
- Maži kalbos modeliai (SLM) periferiniams įrenginiams, mažesnėms inferencijos sąnaudoms ir greitesniam atsakymo laikui.
- Vietinis (on-premises) arba privačių debesų talpinimas, siekiant kontroliuoti duomenų srautus ir atitikti atitikties reikalavimus.
- Hibridinės inferencijos architektūros, nukreipiančios jautrius užklausas į saugias aplinkas, o viešąsias debesis naudojančios mažiau kritinėms užduotims.
Palyginimai: dideli modeliai prieš mažus kalbos modelius
Dideli modeliai paprastai suteikia geresnį kontekstinį supratimą ir kūrybiškesnę generaciją, tačiau reikalauja didesnių skaičiavimo, energijos ir eksploatacinių išlaidų. Maži kalbos modeliai atsisako dalies gebėjimų mainais į reikšmingą delsos, inferencijos sąnaudų ir anglies dioksido emisijų mažinimą — dėl to jie patrauklūs klientinėms programoms ir reguliuojamoms pramonėms.
Privalumai, naudojimo atvejai ir rinkos aktualumas
Strateginis GenAI diegimas suteikia aiškių pranašumų: pagerina klientų aptarnavimą, automatizuoja rinkodaros personalizavimą, pagreitina rizikos modeliavimą ir stiprina sprendimų palaikymą. Naudojimo atvejai apima pokalbių robotus ir virtualius asistentus, išmanų dokumentų apdorojimą, personalizuotą turinio generavimą ir sukčiavimo aptikimą. Rinkos aktualumas aiškus, nes organizacijos vidutiniškai skiria apie 12% IT biudžeto tiesiogiai generatyvinio DI iniciatyvoms.
Kaip maksimaliai padidinti ROI ir sumažinti poveikį
Vien išlaidų nepakanka. Norint gauti pamatuojamą grąžą, įmonės turėtų sukurti tvirtą duomenų pagrindą, įgyvendinti DI valdymą, prioritetizuoti saugias ir teisės aktams atitinkančias aplinkas bei orientuoti pilotinius projektus į didelės įtakos sritis, tokias kaip klientų operacijos, rinkodara ir rizikų valdymas. Visgi šiandien tik mažuma turi formalų valdymą, dėl ko daugelis įmonių gali susidurti su išlaidų viršijimu ir reguliavimo rizika.
Trumpai tariant, kitas įmonių DI vystymosi etapas turėtų derinti ambicingas investicijas su disciplinuota inžinerija, tvarumo planavimu ir valdymu, kad generatyvinis DI būtų plečiamas atsakingai ir teiktų ilgalaikę verslo vertę.
Šaltinis: smarti

Komentarai