Telegram pristato Cocoon: decentralizuotas konfidencialus AI

Telegram pristato Cocoon: decentralizuotas konfidencialus AI

Austėja Kavaliauskaitė Austėja Kavaliauskaitė . 2 Komentarai

7 Minutės

Telegram pristatė Cocoon — decentralizuotą, konfidencialų skaičiavimo tinklą, pastatytą ant TON blokų grandinės, kuris žada privatumą ir mažesnes sąnaudas AI inferencijai, sujungdamas GPU savininkus tiesiogiai su kūrėjais. Pavelas Durovas teigia, kad Cocoon pašalina brangius tarpininkus ir tuo pat metu šifruoja užklausas bei atsakymus taip, kad net įrenginio šeimininkas jų negalėtų perskaityti.

Kodėl Cocoon gali pakeisti AI vykdymo modelį

Iki šiol kūrėjai ir vartotojai, norėję naudotis galingomis dirbtinio intelekto paslaugomis, dažniausiai nukreipdavo duomenis per centralizuotus debesų tiekėjus — pagalvokite apie Amazon, Microsoft ar panašias platformas. Tokia patogumas turi ir kainą: dideles mokesčių sąnaudas, apribotą kontrolę ir didesnę atakos paviršių riziką jautrioms užklausoms ar privačioms duomenų dalims.

Cocoon siekia apversti šį modelį: išnaudodamas nenaudojamas GPU resursų rinką peer-to-peer būdu ir vykdydamas modelių inferenciją Trusted Execution Environments (TEEs), tinklas užtikrina, kad įvestys ir išvestys išlieka konfidencialios, mažina pridėtines sąnaudas ir paskirsto apdorojimą tarp daugelio paslaugų teikėjų. Įsivaizduokite, kad paleidžiate didelį kalbos modelį be jokio teksto siuntimo į korporacinį serverį — tai yra pagrindinė Cocoon pažada.

Tokia architektūra mažina priklausomybę nuo kelių didžiųjų debesų paslaugų teikėjų (hyperscalers), o tai gali pagerinti paslaugų kainodarą, padidinti infrastruktūros diversifikaciją ir sumažinti vieno taško gedimo riziką. Be to, decentralizuota rinka skatina konkurenciją tarp GPU šeimininkų, kas gali lemti geresnę kainą kūrėjams ir didesnį pelną resursų savininkams.

Kaip Cocoon veikia — technologija po gaubtu

Sistema naudoja TON kaip apskaitos knygą ir atsiskaitymų sluoksnį. TON išlaiko paskyrų ir mokėjimų mechaniką, o išmanioji sutartis TON tinkle laiko leidžiamųjų komponentų (allowlist) sąrašą: patvirtintų hash’ų ir adresų rinkinį, užtikrinantį, kad tinkle dalyvautų tik patikimi ir autentifikuoti komponentai. Kai kūrėjui ar programai reikia AI skaičiavimo resursų, Cocoon nukreipia užduotį prie prieinamo GPU šeimininko, kurio aparatinė įranga paleidžia Cocoon vaizdą (image) viduje TEE.

TEEs suteikia esminį privatumo garantą: kodo ir duomenų apdorojimas enkliave (enclave) yra apsaugotas nuo šeimininko operacinės sistemos ir kitų išorinių agentų. Praktiniais terminais tai reiškia, kad serverio operatorius negali peržiūrėti užklausų (prompts), tarpinio apdorojimo duomenų ar galutinių modelio atsakymų — su jais dirba tik enkliavas. Ši izoliacija kartu su decentralizuotais TON atsiskaitymais leidžia šeimininkams automatiškai gauti apmokėjimus už suteiktą skaičiavimo galią, o kūrėjams — vykdyti inferenciją be didžiųjų debesų.

Techniniu lygiu Cocoon turi kelis svarbius komponentus: autentifikavimą per TON smart contract, leidžiamųjų vaizdų (signed Cocoon images) ir konfigūracijų sąrašą, aukštos kokybės TEE palaikymą (pvz., Intel SGX, AMD SEV ar kiti suderinami mechanizmai), bei peer discovery bei task scheduling sluoksnį, kuris atitinka užklausas su galimais GPU šeimininkais pagal parametrus — modelio dydį, atminties reikalavimus, paslaugos SLA ir kainodarą.

Be to, svarbu paminėti, kad decentralizuotos inferencijos sistemos, kurios naudoja TEEs, susiduria su praktiniais iššūkiais: suderinamumas tarp aparatūros, enklavų atpažinimas, saugus modelių įkėlimas ir atnaujinimai, taip pat apsauga nuo šališkumo ar modelio eksfiltracijos. Cocoon sprendžia kai kurias iš šių problemų per allowlist mechanizmus ir smart contract’ų autorizaciją, tačiau tinklo augimui svarbu plėtoti papildomas operacines ir valdymo priemones.

Kam tinklas atviras ir nuo ko pradėti

Cocoon orientuotas į dvi aiškias grupes: kūrėjus, kurie nori vykdyti privatumą užtikrinančią modelių inferenciją, ir GPU savininkus, norinčius monetizuoti nenaudojamą aparatūrą. Abi grupės turi aiškius pradžios žingsnius ir reikalavimus.

  • GPU šeimininkai: Įdiekite Cocoon vaizdą savo mašinoje, užpildykite trumpą pradinę konfigūraciją (modelio pavadinimą, TON piniginės adresą ir, jei reikia, SLA parametrus), ir jūsų mazgas paskelbs prieinamus resursus tinkle. Svarbu užtikrinti tinkamą TEE palaikymą, atnaujintą įrangos firmware ir saugią aplinką, kad enkliavas galėtų tinkamai veikti.
  • Kūrėjai: Pateikite užduotis į Cocoon sistemą; tinklas suras suderinamus šeimininkus ir paleis darbo krūvį enkliavuose. Mokėjimai ir autorizacija vykdomi per TON išmaniąją sutartį. Kūrėjams rekomenduojama nurodyti modelio reikalavimus, numatomą latenciją ir biudžetą, kad scheduler’is galėtų optimaliai priskirti resursus.

Pavelas Durovas pažadėjo, kad artimiausiomis savaitėmis prie tinklo prisijungs daugiau GPU pajėgumų ir kūrėjų, o Telegram planuoja integruoti Cocoon varomas AI funkcijas į savo programėlę taip, kad vartotojų duomenys išliktų privatūs. Integracijos atveju Telegram galėtų naudotis Cocoon infrastruktūra natūraliam teksto, vaizdų ir kitų multimodalių funkcijų apdorojimui, išsaugant kriptografinį skaidrumą ir decentralizuotus atsiskaitymus per TON.

Ką tai reiškia vartotojams ir pramonei

Galutiniams vartotojams akivaizdus privalumas yra privatumas: funkcijos, varomos Cocoon, gali apdoroti tekstą, vaizdus ar kitus įvesties duomenis neišduodamos serverio operatoriui. Tai svarbu programėlėms, kuriose dirbama su jautriais duomenimis — teisiniais ar medicininiais dokumentais, asmenine komunikacija ar intelektine nuosavybe. Tokia architektūra sumažina riziką, kad jautri informacija bus peržiūrėta, saugoma ar nupirkinėjama be tinkamo leidimo.

Kūrėjams ir mažesnėms AI komandoms decentralizuoti skaičiavimo resursai gali būti pigesni nei tradiciniai debesų tiekėjai, ypač jeigu vykdomi inferencijos intensyvūs darbo krūviai. Mokėjimai pagal realiai sunaudotą laiką ir konkurencinga GPU rinka gali sumažinti inferencijos vieneto kainą. Be to, galimybė išsaugoti modelius vietiniuose enkliavuose padeda saugoti modelių intelektinę nuosavybę bei kontroliuoti prieigą per TON smart contract autoritetingumo sluoksnį.

Vis dėlto egzistuoja iššūkių: įsisavinimas pramonėje reikalauja laiko, reikalinga užtikrinti kokybės garantijas (SLA), minimizuoti latenciją ir sukurti patikimą šeimininkų rinkodarą. Tinkle turi atsirasti sveika paslaugų teikėjų ekosistema, kurioje šeimininkai siūlo nuoseklų našumą, o scheduler’is užtikrina teisingą užklausų paskirstymą. Taip pat reikalingi mechanizmai aptikti ir pašalinti piktybinius dalyvius, apsaugoti nuo modelių perrašymo ar neleistino prieigos.

Strategiškai, Cocoon žymi žingsnį link konfidencialaus, paskirstyto AI apdorojimo, kuris nepriklauso nuo kelių didžiųjų teikėjų. Tai gali pakeisti vertės grandinę: vietoj vienos centralizuotos platformos, kuri saugo ir apdoroja duomenis, atsiranda daug nepriklausomų šeimininkų, kurių kiekvienas gali dalyvauti pagal skaidrias taisykles ir automatinius mokėjimus per blokų grandinę.

Greiti svarstymai ir techniniai aspektai

  • Cocoon veikia ant TON ir naudoja TEEs, kad apsaugotų AI užduotis nuo šeimininko prieigos. Tai svarbus privatumo ir duomenų saugumo sluoksnis.
  • GPU savininkai gali nuomoti nenaudojamą pajėgumą ir gauti momentinius atsiskaitymus į TON pinigines. Tai suteikia paskatą dalyvauti ir padidina rinkos likvidumą.
  • Kūrėjai gauna privatumą ir mažesnes inferencijos sąnaudas be būtinybės siųsti duomenis centrinėms debesų platformoms. Tai ypač aktualu įmonėms, dirbančioms su jautria informacija.
  • Telegram planuoja integruoti Cocoon į būsimas AI funkcijas programėlėje, tačiau turi užtikrinti UX, privatumo politiką ir aiškų komunikavimą vartotojams apie tai, kaip duomenys yra apdorojami.

Reikia paminėti ir kai kuriuos praktinius patarimus: kūrėjams derėtų testuoti modelius lokaliai prieš jas dislokuojant į Cocoon, kur TEE gali turėti specifinių apribojimų (pvz., atminties langai, failų sistemos bendrinimas). GPU šeimininkams svarbu laikytis geros saugumo praktikos: atnaujinti TEE firmware, naudoti patikimus operacinių sistemų branduolius, ir užtikrinti, kad host’ų tinklo sąsajos būtų izoliuotos nuo kitų paslaugų.

Galiausiai, nors decentralizuotas modelis suteikia daug privalumų, pramonė turi laiko patikrinti jo mastelį ir patikimumą realiomis apkrovomis. Analitikai ir infrastruktūros inžinieriai stebės metrikas, tokias kaip vidutinė užduoties latencija, klaidų dažnis enkliavuose, mokėjimų vėlavimai ir šeimininkų reputacijos indeksai.

Apibendrinant, Cocoon nėra vien tik technologinė naujovė — tai eksperimentas, kaip decentralizacija ir konfidencialus skaičiavimas gali pakeisti AI ekosistemą, suteikdami privatumo, konkurencingų kainų ir didesnės infrastruktūros diversifikacijos galimybes.

Šaltinis: smarti

„Technologijos visada mane žavėjo – nuo išmaniųjų telefonų iki dirbtinio intelekto proveržių. Džiaugiuosi galėdama dalintis naujienomis su jumis kiekvieną dieną.“

Palikite komentarą

Komentarai

Marius

Ar tai tik marketingas? Kainos ir SLA svarbu, bet latencija ir garantijos lems. Jei užduotys užtruks, dev'ai nepereis, o allowlist kaip apsaugo nuo modelio vagystės?

duombyte

Na wow, privatumas skamba viliojančiai, bet ar tikrai šeimininkas nieko nemato? Jei SGX bus pažeistas, problemos.. bet idomu stebėti kaip tai veiks realybėje