Gemma 4 stiprina vietinį DI „Android“ telefonuose

Gemma 4 stiprina vietinį DI „Android“ telefonuose

Jokūbas Žilinskas Jokūbas Žilinskas . Komentarai

3 Minutės

Jau daugelį metų telefonų DI veikė tarsi su kauke. Paklausi, jis atsako, bet kažkur per vidurį tavo duomenys nukeliauja į nutolusį serverį, ten apdorojami ir grįžta atgal. Tas paslėptas aplinkkelis visada buvo kompromisas. Dabar „Google“ nori nutraukti šį ryšį, o „Gemma 4“ yra aiškiausias ženklas, kad įrenginyje veikiantis DI „Android“ ekosistemoje tampa rimtas.

Praėjusią savaitę „Google DeepMind“ kartu su „Arm“ pristatė „Gemma 4“, turėdama aiškų tikslą: leisti pažangiam DI veikti tiesiogiai „Arm“ pagrindu veikiančiuose „Android“ telefonuose, užuot kliaujantis debesija. Anot „Google“, naujoji modelių šeima yra iki keturių kartų greitesnė nei ankstesnės versijos ir gali naudoti net iki 60 % mažiau baterijos. Mažesni E2B ir E4B variantai sukurti galvojant apie telefonus, todėl jie gali apdoroti tekstą, vaizdus ir garsą nesiųsdami užklausos per internetą.

Kodėl čia svarbus „Arm“

Tylusis variklis už šio šuolio yra „Arm“ SME2 instrukcijų rinkinys, priklausantis naujesniems „Armv9“ lustams. Paprastai tariant, jis paspartina matricų matematiką, nuo kurios priklauso šiuolaikinis DI. „Arm“ teigia, kad ankstyvieji inžineriniai bandymai parodė vidutiniškai 5,5 karto geresnį vartotojo įvesties apdorojimą, o atsakymų generavimas su „Gemma 4 E2B“ modeliu buvo iki 1,6 karto greitesnis. Įdomiausia tai, kad kūrėjams nereikia perrašyti savo programų, kad pajustų naudą. „Arm“ „KleidiAI“ programinės įrangos sluoksnis susijungia su esamomis „Google“ vykdymo laiko bibliotekomis, todėl pagerėjimas ateina beveik be jokių trukdžių.

Būtent toks nematomas atnaujinimas ir gali ištraukti įrenginyje veikiantį DI iš demonstracinės stadijos į tai, ką žmonės iš tikrųjų naudoja kasdien. Greitesnis. Lengvesnis. Mažiau priklausomas nuo duomenų ryšio. Tai yra trys dalykai, kurių mobilusis DI siekė nuo pat pradžių.

Aiškiausias pavyzdys yra „Envision“ programėlė, skirta regos negalią turintiems ir silpnai matantiems vartotojams. Iki šiol scenos supratimas dažnai priklausė nuo prieigos prie debesijos. Prototipe, kuriame „Gemma 4“ veikė vietoje „Arm“ procesoriuose, vartotojas galėjo nufotografuoti ir akimirksniu gauti išsamų scenos aprašymą, be jokio tinklo ryšio. Tokiai programėlei veikimas neprisijungus nėra papildoma funkcija. Tai ir yra pati funkcija.

„Google“ taip pat ruošia pagrindą kitam žingsniui. „Gemma 4“ naudojamas kaip pagrindas „Gemini Nano 4“, būsimam įrenginyje veikiančiam „Android“ modeliui. Tai reiškia, kad kūrėjai, šiandien kuriantys su „Gemma 4“, turėtų būti suderinami ir su „Gemini Nano 4“, kai šis pasirodys flagmanų įrenginiuose vėliau šiais metais. „Gemini Nano“ jau palaiko vietines funkcijas, tokias kaip išmanūs atsakymai ir garso santraukos, o lustų gamintojai, pavyzdžiui, „MediaTek“, taip pat aktyviai juda ta pačia kryptimi. „Gemma 4“ papildo šią kryptį dar labiau, nes siūlo multimodalinį palaikymą ir integruotas agentines galimybes.

Kūrėjams prieiga jau atvira. E2B ir E4B modelius galima naudoti per „Google AI Edge Gallery“ „Android“ ir „iOS“ platformose pagal „Apache 2.0“ licenciją. Ir tai svarbu, nes naudingų, privačių ir mažos delsos DI sprendimų lenktynės jau nebevyksta vien debesijoje. Jos persikelia į telefoną, kurį laikote rankoje.

Esu Jokūbas – aistringas dirbtinio intelekto ir žaidimų pasaulio tyrinėtojas. Digin.lt dalinuosi naujienomis ir analizėmis, kurios padeda suprasti technologijų ateitį.

Palikite komentarą

Komentarai