Apple planuoja Siri atnaujinimo viešą peržiūrą vasarį

Apple planuoja Siri atnaujinimo viešą peržiūrą vasarį

Domantas Čepaitis Domantas Čepaitis . 2 Komentarai

9 Minutės

Apple, kaip pranešama, planuoja kitą mėnesį surengti viešą didelio Siri atnaujinimo peržiūrą — versiją, kurią variklio lygiu maitina Google Gemini modeliai, bet kurią talpins Apple nuosavas debesies sprendimas. Ši pristatymo sesija gali būti pirmas rimtas paskutinio vaizdo, kur Apple demonstruoja, kaip ketina sujungti įrenginio kontekstą su didelės apimties modelių intelektualumu.

Ko tikėtis vasarį

Bloomberg žurnalistas Markas Gurmanas teigia, kad Apple greičiausiai pristatys savo Gemini partnerystės rezultatus vasario antroje pusėje, arba mažo renginio formatu, arba specializuotu spaudos demo. Tikimasi, jog bendrovė pateiks praktinius asistento darbų pavyzdžius, kur jis naudoja asmeninius duomenis ir ekrane rodomą turinį atlikti konkrečius veiksmus, o ne vien tik grąžinti tekstinius atsakymus.

Viduje Apple šį atnaujintą modelį vadina „Apple Foundation Models version 10“, nors pagrindinė technologija kilusi iš Google Gemini. Esminis skirtumas — modelis veiks Apple Private Cloud Compute serveriuose, o tai leidžia Apple pateikti teiginius apie griežtesnę duomenų tvarkymą ir privatumo kontrolę, tuo pačiu išnaudojant didelio masto lingvistinių modelių galimybes.

  • Laikas: demonstracija greičiausiai vyks vasario pabaigoje, kartu su iOS 26.4 beta testavimo pradžia.
  • Technologija: Google Gemini modeliai maitina Apple ženklu pažymėtą fundamentinį modelį, bet jis bus talpinamas Apple infrastruktūroje.
  • Galimybės: supratimas apie ekrane rodomą kontekstą ir asmeninius duomenis siekiant atlikti veiksmus, ne tik pateikti atsakymus.

Nors kitą mėnesį numatytas pristatymas akcentuos naujas funkcijas ir ankstyvus demonstracijos pavyzdžius, visiškai pertvarkyta, pokalbių stiliaus Siri vis dar numatoma platesnei publikos paleidimo datai WWDC 2026 renginyje, kaip dalis iOS 27. Tai reiškia, kad Apple greičiausiai skirstys išleidimą į etapus: pradžioje praktinė peržiūra ir beta atnaujinimai, o vėliau gilesnė, vartotojams matoma pertvarka metų eigoje.

Ar tai bus lūžis Siri istorijoje? Jei demonstracija atitiks pranešimus, galime sulaukti asistento, kuris tikrai supranta jūsų ekrano turinį ir kontekstą — ir veikia nuo infrastruktūros, kurios kontrolę turi Apple. Daugiau detalių paaiškės, kai pasirodys iOS 26.4 beta ir Apple suteiks platesnę informaciją per vasario pristatymą.

Kaip tai veiks techniniu požiūriu

Siekiant suprasti techninį pagrindą, svarbu atskirti kelis pagrindinius komponentus: didelio masto kalbos modelį (LLM), duomenų privatumo ir tvarkymo sluoksnį, bei sinchronizaciją su įrenginio kontekstu. Apple pasirinko įgyvendinimo kelią, kuriame Google Gemini modeliai veikia kaip pagrindinė žinios ir generavimo varomoji jėga, bet skaičiavimai ir modelio aptarnavimas atliekami Apple Private Cloud Compute aplinkoje. Tokiu būdu Apple siekia išlaikyti teisinę, operacinę ir saugumo atsakomybę už duomenų apdorojimą.

Technologinis architektūros modelis gali apimti kelis žingsnius: įrenginio pusėje lokalizuotas kontekstinis sutrumpinimas (on‑device context summarization), kur iPhone ar iPad parengia fragmentus — pvz., aktyvaus ekrano turinį, atidarytus dokumentus ar programos būseną — ir siunčia tik būtiną apibendrintą kontekstą į Apple privatų debesį. Ten šis kontekstas pateikiamas Gemini pagrindu veikiančiam modelio sluoksniui, kuris sujungia universalias žinias su specifiniu vartotojo kontekstu ir grąžina veiksmus arba komandas, kurias vėliau vykdo įrenginys.

Saugumas ir privatumas

Apple dažnai akcentuoja privatumą kaip savo skirtinį bruožą. Perkelti modelio vykdymą į savo debesį leidžia bendrovei pateikti techninius ir rinkodaros argumentus, kad vartotojų duomenys neperduodami tiesiogiai trečiosioms šalims ar nevaldomiems viešiesiems debesims. Tai taip pat suteikia galimybę labiau kontroliuoti prieigos valdymą, audito žurnalus ir duomenų saugojimo politiką. Tačiau svarbu pažymėti, kad duomenų perdirbimo modelis ir toliau apima perdavimą tarp įrenginio ir serverių: koks duomenų kiekis, kiek ilgai jie saugomi ir ar jie panaudojami modelio tolesniam mokymui — tai klausimai, kuriuos vartotojai ir reguliuotojai stebės atidžiai.

Techninės praktikos, tokios kaip duomenų anonimizavimas, epizodinis konteksto apdorojimas (session‑based processing), ir galimos galimybės laikyti jautrias funkcijas visiškai lokaliai (on‑device execution) gali sumažinti rizikas. Apple galėtų naudoti hibridinį modelį: pateikti asmeninius, jautrius veiksmus atliekant tik įrenginyje, o bendresnius užklausų interpretavimus — Apple debesyje.

Vartotojo patirtis ir naujos galimybės

Pagrindinė Apple tikslinė nauda — Siri transformacija iš paprasto klausimų‑atsakymų asistento į aktyvų, kontekstą suvokiantį agentą, galintį atlikti veiksmus už vartotoją. Tai gali būti toks scenarijus: vartotojas prašo „Paruošk susitikimo santrauką iš mano el. pašto ir pasiūlyk tris laiko intervalus kitai savaitei“. Naujoji Siri turėtų analizuoti atidarytus el. laiškus (turint leidimą), suprasti kalendoriaus tuščias vietas ir pasiūlyti konkrečius veiksmus — sukurti pranešimą, nustatyti kvietimus arba pateikti santrauką pokalbių forma. Svarbu, kad šie veiksmai būtų ne tik tekstiniai atsakymai, bet aktyvūs, realiai inicijuojami veiksmai pagal vartotojo sutikimą.

Tokios galimybės reikalauja patikimos autentiškumo ir leidimų valdymo sistemos: Siri turės prašyti ir įrašyti vartotojo sutikimus atlikti tam tikrus veiksmus, aiškiai nurodyti, kokie duomenys naudojami, ir suteikti paprastą būdą atšaukti leidimus. Be to, svarbi vartotojo sąsaja — dialogas turi būti natūralus, o sistemos atsakymai turėtų būti suprantami ir tinkami kontekste.

Multimodalumas ir ekrano supratimas

Vienas reikšmingų pokyčių — gebėjimas suprasti ekrano turinį (on‑screen context). Tai reiškia, kad Siri galės interpretuoti tai, ką vartotojas mato: atidarytą tinklalapį, dokumentą, nuotrauką ar vaizdo skambučio langą. Multimodaliniai modeliai, kaip Gemini, gerai veikia su teksto ir vaizdo deriniu, todėl bendra integracija su Apple įrenginio sensorika ir UI kontekstu gali leisti labiau pritaikytus ir tikslius pasiūlymus.

Pavyzdžiui, aptikusi ekrane užduotį su keliais punktų sąrašais, Siri galėtų pasiūlyti automatiškai sugeneruoti darbų planą, nustatyti priminimus arba siūlyti temos pagrindu susieti dokumentus ir el. laiškus. Tai labai skiriasi nuo tradicinio Siri elgesio, kuris dažnai ribojasi su vienos eilutės užklausų interpretavimu.

Įtaka kūrėjams ir ekosistemai

Apple planuojamas perėjimas prie LLM integracijos atvers galimybes trečiųjų šalių kūrėjams. Jei Apple suteiks API ar SDK prieigą prie naujojo Siri funkcionalumo (tik per kontroliuojamą ir saugią vartotojo sutikimo sistemą), programų kūrėjai galės integruoti pažangias asistentines funkcijas tiesiai į savo programas — pvz., automatinė turinio santraukų kūrimas, pažangus laiškų analizatorius arba interaktyvios pagalbos sistemos programose.

Tačiau Apple istorijoje yra ribojimų ir prieigos kontrolės pavyzdžių: kompanija linkusi griežtai reguliuoti, kokie trečiosios šalies įrankiai gali pasiekti gilesnį sisteminį funkcionalumą. Todėl kūrėjai turėtų stebėti Apple dokumentaciją ir politiką, kaip bus leidžiama naudoti asmeninius ir kontekstinius duomenis, kokie bus leidimų srautai ir kokios bus kainodaros ar techninės sąlygos.

Konkurencinė padėtis

Integruojant Gemini modelius per Apple infrastruktūrą, Apple gali bandyti sujungti geriausias abiejų pasaulių savybes: pažangų kalbos modelį iš Google ir Apple privatumo bei integracijos privalumus. Tai gali pakeisti konkurencinę dinamiką tarp Apple, Google, Microsoft ir kitų, kurie siūlo savo virtualius asistentus arba LLM paslaugas. Apple pranašumas — plati aparatūros ir operacinės sistemos kontrolė, leidžianti giliau integruoti asistentą į įvairius įrenginius ir funkcijas.

Vis dėlto kritikai gali teigti, kad bet koks modelio naudojimas vis dar remiasi trečios šaltinio technologija (Gemini), o tai kelia klausimų apie priklausomybę nuo Google technologinio stogo. Apple sprendimas talpinti modelį savo debesyje yra aiškus bandymas sumažinti šią priklausomybę vartotojų duomenų valdymo aspektais, bet technologiniu ir licenciniu požiūriu partnerystė išlieka esminė.

Laikotarpis ir galimos rizikos

Pagal pranešimus, demonstracija bus tik peržiūra — ribotos galimybės ir ankstyvi veikimo pavyzdžiai. Tikrasis, plačiai prieinamas pokalbių stiliaus Siri paleidimas planuojamas WWDC 2026 ir iOS 27. Tokia fazinė strategija leidžia Apple išbandyti technologiją ribotoje aplinkoje, gauti atsiliepimus per beta testus (pvz., iOS 26.4 beta) ir pasiruošti pilnam mastui.

Tarp galimų rizikų verta paminėti techninį suderinamumą, energijos suvartojimą (jei kai kurios užduotys bus atliekamos įrenginyje), vėlavimus dėl serverių apkrovos, bei teisinius ir reguliacinius iššūkius, susijusius su duomenų tvarkymu tarp jurisdikcijų. Be to, vartotojų pasitikėjimas bus lemiamas — jei Apple nebus visiškai aiški apie tai, kaip duomenys naudojami, arba jei atsiras duomenų nutekėjimų atvejų, tai gali stipriai paveikti priėmimą rinkoje.

Galimos versijos ir palaikymas

Apple greičiausiai palaikys naują Siri etapais: pradžioje — naujesni įrenginiai, kurie turi pakankamai galingus procesorius ir naujausias iOS versijas, o vėliau — ilgesnis palaikymas senesniems įrenginiams per serverio sprendimus arba supaprastintas funkcijų versijas. Taip pat tikėtina, kad tam tikros pažangiausios funkcijos (pvz., vietinis multimodulinis apdorojimas) bus prieinamos tik naujesnėms aparatūros platformoms.

Išvados ir ko laukti

Apple planuojama Siri peržiūra vasarį gali būti reikšmingas žingsnis asmeninių padėjėjų srityje: parodymas, kaip galima sujungti LLM galimybes su griežta privatumo kontrole ir giliu sistemos integravimu. Svarbu stebėti, kokius saugumo užtikrinimus Apple pateiks, kaip bus formuojami leidimų srautai, ir kokią patirtį galės išbandyti beta vartotojai iOS 26.4 metu.

Techninė bendruomenė, kūrėjai ir privatumą saugančios organizacijos greičiausiai atidžiai nagrinės Apple sprendimų detales. Jei Apple sėkmingai demonstruos tikrai veikiančias, saugias ir patogias vartotojui funkcijas, tai gali tapti nauju etalonu asistentų integracijai mobiliuosiuose įrenginiuose.

Galiausiai, nors Gemini technologija suteikia galingą intelektą, reikšmingiausias skirtumas gali būti tas, kaip Apple sugebės panaudoti šį intelektą savo sistemos lygmeniu — kontroliuodama duomenų srautą, suteikdama aiškią leidimų valdymo patirtį ir integruodama asistento funkcijas ten, kur jos iš tikrųjų padidina naudotojo produktyvumą. Laukite daugiau informacijos per iOS 26.4 beta ir Apple vasario pristatymą.

Šaltinis: gsmarena

„Esu žaidimų entuziastas ir AI entuziastas. Rašau apie tai, kas svarbu – naujausius žaidimus, AI projektus ir tai, kaip šie du pasauliai jungiasi.“

Palikite komentarą

Komentarai

kodasx

Nu va, ilgai laukta Siri atnaujinimas! Jei veiks kaip aprašo, bus žaidimo keitėjas. Bet tikėkimės, privatumą rimtai tvarkys, ne tik žodžiai 👍

Tomas

Tai reiškia, kad Apple matys viską, kas ekrane? Skamba per daug gera... ar tikrai nebus dar vienas duomenų nutekėjimo rizikos sluoksnis? Kas garantuos