DeepMind žymeklis keičia AI naudojimą kompiuteryje

DeepMind žymeklis keičia AI naudojimą kompiuteryje

Viltė Petrauskaitė Viltė Petrauskaitė . Komentarai

4 Minutės

Labiausiai erzinanti dirbtinio intelekto naudojimo kompiuteryje dalis yra ne pats DI. Tai nuolatinis nukrypimas nuo darbo eigos. Sustojate viduryje užduoties, pereinate į pokalbių robotą, aiškinate, kas matoma ekrane, nukopijuojate atsakymą ir grįžtate prie darbo, kurį darėte. Dabar „Google DeepMind“ nori pašalinti šią trintį pasitelkdama paprastą idėją, kuri skamba netikėtai radikaliai: paversti žymeklį išmaniu.

Naujoje demonstracijų ir tyrimų peržiūrų serijoje „DeepMind“ parodo, kaip „Gemini“ pagrįstas pelės žymeklis galėtų suprasti ir tai, kur taikote, ir tai, kas yra po juo. Tai visiškai keičia sąveiką. Užuot rašę ilgą užklausą, jūs parodote į objektą ir paprašote norimo rezultato. Sistema pati perskaito aplinkinį vaizdinį ir semantinį kontekstą.

Toks pokytis gali skambėti nedidelis. Tačiau taip nėra. Jis paverčia pelės žymeklį iš pasyvaus navigacijos įrankio aktyviu dirbtinio intelekto pagalbos sluoksniu, esančiu būtent ten, kur jau sutelktas jūsų dėmesys.

Įsivaizduokite, kad užvedate žymeklį ant duomenų lentelės ir paprašote skritulinės diagramos. Arba parodote į receptą ir sakote: „padvigubink šiuos ingredientus.“ PDF dokumentą būtų galima paversti tvarkingais punktais, paruoštais el. laiškui. Sustabdžius kelionių vaizdo įrašą ties restorano kadru, sistema galėtų pateikti rezervacijos nuorodą. Kiekvienu atveju pažadas tas pats: mažiau aiškinimo, mažiau šokinėjimo tarp programų, mažiau rankinio tvarkymo.

„DeepMind“ tai apibūdina kaip žingsnį link „natūralios stenografijos“. Ši frazė svarbi. Daugelį metų DI įrankiai reikalavo, kad naudotojai taptų įgudusiais užklausų rašytojais. Šis metodas naštą perkelia kitur. Kompiuteris atlieka daugiau interpretavimo darbo, o naudotojui tereikia parodyti ir paklausti.

Žymeklis nustoja būti tik žymekliu

Tai nėra vien laboratorinis eksperimentas. „Google“ jau turi du veikiančius bandymus „AI Studio“ aplinkoje, skirtus vaizdų redagavimui ir paieškai žemėlapiuose. Jie suteikia ankstyvą vaizdą, kaip toks sąveikos modelis galėtų veikti realiame pasaulyje. Platesnis planas siekia dar toliau.

„Google“ teigia, kad ši technologija keliauja į „Chrome“, kur naudotojai galės pažymėti arba parodyti į turinį tinklalapyje ir paklausti „Gemini“ apie jį, nerašydami išsamaus paaiškinimo atskirame lange. Tai natūralus DI funkcijų, kurias „Google“ jau nuosekliai diegia savo naršyklėje, tęsinys. Pavyzdžiui, „Auto Browse“ jau dabar gali leisti „Gemini“ atlikti kelių žingsnių užduotis internete.

Yra ir operacinės sistemos aspektas. Versija, vadinama „Magic Pointer“, turėtų pasirodyti „Googlebook“ kompiuteriuose, naujai paskelbtoje bendrovės nešiojamųjų kompiuterių linijoje, orientuotoje į „Gemini“. Jei diegimas vyks taip, kaip pristatyta, ši idėja peržengs naršyklės kortelių ribas ir persikels į platesnę darbalaukio patirtį.

Būtent čia ši koncepcija ima atrodyti didesnė nei tiesiog įdomi demonstracija. Šoniniai skydeliai ir pokalbių robotų langai vis dar prašo naudotojų palikti tai, ką jie daro. DI žymeklis elgiasi priešingai. Jis išlaiko pagalbą įterptą tiksliai toje vietoje, kur atsiranda klausimas.

Kompiuterio pelė daugiau nei pusę amžiaus iš esmės beveik nepasikeitė. Ji vis dar spaudžia, tempia, pažymi ir rodo beveik taip pat, kaip visada. „DeepMind“ idėja patraukli todėl, kad nemėgina pakeisti šio pažįstamo elgesio. Ji ant jo uždeda supratimo sluoksnį.

Ar tai taps standartine šiuolaikinės kompiuterijos funkcija, priklausys nuo įgyvendinimo. Kontekstą suprantantis dirbtinis intelektas skamba galingai, tačiau jis taip pat kelia pažįstamus klausimus apie tikslumą, privatumą ir tai, kiek naudotojai pasitikės sistema, kuri nuolat interpretuoja tai, kas rodoma ekrane. Vis dėlto šios krypties sunku nepastebėti. Jei pokalbių robotai buvo pirmoji didelė generatyvinio DI sąsaja, žymeklis gali tapti kita, kuri iš tiesų atrodo natūrali pačiam kompiuteriui.

Sveiki! Esu Viltė, kasdien sekanti technologijų naujienas iš viso pasaulio. Mano darbas – pateikti jums svarbiausius ir įdomiausius IT pasaulio įvykius aiškiai ir glaustai.

Palikite komentarą

Komentarai