8 Minutės
Po 12 metų dirbdamas Meta, Yann LeCun patvirtino, kad paliks kompaniją ir įkurs nepriklausomą startuolį, skirtą Pažangiajai Mašininei Intelektui (AMI). Kaip vienas iš šiuolaikinio dirbtinio intelekto pionierių, LeCun teigia, jog nori laisvesnės aplinkos plėtoti sistemas, kurios tikrai supranta ir mąsto apie fizinį pasaulį, įskaitant fizikos dėsnius, priežastinumo modelius ir ilgalaikę atmintį. Šis žingsnis pabrėžia norą pereiti nuo vien teksto pagrįstų sprendimų prie architektūrų, kurios jungia suvokimą, simuliaciją ir planavimą realiomis sąlygomis. Be to, LeCun planuoja, kad naujasis startuolis bus platforma eksperimentams ir radikalioms idėjoms, kurios gali pasireikšti kaip nauji standartai robotikoje, autonominėse sistemose ir pramonės automatizacijoje.
Kodėl LeCun stato prieš didžiųjų kalbos modelių (LLM) tendenciją
LeCun ilgą laiką buvo skeptiškas pramonės susitelkimui ties didžiųjų kalbos modelių (LLM) masteliavimu. Vietoje to, jis palankiau vertina vadinamuosius pasaulio modelius (angl. world models) — dirbtinį intelektą, kuris geba simuliuoti ir argumentuoti apie realaus pasaulio įvykius, suprasti fizikos dėsnius ir priežastinumo ryšius, saugoti nuolatinę atmintį ir planuoti sudėtingas veiksmų sekas. Tokie modeliai orientuoti į agentų elgseną, kuri mokosi ne tik prognozuoti kitą žodį tekste, bet ir numatyti pasekmes fizinėse terpėse, atlikti daugpakopius uždavinių planus, valdyti tarpinius tikslus ir adaptuotis prie kintančio pasaulio. LeCun nuomone, vien tik kalbos modelių dydžio didinimas — daugiau sluoksnių, daugiau parametrų — nėra garantija, kad bus pasiektas žmogaus lygiagretus supratimas arba tikrasis kognityvinis mąstymas. Vietoj to reikalingi architektūriniai pokyčiai, integruojantys percepciją, veiksmo modeliavimą, priežastinumo inferenciją ir ilgalaikę atmintį, kurie kartu sudarytų tvirtą pamatą bendresniam, fiziką suvokančiam DI.
Nuo FAIR laboratorijų prie nepriklausomos AMI laboratorijos
Per savo darbą Meta (FAIR) ir Niujorko universitete (NYU) LeCun tyrinėjo minėtas idėjas tiek pramonės tyrimų, tiek akademinėje aplinkoje. FAIR laboratorijoje buvo sukaupta patirtis apie giliojo mokymosi architektūras, konvoliucines tinklines ir savireguliuojamo mokymosi metodus, o akademinėje erdvėje — apie teorinius pagrindus ir tarpdalykinius perėjimus. Dabar jis siekia brandinti AMI koncepcijas nepriklausomame startuolyje, kuriame radikalūs požiūriai galėtų sparčiai evoliucionuoti be korporacinių didžiųjų technologijų struktūrų apribojimų. Tokioje aplinkoje būtų lengviau eksperimentuoti su naujais mokymosi signalais, integruoti realaus laiko sensorinius duomenis, kurti sudėtingas simuliacijas ir diegti nuolatinio mokymosi mechanizmus. Pavyzdžiui, įsivaizduokime agentus, kurie kaupiasi patikimas žinias apie pasaulį (ilgaamžę faktinę atmintį), planuoja daugpakopes užduotis, dalinasi modeliais tarp įvairių aparatūros tipų ir tiesiogiai sąveikauja su fizinėmis aplinkomis — nuo pramoninių linijų iki namų robotikos ir savavaldžių transporto priemonių. Tokia laboratorija galėtų sutelkti mokslininkus, inžinierius ir praktikų komandą, orientuotą į architektūras, kurios veikia per priežastinumo modeliavimą, simuliacijas ir sensorinę integraciją, o ne tik per didžiulius teksto duomenų kiekius.

Nebus visiškas atsiskyrimas: naujo tipo partnerystė
LeCun liks Meta iki metų pabaigos, o vėliau pereis į išorinio partnerio vaidmenį. Meta jau pranešė, kad bendradarbiaus su jo startuoliu ir turės prieigą prie jo inovacijų — tokia sąveika panaši į Microsoft ir OpenAI arba Google ir Anthropic santykius. Tai reiškia, jog jo pasitraukimas mažiau primena ryšio nutraukimą, o labiau — strateginį atšakos kūrimą (spin-off), leidžiantį abiem pusėms veikti greičiau ir eksperimentuoti su skirtingomis tyrimų kryptimis. Tokia partnerystė gali suteikti startuoliui prieigą prie infrastruktūros ir duomenų, o Meta — konkurencingą prieigą prie pažangių technologijų, kurių kūrimas gali vykti už tradicinių korporatyvinių ribų. Be to, toks hibridinis modelis sumažina riziką darbuotojams ir investuotojams: startuolis išlaiko nepriklausomą mokslo laisvę, tuo tarpu partneris gali integruoti sėkmingas sprendimų dalis į savo produktus ir paslaugas. Dėl šios priežasties šis žingsnis gali paskatinti kitus vyresnius tyrėjus pasirinkti panašius kelius — įkurti specializuotas laboratorijas, kurios glaudžiai bendradarbiauja su pramonės lyderiais, bet turi laisvę eksperimentuoti su radikaliais prototipais ir naujomis vertėmis.
Ką AMI gali pakeisti dirbtinio intelekto srityje ir ekonomikoje
LeCun pateikia AMI kaip kitą didžiąją revoliuciją dirbtinio intelekto srityje. Jei tokios sistemos bus sėkmingos, jos gali pakeisti pramonės šakų veikimą — ypač užduotims, kurios reikalauja fizinio pasaulio supratimo, ilgalaikio planavimo ir patikimos atminties. Tai apimtų sritis nuo robotikos ir logistikos iki pramonės automatizacijos, sveikatos priežiūros įrenginių, žemės ūkio technologijų ir autonominių transporto priemonių. Skirtumas nėra tiesiog laipsniškas našumo pagerėjimas — kalbama apie architektūrinį poslinkį: vietoje sistemų, kurios daugiausia modeliuoja tekstines ar paviršutiniškas koreliacijas, statomas pagrindas, leidžiantis modeliams išmokti fizikos dėsnius, priežastinius ryšius ir nuoseklius veiksmų planus. Tokios sistemos galėtų vykdyti daugpakopes operacijas, valdyti sudėtingas valdymo užduotis ir išlaikyti svarbią kontekstinę informaciją per ilgą laiką. Ekonominiu požiūriu tai reikštų naujas vertės grandines: nuo automatizuotų priežiūros platformų iki adaptuojamų gamybos linijų, kuriose agentai mokosi optimizuoti procesus ne tik pagal momentinius duomenis, bet pagal modeliuojamą fizinę sistemą ir jos priežastines priklausomybes.
Tačiau šio perėjimo mastas priklausys nuo technologinių pasiekimų ir integracijos su esamomis technologinėmis sistemomis. Pavyzdžiui, pramoninė integracija reikalauja saugumo garantijų, suprantamumo (explainability), valdymo reikalavimų ir ekonominio naudingumo vertinimo. AMI gali skatinti naujų darbo vietų kūrimą techninėse srityse — simuliacijų inžinerijoje, roboto programavime, sensorikos projektuose — tuo pačiu keičiant tradicinius darbus, kurie susiję su monotoninėmis veiklomis. Šis pokytis bus kompleksiškas: kai kuriose srityse bus didelis efektyvumo prieaugis, kitur — socialinės ir reguliavimo iššūkiai, susiję su saugumu, atsakomybės paskirstymu ir duomenų valdymu.
Kokie techniniai iššūkiai laukia AMI vystymo
Vis dar egzistuoja dideli techniniai barjerai, kuriuos būtina spręsti: pasaulio modeliams reikalingi turtingesni mokymo signalai, geresnė integracija su sensorika ir simuliatoriais, taip pat architektūros, kurios sujungtų percepciją, atmintį ir planavimą vienoje visumoje. Reikia efektyvių metodų nuolatiniam mokymuisi (continual learning), kad modeliai galėtų įsisavinti naują patirtį be ankstesnių žinių praradimo (angl. catastrophic forgetting). Taip pat svarbi sample efficiency — gebėjimas mokytis su mažesniais duomenų kiekiais, nes daug realių fizinių procesų nėra lengvai masiškai ženklinami. Be to, reikalingi geresni simuliatorių tikslumo lygiai, kurie atspindėtų realaus pasaulio fizikos niuansus, ir pažangesnės integracijos su sensoriais, tokiais kaip LiDAR, vaizdo kameros, jutikliai jėgoms ir taktiliniai jutikliai, kad agentai galėtų mokytis iš daugialypės informacijos.
Tarp architektūrinių sprendimų aptinkame poreikį sujungti simbolinius metodus su giluminio mokymosi tinklais (neurosymbolic), plėtoti priežastinio mokymosi (causal learning) metodikas, ir taikyti hibridines strategijas, kurios naudoja tiek modeliuojamą simuliaciją, tiek realų pasaulio eksperimentavimą. Saugumas ir vertinimo metrikos išlieka esminės — būtina sukurti patikimus testavimo rinkinius, kurie įvertintų modelių gebėjimą suprasti priežastinius santykius, išlaikyti ilgalaikę atmintį ir planuoti daugpakopes operacijas saugiai. Nepaisant to, turint Meta kaip partnerį ir LeCun reputaciją, startuolis greičiausiai pritrauks aukščiausio lygio tyrėjus, inžinierius ir kapitalą, reikalingą šiems iššūkiams įveikti.
Kodėl tai svarbu dirbtinio intelekto kraštovaizdžiui
LeCun pasitraukimas iš Meta pabrėžia kylančią tendenciją DI srityje: vyresnioms tyrėjų kartoms įkuriant nepriklausomas iniciatyvas, siekiančias alternatyvių požiūrių į pagrindines problemas, kartu išlaikant bendradarbiavimą su technologijų gigantais. Toks hibridinis modelis gali paspartinti pažangą, sujungiant mažų, kūrybingų komandų lankstumą su didelių firmų ištekliais ir infrastruktūra. Observatoriams tai yra eksperimentas, kurio rezultatai svarbūs: ar AMI požiūris pranoks LLM-pirmą kelią, ar taps papildomu sluoksniu platesniame DI ekosistemos portfelyje. Svarbu pažymėti, kad šie keliai nėra išimtinai viena kitą atmetantys; LLM technologijos ir pasaulio modeliai gali būti komplementarūs: vieni gali būti stiprūs kalbine konstrukcija ir dialogu, kiti — planavimu ir fizikos supratimu.
Ar sekate šiuos pokyčius dėl jų techninio potencialo ar ekonominių pasekmių, Yann LeCun žingsnis akcentuoja augančią diskusiją DI tyrimuose: ar tęsti didžiųjų kalbos modelių skalavimą, ar pergalvoti pačią intelekto bazę, integruojant pasaulio modeliavimo ir priežastinumo paradigmas. Ateities tyrimai ir praktika greičiausiai parodys, kaip šios kryptys susipins — ar AMI taps nauja norma, ar taps svarbiu papildomu įrankiu platesniame dirbtinio intelekto portfelyje. Nepriklausomai nuo baigties, šis atvejis atkreipia dėmesį į būtinybę įvairinti tyrimų metodus, skatinti tarpdisciplininius sprendimus ir investuoti į saugų, paaiškinamą ir aplinkos suvokimą turintį DI.
Šaltinis: smarti
Komentarai
Tomas
Oho, ne tik žodžiai! Jei pavyks, robotika gali pasikeist radikaliai. Bet kiek laiko kol bus saugu? na, įdomu.
laboras
Ar LeCun sugebės pereiti nuo LLM prie tikros 'world model' revoliucijos? Idėja įkvepia, bet realybėj sensoriai, simuliacijos ir saugumas... didžiuliai iššūkiai. Gal per daug optimizmo?
Palikite komentarą