Thomas Wolf: dideli kalbos modeliai — pagalbininkai, ne genijai

Thomas Wolf: dideli kalbos modeliai — pagalbininkai, ne genijai

Viltė Petrauskaitė Viltė Petrauskaitė . Komentarai

7 Minutės

Pagrindinis dirbtinio intelekto (DI) tyrinėtojas Thomas Wolf iš Hugging Face perspėja, kad dabartinė didelių kalbos modelių karta greičiausiai negeneruos išskirtinių, Nobelio lygio mokslo atradimų. Vietoje to jis mato šias sistemas kaip galingus pagalbininkus — vertingus idėjų generavimui, duomenų analizei ir eksperimentų planavimui, bet ne kaip pirminius, paradigmą keičiantį teorijų autorius.

Kodėl įprasti pokalbių botai nepasiekia tikrųjų atradimų

Wolf pabrėžia, kad problema yra struktūrinė ir susijusi su modelių mokymo tikslais. Šiuolaikiniai pokalbių DI modeliai optimizuojami prognozuoti tikimybę, kurią turi sekančias teksto dalis (toknus). Tokia optimizacija daro juos puikiais užduotims, kaip sakinių užbaigimas, straipsnių santraukos kūrimas ar įtikinamai skambančių pasiūlymų davimas. Tačiau ši pati savybė trukdo modeliams generuoti radikaliai naujas idėjas, kurios prieštarauja dominuojančioms prielaidoms.

Išskirtiniai mokslo atradėjai dažnai elgiasi kaip kontrarianai: jie kritiškai peržiūri nusistovėjusią teorinę bazę ir pateikia netikėtus, statistiškai mažai tikėtinus sprendimus, kurie ilgainiui pasirodo esantys teisingi. Pavyzdžiui, Kopernikas pasiūlė saulės sistemos centravimo modelį, kuris prieštaravo tuometiniam konsensusui. Dabartiniai modeliai, treniruojami didžiulėse tekstų rinkmenose, linkę pritarti vartotojo nuostatoms ir plačiai priimtoms nuomonėms — tai slopina kūrybinį kontrarianizmą, būdingą tikriesiems proveržiams.

Be to, modeliavimo pagalba perteikiami statistiniai išvedžiojimai susiję su ankstesnėmis žiniomis, turima dokumentacija ir dažnumo tendencijomis. Tai reiškia, kad modelis gerai apdoroja ir integruoja jau egzistuojančią informaciją, bet jam trūksta mechanizmo, kuris skleistų radikalias hipotezes ir sistemingai jas išbandytų laboratorinėmis ar skaitmeninėmis priemonėmis.

Ne magija, o labai pajėgus kopilotas

Tai nereiškia, kad DI yra bevertis mokslui. Wolf prognozuoja, kad įrankiai, panašūs į ChatGPT ir kitas kalbos modelių platformas, veiks kaip mokslininkų kopilotai — spartindami literatūros apžvalgas, siūlydami eksperimentines kryptis, automatizuodami pasikartojančius analizės žingsnius ir padedami apibendrinti rezultatus.

Jau galime pastebėti realių sėkmių pavyzdžių, kurie iliustruoja, kaip DI padeda pažangai. DeepMind sukurta AlphaFold žymiai pagerino baltymų struktūrų numatymą ir tapo įrankiu, kurį naudoja vaistų vystymo grandinėje. Svarbu suprasti, kad AlphaFold iš esmės sprendžia aiškiai apibrėžtą prognozavimo problemą: remiantis seka ir treniravimo duomenimis numatyti baltymo erdvinę struktūrą. Tai skiriasi nuo fundamentalaus teorinio mokslo kūrimo — AlphaFold neišveda naujos biologijos teorijos iš pirmųjų principų, o programiškai optimizuoja sprendimą konkrečiai užduočiai.

Praktinis DI pritaikymas tyrimuose yra akivaizdus: automatizuotos literatūros paieškos, greitesnis metaduomenų išgavimas, hipotezių surinkimas iš skirtingų disciplinų, statistinės analizės automatizavimas ir net eksperimentų planavimo simuliacijos. Tokios sistemos sumažina rutinines darbo dalis, leidžia tyrėjams skirti daugiau laiko konceptualiam mąstymui ir sudėtingų eksperimentų projektavimui.

Visgi reikia pabrėžti skirtumą tarp instrumentų, kurie atlieka specifines, ribotas užduotis, ir tų, kurie gali sukurti visiškai naują teorinį ramstį. Dabar veikiantys modeliai yra itin geri vėlesniam idėjų plėtiniui ir sukauptos informacijos sintetizavimui, bet ne visiškai autonominiam naujų mokslinių principų formulavimui.

Ambicingi pareiškimai ir atsargesnė realybė

Wolfo skeptiškumas dar labiau paaštrėjo po to, kai jis skaitė kitų DI lyderių esė, teigusių, jog DI greitai atneš transformacinius pokyčius biologijoje ir medicinoje. Kai kurie pramonės balsai prognozavo, kad dešimtmečius trunkantis pažangos tempus galima sutraukti į kelerius metus. Wolfas perspėja, kad dabartinė architektūra ir mokymo tikslai — ypač laiko ir išteklių sąnaudos, susijusios su didelių modelių treniravimu — daro tokias greitas transformacijas mažai tikėtinomis be fundamentalių paradigmų pakeitimų.

Vienas pagrindinių iššūkių yra tas, kad dabartiniai įrankiai neturi įgimto priežastinio mąstymo arba griežto eksperimentinio ciklo integracijos. Jie analizuoja koreliacijas ir modelių pasikartojimus, bet nekuria patikimų priežastinių hipotezių, kurias būtų galima sistemingai tikrinti. Be to, mokslinės atrankos procesas — vertinimas, recenzija, eksperimentinė repeticija — reikalauja ne tik idėjų, bet ir infrastruktūros, etikos, reguliavimo bei daugiadisciplininio bendradarbiavimo.

Kokios kryptys tyrinėjimams gali būti perspektyvios

  • Hibridiniai sprendimai: derinant simbolinį samprotavimą, priežastinumo modelius ir eksperimentais paremto mokymosi ciklus, galima sukurti įrankius, labiau tinkamus atradimams. Tokios architektūros leistų modeliams formuluoti hipotezes, generuoti testuojamus eksperimentų protokolus ir įvertinti numatomų rezultatų priežastinius mechanizmus.
  • Žmogus cikle (human-in-the-loop): DI gali būti naudojamas hipotezių generavimui ir pradinei filtracijai, o kritinį vertinimą ir eksperimentinę validaciją atlieka žmonės. Šis požiūris pabrėžia nediskretišką bendradarbiavimą tarp intelektualių sistemų ir disciplinų ekspertų, sumažinant klaidų riziką ir didinant idėjų patikimumą.
  • Startuoliai, siekiantys daugiau: kelios įmonės, tarp jų Lila Sciences ir FutureHouse, bando peržengti tradicinių pagalbinių įrankių ribas ir kurti sprendimus, orientuotus į tikrąją naujovių generaciją. Jie investuoja į griežtesnius eksperimentinius ciklus, atviresnę duomenų integraciją ir kryžmines disciplinines komandines struktūras, siekdami, kad modeliai nebūtų tik tekstų generatoriai, o dalis platesnių mokslinių platformų.

Trumpai tariant, dabartinis DI puikiai sustiprina žmogaus tyrėjo gebėjimus, bet nepakeičia to netvarkingo, skeptiško kūrybiškumo, kuris lemia Nobelio lygio proveržius. Šiuo metu protingiausi statymai yra tie, kurie siekia sukurti sistemas, papildančias žmonių intuiciją, eksperimentinius pajėgumus ir sprendimų priėmimo procesus, o ne bandančios pakeisti juos.

Be technologinių apribojimų, egzistuoja ir epistemologiniai bei organizaciniai iššūkiai. Mokslas progresuoja ne tik per idėjas, bet ir per institucijas: finansavimą, atliekamų eksperimentų infrastruktūrą, recenzavimo mechanizmus ir tarpdalykinį bendradarbiavimą. Net jeigu modeliai sukurtų įdomias hipotezes, reikalinga struktūra jas patikrinti neatsiranda vien tik dėl modelių pažangos. Todėl DI vaidmuo greičiausiai bus agitacijos priemonė — pagreitinti idėjų gyvavimo ciklą, bet ne sutrumpinti visą mokslinę evoliuciją iki vienų metų.

Taip pat svarbu kalbėti apie vertinimo ir patikimumo sistemas. Kad DI generuota medžiaga taptų vertinga moksline medžiaga, reikia aiškių kriterijų: reproducibility (pakartojamumo), duomenų kokybės, eksperimentų dizaino ir statistinės reikšmės. Be tokios griežtos patikros daug DI pasiūlytų idėjų būtų tik spekuliacijos, kurios gali klaidinti arba iššvaistyti tyrimų resursus.

Galiausiai, etikos klausimai ir atsakomybė už klaidingas rekomendacijas yra kertiniai. Ypač medicinos ir biologijos srityse klaidinga hipotezė gali turėti rimtų pasekmių, jei ji nebus patikrinta tinkamu būdu. Todėl DI sistemų integracija į mokslą turi vykti su aiškiais atsakomybės mechanizmais ir griežta valdymo praktika.

Apibendrinant: dideli kalbos modeliai turi daug potencialo pagerinti mokslinį darbą, bet jų dabartinės savybės ir mokymo tikslai riboja jų gebėjimą generuoti tikrai naujas, paradigmą keičiančias teorijas. Perspektyviausias kelias — hibridinės architektūros, žmogaus ir mašinos bendradarbiavimas bei investicijos į eksperimentinę validaciją, kad DI idėjos taptų realiais mokslo atradimais.

Šaltinis: cnbc

Sveiki! Esu Viltė, kasdien sekanti technologijų naujienas iš viso pasaulio. Mano darbas – pateikti jums svarbiausius ir įdomiausius IT pasaulio įvykius aiškiai ir glaustai.

Palikite komentarą

Komentarai