3 Minutės
AI pasiekimai Tarptautinėje matematikos olimpiadoje
Tarptautinė matematikos olimpiada (IMO) yra išskirtinė pasaulinė arena gabiausiems priešuniversitetinio amžiaus matematikams. Čia elitinės moksleivių komandos iš įvairių šalių sprendžia šešis ypač sudėtingus matematikos uždavinius. Paprastai tik apie 8 % dalyvių laimi prestižinį aukso medalį, pelnytai laikomi geriausiais jaunaisiais matematikais pasaulyje.
Šiemet inovatyvios dirbtinio intelekto (DI) kompanijos OpenAI ir Google išplėtė didelių kalbos modelių (LLM) galimybes – įtraukdamos naujausias savo DI sistemas į 2025 metų IMO simuliaciją kaip virtualius dalyvius. Abi įmonės savo pažangiausiems LLM taikė olimpiados standartus: dvi atskiras 4,5 valandos trukmės egzamino sesijas, jokių išorinių įrankių ar interneto prieigos, o sprendimus teko pateikti natūralia kalba parengtomis įrodymais.
OpenAI pakelia DI matematinio mąstymo kartelę
Šią savaitę OpenAI paskelbė, jog naujausias jų loginio mąstymo modelis IMO simuliacijoje pasiekė geriausių dalyvių lygį. Spręsdamas aukščiausio lygio olimpiadų uždavinius, OpenAI modelis pademonstravo precedento neturintį gebėjimą įveikti kompleksinius teoremų įrodymus ir matematinio argumentavimo uždavinius – tai, kas iki šiol buvo sunkiai pasiekiama moderniausiems DI sprendimams. Šis laimėjimas žymi svarbų žingsnį DI taikymuose matematikos srityje.
Google Gemini Deep Think viršija lūkesčius
Po OpenAI sėkmės viešumoje pasirodė Google naujienos: atnaujintas Gemini Deep Think modelis taip pat pasiekė aukso medalio lygį, sėkmingai išsprendęs penkis iš šešių IMO uždavinių. Ši Gemini versija apima naujausius proveržius DI loginio mąstymo srityje, panaudojant Google DeepMind tyrimų rezultatus „paralelios minties“ technologijoje. Skirtingai nei tradiciniai modeliai, Gemini vienu metu analizuoja kelias sprendimų alternatyvas, o tai padidina efektyvumą ir tikslumą.
Google DeepMind komanda pažymi, jog šis Gemini modelis buvo lavinamas naudojant naujus pastiprinamojo mokymo metodus, leidžiančius AI sistemai pasitelkti daugiapakopį loginį mąstymą, sudėtingus uždavinių sprendimus ir išsamias teoremų įrodymų duomenų bazes. Be to, Gemini sukaupė profesionaliai atrinktą aukštos kokybės matematikos sprendimų archyvą, papildytą strateginėmis instrukcijomis, skirtomis IMO tipo uždaviniams.
Pagrindinės DI inovacijos ir funkcijos
- Paraleli mąstymo technologija: kelių sprendimų paieška vienu metu padeda greičiau ir kūrybiškiau spręsti problemas.
- Pastiprinamasis mokymasis: taikomi naujausi metodai daugiapakopiam mąstymui įvaldyti.
- Kruopščiai atrinkti duomenys: modelis lavinamas su aukštos kokybės matematiniais įrodymais ir ekspertų užuominomis, kas DIDELIAI sustiprina jo konkurencingumą matematikoje.
AI prieš AI: kaip Google Gemini lenktyniauja su OpenAI
Tiek Google Gemini Deep Think, tiek OpenAI loginio mąstymo modelis demonstruoja pasaulinio lygio DI sprendimų paieškos gebėjimus, galinčius varžytis ir net iššaukti stipriausius matematikus. Nors OpenAI išsiskiria universaliu loginio mąstymo taikymu olimpiadinio lygio uždaviniams, Gemini stiprybė – patobulintas paralelus mąstymas bei naujoviški pastiprinamojo mokymosi metodai, dėl ko jis tampa rimtu konkurentu akademiniuose DI tyrimuose.
Potencialios DI taikymo sritys ir poveikis rinkai
Įspūdingi šių didžiųjų kalbos modelių rezultatai olimpiadoje atveria daug platesnes galimybes. DI gali būti taikomas automatizuotų įrodymų kūrime, išmanių edukacinių įrankių vystymui, matematikų – tyrėjų pagalbai. Tokie proveržiai galėtų reikšmingai pagreitinti inovacijas moksliniuose tyrimuose, STEM srityse ir švietime.
Ką žada ateitis Google Gemini Deep Think?
Google paskelbė greitu metu planuojanti patobulintą Gemini Deep Think versiją pasiūlyti išskirtinei patikimų testuotojų grupei. Po pradinio bandymo modelis taps prieinamas Google AI Ultra prenumeratoriams, suteikiant progą išbandyti DI sprendimų potencialą kūrėjams ir tyrėjams.
Ši įkvepianti DI lenktynių eiga tarp OpenAI ir Google žymi naują etapą matematikoje taikomose dirbtinio intelekto atradimuose, nustatydama aukso standartą būsimam DI modelių vystymui.
Šaltinis: neowin

Komentarai