Dirbtinio intelekto proveržis Tarptautinėje matematikos olimpiadoje

3 Minutės

AI pasiekimai Tarptautinėje matematikos olimpiadoje

Tarptautinė matematikos olimpiada (IMO) yra išskirtinė pasaulinė arena gabiausiems priešuniversitetinio amžiaus matematikams. Čia elitinės moksleivių komandos iš įvairių šalių sprendžia šešis ypač sudėtingus matematikos uždavinius. Paprastai tik apie 8 % dalyvių laimi prestižinį aukso medalį, pelnytai laikomi geriausiais jaunaisiais matematikais pasaulyje.

Šiemet inovatyvios dirbtinio intelekto (DI) kompanijos OpenAI ir Google išplėtė didelių kalbos modelių (LLM) galimybes – įtraukdamos naujausias savo DI sistemas į 2025 metų IMO simuliaciją kaip virtualius dalyvius. Abi įmonės savo pažangiausiems LLM taikė olimpiados standartus: dvi atskiras 4,5 valandos trukmės egzamino sesijas, jokių išorinių įrankių ar interneto prieigos, o sprendimus teko pateikti natūralia kalba parengtomis įrodymais.

OpenAI pakelia DI matematinio mąstymo kartelę

Šią savaitę OpenAI paskelbė, jog naujausias jų loginio mąstymo modelis IMO simuliacijoje pasiekė geriausių dalyvių lygį. Spręsdamas aukščiausio lygio olimpiadų uždavinius, OpenAI modelis pademonstravo precedento neturintį gebėjimą įveikti kompleksinius teoremų įrodymus ir matematinio argumentavimo uždavinius – tai, kas iki šiol buvo sunkiai pasiekiama moderniausiems DI sprendimams. Šis laimėjimas žymi svarbų žingsnį DI taikymuose matematikos srityje.

Google Gemini Deep Think viršija lūkesčius

Po OpenAI sėkmės viešumoje pasirodė Google naujienos: atnaujintas Gemini Deep Think modelis taip pat pasiekė aukso medalio lygį, sėkmingai išsprendęs penkis iš šešių IMO uždavinių. Ši Gemini versija apima naujausius proveržius DI loginio mąstymo srityje, panaudojant Google DeepMind tyrimų rezultatus „paralelios minties“ technologijoje. Skirtingai nei tradiciniai modeliai, Gemini vienu metu analizuoja kelias sprendimų alternatyvas, o tai padidina efektyvumą ir tikslumą.

Google DeepMind komanda pažymi, jog šis Gemini modelis buvo lavinamas naudojant naujus pastiprinamojo mokymo metodus, leidžiančius AI sistemai pasitelkti daugiapakopį loginį mąstymą, sudėtingus uždavinių sprendimus ir išsamias teoremų įrodymų duomenų bazes. Be to, Gemini sukaupė profesionaliai atrinktą aukštos kokybės matematikos sprendimų archyvą, papildytą strateginėmis instrukcijomis, skirtomis IMO tipo uždaviniams.

Pagrindinės DI inovacijos ir funkcijos

Paraleli mąstymo technologija: kelių sprendimų paieška vienu metu padeda greičiau ir kūrybiškiau spręsti problemas.
Pastiprinamasis mokymasis: taikomi naujausi metodai daugiapakopiam mąstymui įvaldyti.
Kruopščiai atrinkti duomenys: modelis lavinamas su aukštos kokybės matematiniais įrodymais ir ekspertų užuominomis, kas DIDELIAI sustiprina jo konkurencingumą matematikoje.

AI prieš AI: kaip Google Gemini lenktyniauja su OpenAI

Tiek Google Gemini Deep Think, tiek OpenAI loginio mąstymo modelis demonstruoja pasaulinio lygio DI sprendimų paieškos gebėjimus, galinčius varžytis ir net iššaukti stipriausius matematikus. Nors OpenAI išsiskiria universaliu loginio mąstymo taikymu olimpiadinio lygio uždaviniams, Gemini stiprybė – patobulintas paralelus mąstymas bei naujoviški pastiprinamojo mokymosi metodai, dėl ko jis tampa rimtu konkurentu akademiniuose DI tyrimuose.

Potencialios DI taikymo sritys ir poveikis rinkai

Įspūdingi šių didžiųjų kalbos modelių rezultatai olimpiadoje atveria daug platesnes galimybes. DI gali būti taikomas automatizuotų įrodymų kūrime, išmanių edukacinių įrankių vystymui, matematikų – tyrėjų pagalbai. Tokie proveržiai galėtų reikšmingai pagreitinti inovacijas moksliniuose tyrimuose, STEM srityse ir švietime.

Ką žada ateitis Google Gemini Deep Think?

Google paskelbė greitu metu planuojanti patobulintą Gemini Deep Think versiją pasiūlyti išskirtinei patikimų testuotojų grupei. Po pradinio bandymo modelis taps prieinamas Google AI Ultra prenumeratoriams, suteikiant progą išbandyti DI sprendimų potencialą kūrėjams ir tyrėjams.

Ši įkvepianti DI lenktynių eiga tarp OpenAI ir Google žymi naują etapą matematikoje taikomose dirbtinio intelekto atradimuose, nustatydama aukso standartą būsimam DI modelių vystymui.

Šaltinis: neowin

Domantas Čepaitis

„Esu žaidimų entuziastas ir AI entuziastas. Rašau apie tai, kas svarbu – naujausius žaidimus, AI projektus ir tai, kaip šie du pasauliai jungiasi.“

Komentarai

Palikite komentarą

Dirbtinio intelekto proveržis Tarptautinėje matematikos olimpiadoje

AI pasiekimai Tarptautinėje matematikos olimpiadoje

OpenAI pakelia DI matematinio mąstymo kartelę

Google Gemini Deep Think viršija lūkesčius

Pagrindinės DI inovacijos ir funkcijos

AI prieš AI: kaip Google Gemini lenktyniauja su OpenAI

Potencialios DI taikymo sritys ir poveikis rinkai

Ką žada ateitis Google Gemini Deep Think?

Komentarai

Susijusios straipsniai

Moon Studios keičia kryptį: „No Rest for the Wicked“ pirmenybę teikia PlayStation 5 ir Switch 2 platformoms

iQOO Neo 11 ir Neo 11 Pro: Naujos kartos flagmanai, keičiantys našumo standartus

Galaxy Z Fold 7 – tvirtumo rekordus mušantis lankstomas ekranas su pažangiomis technologijomis

Philips plečia nešiojamų „Bluetooth“ kolonėlių asortimentą Indijoje

Xiaomi 16 serijos pristatymas rugsėjį: ko tikėtis iš naujosios flagmanų linijos

FuriosaAI sudaro strateginę partnerystę su LG, apeidama Meta įsigijimo pasiūlymą

ChatGPT pasiekė 2,5 milijardo užklausų per dieną visame pasaulyje

Oficialiai pristatytas Google Pixel 10 Pro dizainas: Ko laukti iš naujosios serijos?

Latent Labs pristato LatentX: revoliucija baltymų inžinerijoje dirbtinio intelekto pagalba