GPT-5 paleidimas: aukštos kilmės startas aptemdytas netiksliais vizualais | Digin - Technologijų naujienos, apžvalgos ir tendencijos Lietuvoje
GPT-5 paleidimas: aukštos kilmės startas aptemdytas netiksliais vizualais

GPT-5 paleidimas: aukštos kilmės startas aptemdytas netiksliais vizualais

2025-08-09
0 Komentarai Jokūbas Žilinskas

3 Minutės

Apžvalga: aukšto profilio startas aptemtas dėl prastų vizualų

OpenAI GPT-5 dabar veikia ChatGPT, tačiau modelio pradžios transliacija sukėlė netikėtai nemalonią akimirką: tai buvo vizualai ir paveikslėlių generavimas, kurie neatitiko pagrindinės patikros ribų. Vietoj to, kad būtų didelis žingsnis link AGI, dėmesys buvo atkreiptas į netiksliai pateiktus palyginamuosius grafikus ir klaidas paveikslėlių kartose, keldamas klausimus apie modelio patikimumą ir vertinimo praktiką.

Ką nutiko demonstracijoje

Matomiausia problema buvo baro diagrama, lyginanti kodavimo rodiklius tarp kartų. GPT-5 gavo 52,8% įvertinimą, tačiau jo stulpelis atrodė beveik dvigubai aukštesnis už senesnio o3 modelio, kurio įvertinimas buvo 69,1%. Dar keisčiau, stulpelis 69,1% buvo nupieštas tas pats aukštis kaip GPT-4o 30,8% stulpelis. Socialiniai tinklai ir technologijų leidiniai greitai pažymėjo šią nesutapimą, o klipai vis dar lieka tiesioginės transliacijos archyve, nepaisant pataisymų rašytiniame tinklaraščio įraše.

Aptarimas ir iš karto įvykdyti pataisymai

Sam Altman reagavo į sparčiai paplitusį klaidą su lengvu įrašu, pripažindamas „mega diagramos klaidą“, o OpenAI atnaujino tinklaraščio įrašą, kad pataisytų vizualus. Kilmė – ar žmogaus dizaino klaida, ar automatizuotas kartojimas – viešai nebuvo patvirtinta.

Produkto savybės ir gebėjimai

GPT-5 ateina su laukiamais atnaujinimais, būdingais naujos kartos dideliems kalbos modeliams: didesniais konteksto langais, patobulintu multimodaliniu valdymu ir išplėtotu kodo generavimu. Modelis reklamuojamas kaip geresnis natūralios kalbos supratimas, geresnis vaizdo ir teksto sankirštos integravimas bei spartesnis įsivertinimas gamybiniuose diegymuose. Tačiau demonstracija parodė likusius trūkumus grafinių ir diagramų išvedime bei nuolatines haliucinacijų elgesio tendencijas.

Palyginimai ir našumo įvertinimas

Teoriškai GPT-5 žada pažangą prieš GPT-4o ir kitus protėvius, tačiau demonstracija parodo, kaip svarbu tiksliai pateikti vizualinius palyginimus, atkuriamus testų rinkinius ir skaidrią metodiką, kai lyginame modelio našumą – ypač kai skirtumai gali įtakoti verslo įsigijimus ir tyrimų priėmimą.

Privalumai ir apribojimai

  • Privalumai: tvirtesnė multimodalinių duomenų integracija, platesnis kontekstas ilgiems samprotavimams ir patobulinti įrankiai kurti AI funkcijas į programas.
  • Apribojimai: pavyzdžiai rodo, kad paveikslėlių ir diagramų generavimas vis dar gali kurti nereikšmingas etiketes (paveikslėliai su išgalvotais vietovardžiais), o kai kurie tyrimai rodo, kad naujesni reasoning modeliai gali didinti haliucinacijų riziką tam tikromis sąlygomis.

Taikymo atvejai ir realus poveikis

GPT-5 privalumai potencialiai naudingi pokalbinėms AI, kodo pagalbai, turinio kūrimui ir įmonių žinių darbui. Naudojimo atvejai apima automatinį klientų aptarnavimą, kodo peržiūros pagalbininkus, tyrimų santraukų kūrimą ir multimodal turinio kūrimą. Tačiau reguliuojamose pramonės šakose ir saugumo kritinėse situacijose dabartinis haliucinacijų ir vizualinių klaidų lygis reikalauja išsamesnės žmogaus priežiūros ir griežtesnių patikros grandinių.

Rinkos poveikis ir pasitikėjimo įtaka

Ši klaida nėra tik PR klausimas – pasitikėjimas yra esminis turtas AI paslaugų teikėjams. OpenAI veikia didelės vertės ir masto rinkoje, kur demonstracijų patikimumas lemia įmonių sandorius, kūrėjų pasitikėjimą ir viešą nuomonę. Incidentas įkaitina diskusijas apie mokymo duomenų kokybę, modelio atitikimą ir ar mastelis vien tik užtikrina geresnį našumą, ar gali įvesti naujas klaidų rizikas.

Išvada: pamokos AI produktų komandoms

GPT-5 paleidimas rodo, kad net pirmaujančios AI įmonės turi prioritetą griežtai patikrinti, skaidrius palyginimus ir atsargų naujų gebėjimų išleidimą. Praktikams reikia aiškaus plano: įdiegti tvirtą vertinimą, įtraukti žmones į vizualius bei domenų jautrius išvedimus ir reikalauti aiškaus dokumentavimo apie metrikas bei metodus, lyginant didelius kalbos modelius.

Šaltinis: futurism

Esu Jokūbas – aistringas dirbtinio intelekto ir žaidimų pasaulio tyrinėtojas. Digin.lt dalinuosi naujienomis ir analizėmis, kurios padeda suprasti technologijų ateitį.

Komentarai

Palikite komentarą