3 Minutės
OpenAI savo vaizdų generavimo įrankius priartino prie sprendimo, kuris jau labiau primena ne filtrą, o kūrybinį asistentą. ChatGPT Images 2.0 pradedamas diegti su tuo, ką bendrovė vadina mąstymo galimybėmis, ir tai greitai keičia visą požiūrį.
Užuot paprastai pavertusi užklausą į paveikslą, naujoji sistema gali tirti ir apibendrinti informaciją iš žiniatinklio, o tada šią medžiagą paversti švariais, profesionalaus lygio vizualais. Praktikoje tai reiškia, kad ji pristatoma ne tik kaip vaizdų generatorius, bet ir kaip įrankis, galintis padėti kurti diagramas, infografikus, schemas ir kitus vizualinius išteklius su gerokai daugiau konteksto nei anksčiau.
OpenAI taip pat pristato Images 2.0 kaip rimtą alternatyvą atskiroms redagavimo programoms. Jis gali pašalinti fonus, koreguoti formato santykius ir sugeneruoti iki aštuonių vaizdų vienu metu 2K raiška. Tai daro jį gerokai lankstesniu pasirinkimu kūrėjams, rinkodaros specialistams ir komandoms, kurioms reikia greitų vizualų neperjunginėjant kelių skirtingų įrankių.

Geresnis dėmesys detalėms
Vienas didžiausių patobulinimų yra tai, kaip modelis tvarko struktūruotus vizualus. Teigiama, kad infografikai ir diagramos kuriami pastebimai tiksliau, o atnaujinimas palaiko daugiau kalbų ir užtikrina geresnį tikslumą. Taip pat atrodo, kad jis daug uoliau laikosi užklausų instrukcijų, o tai dažnai ir nulemia skirtumą tarp tinkamo rezultato ir varginančio bandymo iš naujo.
Tai svarbiau, nei gali pasirodyti iš pirmo žvilgsnio. Visi, kurie yra naudoję dirbtinio intelekto vaizdų kūrimo įrankius, žino, kaip apmaudu prarasti svarbią detalę, nukrypti nuo temos ar gauti negrabų teksto atvaizdavimą. OpenAI, panašu, taikosi būtent į šias silpnąsias vietas, ypač vartotojams, kuriems reikia ne tik patrauklių, bet ir praktiškai profesionalioje aplinkoje naudojamų vizualų.

ChatGPT Images 2.0 prieinamas visiems ChatGPT vartotojams, tačiau pažangesnis „Images with thinking“ režimas skirtas tik Plus, Pro, Business ir Enterprise planams. Taigi, nors visi gauna prieigą prie naujos kartos variklio, sumaniausias patirties sluoksnis slepiasi už mokamų planų.
Bendresnė kryptis čia akivaizdi. OpenAI vaizdų generavimą stumia tolyn nuo vienkartinio efekto ir artina prie darbo eigos įrankio, kuris gali samprotauti, rinkti kontekstą ir mastu kurti švaresnį rezultatą. Komandoms, kurioms svarbus greitis, nuoseklumas ir vizualinė kokybė, tai yra reikšmingas pokytis.
Palikite komentarą