OpenAI ChatGPT Images 2.0: išmanesnė vaizdų kūryba

3 Minutės

OpenAI savo vaizdų generavimo įrankius priartino prie sprendimo, kuris jau labiau primena ne filtrą, o kūrybinį asistentą. ChatGPT Images 2.0 pradedamas diegti su tuo, ką bendrovė vadina mąstymo galimybėmis, ir tai greitai keičia visą požiūrį.

Užuot paprastai pavertusi užklausą į paveikslą, naujoji sistema gali tirti ir apibendrinti informaciją iš žiniatinklio, o tada šią medžiagą paversti švariais, profesionalaus lygio vizualais. Praktikoje tai reiškia, kad ji pristatoma ne tik kaip vaizdų generatorius, bet ir kaip įrankis, galintis padėti kurti diagramas, infografikus, schemas ir kitus vizualinius išteklius su gerokai daugiau konteksto nei anksčiau.

OpenAI taip pat pristato Images 2.0 kaip rimtą alternatyvą atskiroms redagavimo programoms. Jis gali pašalinti fonus, koreguoti formato santykius ir sugeneruoti iki aštuonių vaizdų vienu metu 2K raiška. Tai daro jį gerokai lankstesniu pasirinkimu kūrėjams, rinkodaros specialistams ir komandoms, kurioms reikia greitų vizualų neperjunginėjant kelių skirtingų įrankių.

Geresnis dėmesys detalėms

Vienas didžiausių patobulinimų yra tai, kaip modelis tvarko struktūruotus vizualus. Teigiama, kad infografikai ir diagramos kuriami pastebimai tiksliau, o atnaujinimas palaiko daugiau kalbų ir užtikrina geresnį tikslumą. Taip pat atrodo, kad jis daug uoliau laikosi užklausų instrukcijų, o tai dažnai ir nulemia skirtumą tarp tinkamo rezultato ir varginančio bandymo iš naujo.

Tai svarbiau, nei gali pasirodyti iš pirmo žvilgsnio. Visi, kurie yra naudoję dirbtinio intelekto vaizdų kūrimo įrankius, žino, kaip apmaudu prarasti svarbią detalę, nukrypti nuo temos ar gauti negrabų teksto atvaizdavimą. OpenAI, panašu, taikosi būtent į šias silpnąsias vietas, ypač vartotojams, kuriems reikia ne tik patrauklių, bet ir praktiškai profesionalioje aplinkoje naudojamų vizualų.

ChatGPT Images 2.0 prieinamas visiems ChatGPT vartotojams, tačiau pažangesnis „Images with thinking“ režimas skirtas tik Plus, Pro, Business ir Enterprise planams. Taigi, nors visi gauna prieigą prie naujos kartos variklio, sumaniausias patirties sluoksnis slepiasi už mokamų planų.

Bendresnė kryptis čia akivaizdi. OpenAI vaizdų generavimą stumia tolyn nuo vienkartinio efekto ir artina prie darbo eigos įrankio, kuris gali samprotauti, rinkti kontekstą ir mastu kurti švaresnį rezultatą. Komandoms, kurioms svarbus greitis, nuoseklumas ir vizualinė kokybė, tai yra reikšmingas pokytis.

Domantas Čepaitis

„Esu žaidimų entuziastas ir AI entuziastas. Rašau apie tai, kas svarbu – naujausius žaidimus, AI projektus ir tai, kaip šie du pasauliai jungiasi.“

OpenAI ChatGPT Images 2.0: išmanesnė vaizdų kūryba

Geresnis dėmesys detalėms

Palikite komentarą

Komentarai

Susijusios straipsniai

OpenAI nuostolis: kas slepiasi už 35,9 mlrd. eurų?

AI prenumeratų matematika: kas moka tikrą kainą šiandien?

Microsoft AI vizija atsidūrė akcininkų ieškinio taikinyje

SpaceX perka Cursor už 55,8 mlrd.: AI kodavimo šuolis

Qualcomm kuria DI įrenginius po išmaniųjų telefonų

Samsung Galaxy Book6 Edge: DI galia keliaujantiems

Microsoft Surface su Snapdragon X2: kainos kyla aukštyn

Apple ruošia Siri kaip savarankišką AI agentą iPhone

Nadella perspėja: AI modeliai gali ištuštinti pramonę

Honor X70 Pro Max: milžiniška baterija ir ryškus AMOLED

Zai GLM-5.2: milijono žetonų kontekstas programuotojams

Meta AI lustų projektas stringa dėl rimtų masto iššūkių