Google pristato Veo 3: naujausią dirbtinio intelekto modelį, generuojantį vaizdo įrašus su garsu | Digin - Technologijų naujienos, apžvalgos ir tendencijos Lietuvoje
Google pristato Veo 3: naujausią dirbtinio intelekto modelį, generuojantį vaizdo įrašus su garsu

Google pristato Veo 3: naujausią dirbtinio intelekto modelį, generuojantį vaizdo įrašus su garsu

2025-05-21
0 Komentarai

Per 2025 m. Google I/O konferenciją technologijų milžinė pristatė naujausią savo dirbtinio intelekto modelį – Veo 3. Šis modelis išsiskiria gebėjimu generuoti vaizdo įrašus su garsu, remiantis tekstiniais įvesties duomenimis, žymiai praplėsdamas kūrėjų galimybes kurti turinį.

Veo 3 galimybės

Veo 3 leidžia vartotojams sukurti vaizdo įrašus, kuriuose ne tik atkuriami vizualiniai elementai, bet ir pridedamas atitinkamas garsas. Pavyzdžiui, įvedus tekstinę užklausą apie paukščius, modelis sugeneruos vaizdo įrašą su paukščiais ir jų giesmėmis. Ši funkcija suteikia galimybę kurti realistiškesnį ir įtraukiantį turinį.

Fizikos ir sinchronizacijos tikslumas

Google teigia, kad Veo 3 pasižymi aukštu tikslumu atkuriant realaus pasaulio fiziką ir sinchronizuojant lūpų judesius su garsu. Tai reiškia, kad žmonių, gyvūnų ir objektų judesiai vaizdo įrašuose atrodo natūraliai ir sklandžiai, o dialogai ar garsai yra tiksliai suderinti su vizualiniais elementais.

Prieinamumas ir integracija

Šiuo metu Veo 3 yra prieinamas tik Gemini Ultra prenumeratoriams JAV per Gemini programėlę ir verslo klientams per Vertex AI platformą. Be to, modelis bus integruotas į naują Google vaizdo įrašų kūrimo įrankį pavadinimu Flow.

Flow: naujas vaizdo įrašų kūrimo įrankis

Flow sujungia Veo, Imagen ir Gemini modelius, leidžiant vartotojams kurti klipus ir kino scenas naudojant natūralios kalbos aprašymus. Vartotojai gali apibūdinti norimą rezultatą, o įrankis automatiškai sugeneruos atitinkamą turinį. Šiuo metu Flow yra prieinamas tik Google AI Pro ir Ultra prenumeratoriams JAV, tačiau artimiausiu metu planuojama išplėsti prieinamumą į daugiau šalių.

Veo 2 palaikymas ir papildomos funkcijos

Nepaisant Veo 3 pristatymo, Google tęsia Veo 2 palaikymą. Vartotojai gali naudoti šį modelį Flow platformoje, pateikdami nuotraukas kaip nuorodas į žmones, scenas, stilius ar objektus. Be to, siūlomi įrankiai, tokie kaip kameros valdymas, žiūrėjimo kampo keitimas, priartinimas į konkrečius objektus, portreto formato keitimas į peizažą ir elementų pridėjimas ar pašalinimas iš vaizdo įrašo.

Imagen 4 pristatymas

Kartu su Veo 3, Google pristatė ir naują vaizdų generavimo modelį – Imagen 4. Šis modelis pasižymi išskirtiniu gebėjimu atkurti smulkias detales, tokias kaip audinių tekstūros ar gyvūnų kailis, ir gali generuoti tiek fotorealistinius, tiek abstrakčius vaizdus.

Tipografijos ir raiškos patobulinimai

Imagen 4 gerokai pagerino tipografijos atkūrimą, lyginant su ankstesnėmis versijomis, ir gali generuoti vaizdus įvairiomis proporcijomis bei iki 2K raiškos. Šis modelis dabar yra prieinamas per Gemini programėlę, Vertex AI platformą ir Workspace įrankius, tokius kaip Docs ir Slides. Be to, planuojama netrukus išleisti Imagen 3 versiją, kuri bus 10 kartų greitesnė už dabartinę.

SynthID Detector: kovos su netikru turiniu priemonė

Atsižvelgdama į dirbtinio intelekto sukurtų netikrų turinio plitimą, Google pristatė naują portalą pavadinimu SynthID Detector. Vartotojai gali įkelti įtartinus vaizdo ar garso failus, kad patikrintų, ar jie turi SynthID žymėjimą, nurodantį, jog turinys buvo sukurtas naudojant dirbtinį intelektą.

Išvada

Veo 3 ir Imagen 4 pristatymai žymi reikšmingą žingsnį į priekį dirbtinio intelekto generuojamo turinio srityje. Šie modeliai suteikia kūrėjams naujas galimybes kurti aukštos kokybės vaizdo įrašus ir vaizdus, tuo pačiu metu užtikrinant turinio autentiškumą ir kovojant su netikro turinio plitimu. Google toliau investuoja į dirbtinio intelekto technologijas, siekdama suteikti vartotojams pažangius ir patikimus įrankius kūrybai.

Komentarai

Palikite komentarą