Google pristato Veo 3: naujausią dirbtinio intelekto modelį, generuojantį vaizdo įrašus su garsu

Per 2025 m. Google I/O konferenciją technologijų milžinė pristatė naujausią savo dirbtinio intelekto modelį – Veo 3. Šis modelis išsiskiria gebėjimu generuoti vaizdo įrašus su garsu, remiantis tekstiniais įvesties duomenimis, žymiai praplėsdamas kūrėjų galimybes kurti turinį.

Veo 3 galimybės

Veo 3 leidžia vartotojams sukurti vaizdo įrašus, kuriuose ne tik atkuriami vizualiniai elementai, bet ir pridedamas atitinkamas garsas. Pavyzdžiui, įvedus tekstinę užklausą apie paukščius, modelis sugeneruos vaizdo įrašą su paukščiais ir jų giesmėmis. Ši funkcija suteikia galimybę kurti realistiškesnį ir įtraukiantį turinį.

Fizikos ir sinchronizacijos tikslumas

Google teigia, kad Veo 3 pasižymi aukštu tikslumu atkuriant realaus pasaulio fiziką ir sinchronizuojant lūpų judesius su garsu. Tai reiškia, kad žmonių, gyvūnų ir objektų judesiai vaizdo įrašuose atrodo natūraliai ir sklandžiai, o dialogai ar garsai yra tiksliai suderinti su vizualiniais elementais.

Prieinamumas ir integracija

Šiuo metu Veo 3 yra prieinamas tik Gemini Ultra prenumeratoriams JAV per Gemini programėlę ir verslo klientams per Vertex AI platformą. Be to, modelis bus integruotas į naują Google vaizdo įrašų kūrimo įrankį pavadinimu Flow.

Flow: naujas vaizdo įrašų kūrimo įrankis

Flow sujungia Veo, Imagen ir Gemini modelius, leidžiant vartotojams kurti klipus ir kino scenas naudojant natūralios kalbos aprašymus. Vartotojai gali apibūdinti norimą rezultatą, o įrankis automatiškai sugeneruos atitinkamą turinį. Šiuo metu Flow yra prieinamas tik Google AI Pro ir Ultra prenumeratoriams JAV, tačiau artimiausiu metu planuojama išplėsti prieinamumą į daugiau šalių.

Veo 2 palaikymas ir papildomos funkcijos

Nepaisant Veo 3 pristatymo, Google tęsia Veo 2 palaikymą. Vartotojai gali naudoti šį modelį Flow platformoje, pateikdami nuotraukas kaip nuorodas į žmones, scenas, stilius ar objektus. Be to, siūlomi įrankiai, tokie kaip kameros valdymas, žiūrėjimo kampo keitimas, priartinimas į konkrečius objektus, portreto formato keitimas į peizažą ir elementų pridėjimas ar pašalinimas iš vaizdo įrašo.

Imagen 4 pristatymas

Kartu su Veo 3, Google pristatė ir naują vaizdų generavimo modelį – Imagen 4. Šis modelis pasižymi išskirtiniu gebėjimu atkurti smulkias detales, tokias kaip audinių tekstūros ar gyvūnų kailis, ir gali generuoti tiek fotorealistinius, tiek abstrakčius vaizdus.

Tipografijos ir raiškos patobulinimai

Imagen 4 gerokai pagerino tipografijos atkūrimą, lyginant su ankstesnėmis versijomis, ir gali generuoti vaizdus įvairiomis proporcijomis bei iki 2K raiškos. Šis modelis dabar yra prieinamas per Gemini programėlę, Vertex AI platformą ir Workspace įrankius, tokius kaip Docs ir Slides. Be to, planuojama netrukus išleisti Imagen 3 versiją, kuri bus 10 kartų greitesnė už dabartinę.

SynthID Detector: kovos su netikru turiniu priemonė

Atsižvelgdama į dirbtinio intelekto sukurtų netikrų turinio plitimą, Google pristatė naują portalą pavadinimu SynthID Detector. Vartotojai gali įkelti įtartinus vaizdo ar garso failus, kad patikrintų, ar jie turi SynthID žymėjimą, nurodantį, jog turinys buvo sukurtas naudojant dirbtinį intelektą.

Išvada

Veo 3 ir Imagen 4 pristatymai žymi reikšmingą žingsnį į priekį dirbtinio intelekto generuojamo turinio srityje. Šie modeliai suteikia kūrėjams naujas galimybes kurti aukštos kokybės vaizdo įrašus ir vaizdus, tuo pačiu metu užtikrinant turinio autentiškumą ir kovojant su netikro turinio plitimu. Google toliau investuoja į dirbtinio intelekto technologijas, siekdama suteikti vartotojams pažangius ir patikimus įrankius kūrybai.

Google pristato Veo 3: naujausią dirbtinio intelekto modelį, generuojantį vaizdo įrašus su garsu

Veo 3 galimybės

Fizikos ir sinchronizacijos tikslumas

Prieinamumas ir integracija

Flow: naujas vaizdo įrašų kūrimo įrankis

Veo 2 palaikymas ir papildomos funkcijos

Imagen 4 pristatymas

Tipografijos ir raiškos patobulinimai

SynthID Detector: kovos su netikru turiniu priemonė

Išvada

Komentarai

Palikite komentarą

Susijusios straipsniai

Humanoidiniai robotai: artėjanti revoliucija kasdieniame gyvenime

Google pristato išplėstinį AI režimą: nauja era paieškos sistemoje

Google pristato išplėstinį AI režimą: nauja era paieškos sistemoje

Elono Musko xAI dirbtinio intelekto modelis Grok-3 integruojamas į Microsoft Azure debesų platformą

Dirbtinio intelekto revoliucija e. prekyboje: kaip ChatGPT keičia skaitmeninių pirkimų ateitį be reklamų

„OpenAI“ planuoja statyti duomenų centrą Jungtiniuose Arabų Emyratuose, stiprindama pozicijas Artimuosiuose Rytuose

„Google Gemini“: Dirbtinio intelekto revoliucija televizoriuose, automobiliuose ir išmaniuosiuose laikrodžiuose

Naujas metodas: ADHD diagnozė per akių nuotraukas naudojant dirbtinį intelektą

Dirbtinis intelektas padeda numatyti vėžiu sergančių pacientų išgyvenimo tikimybę: naujos galimybės Lietuvos medicinai

Tyrimas: Trumpi atsakymai didina klaidų tikimybę AI pokalbių robotuose

Google pristato Veo 3: naujausią dirbtinio intelekto modelį, generuojantį vaizdo įrašus su garsu

Dalintis šiuo straipsniu

Veo 3 galimybės

Fizikos ir sinchronizacijos tikslumas

Prieinamumas ir integracija

Flow: naujas vaizdo įrašų kūrimo įrankis

Veo 2 palaikymas ir papildomos funkcijos

Imagen 4 pristatymas

Tipografijos ir raiškos patobulinimai

SynthID Detector: kovos su netikru turiniu priemonė

Išvada

Komentarai

Palikite komentarą

Susijusios straipsniai