Pamiršote dainos pavadinimą? Hum-to-Search randa greitai

Pamiršote dainos pavadinimą? Hum-to-Search randa greitai

Rūta Jankauskienė Rūta Jankauskienė . Komentarai

4 Minutės

Ar kada nors visai netikėtai užstrigote su melodija galvoje, bet niekaip neprisimenate žodžių ar atlikėjo? Toks įsitikinimas – nemalonus ir pažįstamas. Dabar pakanka prunkštelėti, prasukti ar pamiklinti balsą kelias dešimtis sekundžių, ir telefono įrankis gali pasiūlyti tikėtiniausius atitikmenis.

Kaip naudotis: keli žingsniai be vargo

Ant telefono atidarykite naujausią Google programėlės versiją arba paspauskite Google paieškos valdiklį, paliesti mikrofono ikoną ir ištarti „what's this song?“ arba pasirinkti „Search a song“. Tada pradėkite dūzinti, švilpti ar dainuoti 10–15 sekundžių. Jei naudojate Google asistentą, pakaks „Hey Google, what’s this song?“ ir melodijos pristatymo. Funkcija veikia anglų kalba iOS įrenginiuose ir daugiau nei 20 kalbų Android platformoje—Google planuoja palaipsniui plėsti palaikymą.

Po trumpo įrašo sistema pateikia kelių kandidatų sąrašą. Matysite dainos informaciją, atlikėjo duomenis, nuorodas į klipus ar muzikos programėles, tekstą ir kitus įrašus, jei jų yra. Jūsų nereikalaujama turėti idealaus tono ar tiksliai atkurti frazę; svarbiausia – melodijos kontūras.

Technologinis sluoksnis: kodėl tai veikia

Už šios galimybės slypi mašininio mokymosi sistema, kuri perkelia išgirstą garsą į skaitmeninę seką. Melodija veikia kaip pirštų antspaudai: kiekviena turi unikalų formą. Modeliai išgauna pagrindinį melodijos kontūrą – skaitmeninį žemėlapį, kuris atmeta foną, instrumentus, balso tembrą ir kitus trukdžius. Likusi seka lyg „numerinis pirštų atspaudas“ palyginama su didžiule pasauline dainų baze ir surandami geriausi atitikmenys realiu laiku.

Trumpai tariant: sistema neužsiima žodžių ar atlikėjo paieška. Ji analizuoja garsinį modelį. Todėl, pavyzdžiui, „Dance Monkey“ melodiją atpažinsite tiek iš dainavimo, tiek iš švilpimo ar prunkštimo. Toks palyginimas – paprastas, bet galingas paaiškinimas: melodija išlieka pažįstama nepriklausomai nuo garso šaltinio.

Tokia pažanga nėra staiga. Google tyrimų komanda jau anksčiau diegė panašias technologijas: 2017 m. Pixel 2 serijoje tapo prieinama funkcija Now Playing, kuri naudodama giluminius neuroninius tinklus atpažindavo muziką mažos galios režimu. 2018 m. minėta technologija pasiekė ir SoundSearch Google programėlėje bei išsiplėtė iki milijonų kūrinių katalogo. Dabartinis sprendimas žengia dar toliau – jis atpažįsta dainas be žodžių ar originalios įrašos, tik iš melodijos.

Praktiniai apribojimai: aplinkos triukšmas, labai trumpas ar netikslus humas, bei stipriai pakeista melodijos interpretacija gali sumažinti tikslumą. Tačiau modeliai yra treniruoti su įvairiais įrašais – nuo profesionalių studijų iki žmonių dainavimo ir švilpimo – todėl systema gerai toleruoja natūralų sklaidą.

Privatumas ir duomenų naudojimas

Vartotojams svarbu žinoti: įrašai trumpam naudojami paieškai ir modeliams apdoroti. Kaip ir daugelyje panašių paslaugų, Google suteikia galimybes peržiūrėti ir ištrinti paieškų istoriją savo paskyroje. Jei keliate privatumo klausimus, verta patikrinti nustatymus ir leidimus programėlėje prieš naudojant funkciją.

Technologinės perspektyvos

Melodijų atpažinimas be žodžių atveria kelių sričių galimybes: greitesnį archyvų indeksavimą, platesnį muzikos paieškos prieinamumą ir naujas kūrybines priemones atlikėjams bei klausytojams. Tolimesnė plėtra gali apimti geresnį daugiakalbiškumą, mažesnį triukšmo jautrumą ir platesnį integravimą su srautinėmis platformomis bei išmaniaisiais įrenginiais.

Expert Insight

„Melodija yra informacijos forma – struktūra, kurią galima užkoduoti ir palyginti, nepriklausomai nuo ją atlikiančio žmogaus ar instrumento“, – sako dr. Agnė Petrauskaitė, akustinės signalų analizės tyrėja. „Šių modelių stiprybė yra duomenų įvairovė: mokymai su skirtingais žmonėmis ir įrašais leidžia sistemai atpažinti tas pačias melodines figūras daugelyje kontekstų.“

Ji priduria, kad ateityje panašios technologijos gali tapti svarbiu įrankiu etnomuzikologams, leidžiant tirti melodijų paplitimą ir variacijas tarp regionų, bei edukacijos priemone – padedančia lengvinti muzikinį raštingumą be sudėtingų teorinių žingsnių.

Kitąkart, kai melodija užklups netikėtai – užtenka pradėti humminti. Telefonas gali turėti atsakymą greičiau nei spėsite prisiminti vieną žodį.

Labas! Aš – Rūta, mėgstu gilintis į technologijas ir paprastai paaiškinti sudėtingus dalykus. Mano straipsniai – tiek pradedantiesiems, tiek pažengusiems.

Palikite komentarą

Komentarai