Dainos atpažinimas giedojant: kaip veikia Google sistemos

Dainos atpažinimas giedojant: kaip veikia Google sistemos

Andrius Janulevičiūtė Andrius Janulevičiūtė . Komentarai

4 Minutės

Negalite prisiminti dainos pavadinimo, bet melodija vis dar tūno galvoje? Nauja „hum to search“ funkcija leidžia rasti tą užsitikusį kūrinį vien tik giedojant, svilpiant ar murminant — be žodžių, be atlikėjo vardo ir be idealaus tono.

Kaip naudotis: paprasti žingsniai

Funkcija veikia mobiliuosiuose įrenginiuose per naujausią „Google“ programėlės versiją arba per paieškos valdiklį. Tiesiog palieskite mikrofono piktogramą ir pasakykite „what's this song?“ arba pasirinkite mygtuką „Search a song“. Tuomet 10–15 sekundžių giedokite, svilpkite arba murmokite melodiją. Taip pat galima naudoti Google asistentą: „Hey Google, what’s this song?“ ir pradedate giedoti.

Kaip mašinos atpažįsta melodijas

Melodija veikia kaip pirštų atspaudas: kiekvienas kūrinys turi savo unikalias sekas. Kai giedate į paiešką, mašininio mokymosi modeliai paverčia garso įrašą skaitmenine, skaitine seką, kuri reprezentuoja tik melodijos kontūrą — tai reiškia, kad algoritmai pašalina papildomus elementus, pavyzdžiui, instrumentų aranžuotę, vokalo tembrą ar ritmo niuansus.

Ką tai reiškia technine prasme

Modeliai apmokomi naudodami įvairius šaltinius: žmonių giedojimą, svilpimą ir murmėjimą bei studijines įrašų versijas. Išgautas skaitinis modelis nėra garso spektrograma, kuri fiksuotų balsą ar instrumentą, o abstrakti seka — tarsi melodijos matematinis pavidalas. Tada sistema realiu laiku lygina šią seką su milijonų dainų katalogu ir pateikia labiausiai tikėtinus atitikmenis.

Istorinis kontekstas ir technologijų raida

Ši funkcija remiasi anksčiau kurtomis muzikos atpažinimo technologijomis. 2017 m. „Now Playing“ funkcija Pixel įrenginiuose naudojo giluminius neuroninius tinklus žemos galios atpažinimui lokaliai. 2018 m. ta pati technologija pasirodė kaip SoundSearch programėlėje ir išplėtė katalogą iki milijonų kūrinių. Dabar žengtas žingsnis toliau — atpažinti dainas net ir be originalių žodžių ar įrašo, tik pagal vartotojo giedojimą.

Praktiniai aspektai, ribotumai ir nauda

Funkcija jau prieinama anglų kalba iOS ir daugiau nei 20 kalbų Android platformoje; su laiku planuojama palaikyti dar daugiau kalbų. Tai ypač patogu, kai neturite tekstų ar prisiminimų apie atlikėją—užtenka kelių taktų. Vis dėlto rezultatų tikslumas priklauso nuo kelių veiksnių: kiek aiški yra melodija, ar aplinkui triukšmas, ar užteks 10–15 sekundžių, kad užfiksuoti atpažinimo kontūrą.

Jei sistema pateikia kelis variantus, vartotojas gali pasirinkti geriausią atitikmenį ir toliau tyrinėti kūrinį: peržiūrėti atlikėjo informaciją, klausytis dainos muzikos platformose, rasti tekstus ar pažiūrėti vaizdo klipą. Tai jungia paiešką su muzikine ekosistema ir leidžia greitai identifikuoti senus hitus ar naujus atradimus.

Ateities perspektyvos ir susijusios technologijos

Melodijų atpažinimas yra dalis platesnio muzikos informatikos lauko: garsų analizė, atpažinimas pagal tempą ar harmoningumą ir personalizuotos rekomendacijos. Ateityje tokios sistemos gali geriau atlaikyti triukšmą, suprasti niuansuotas variacijas ir palaikyti daugiau kalbų bei regioninių melodijų ypatybių. Integracija su muzikos srautinių platformų API gali dar labiau pagreitinti atradimą ir teisėtą klausymą.

Expert Insight

Dr. Eglė Petrauskaitė, muzikos informatikos mokslininkė: „Melodijos atpažinimas mašininio mokymosi metoduose yra analogiškas kalbos atpažinimui: visa esmė — abstrakti seka, kuri neša melodijos struktūrą. Tai leidžia atpažinti kūrinį nepaisant atlikimo variacijų. Tuo pačiu iššūkis lieka duomenų įvairovėje: kuo platesnis treniravimo rinkinys, tuo geresni rezultatai pasaulinėms melodijoms.“

Iš kur gauti atsakymą greitai

Kitą kartą, kai jums galvoje skambės „da daaaa da da daaaa“, užteks atverti telefoną ir pradėti giedoti. Per kelias sekundes gausite pasiūlymus — ir galbūt pagaliau sužinosite tos dainos pavadinimą. Argi tai ne patogu?

„Man patinka gilintis į detales. Tiek vertindama naują įrenginį, tiek kurdama mokomuosius straipsnius, stengiuosi rašyti paprastai, bet išsamiai.“

Palikite komentarą

Komentarai