Kodėl dirbtinis intelektas kalbės lietuviškai: 23 ištekliai

Kodėl dirbtinis intelektas kalbės lietuviškai: 23 ištekliai

Austėja Kavaliauskaitė Austėja Kavaliauskaitė . Komentarai

4 Minutės

Ekonomikos ir inovacijų ministerija atnaujina Lietuvos dirbtinio intelekto (DI) strategiją ir siekia sustiprinti lietuviškų kalbinių išteklių prieinamumą. Viceministras Darius Zailskas praneša, kad iki šių metų pirmojo ketvirčio pabaigos turėtų būti sukurti ir įdiegti 23 nauji lietuvių kalbos ištekliai, kuriuos verslai ir tyrėjai galės nemokamai integruoti į savo DI sprendimus.

Kas sudarys išteklius ir kaip juos galima naudoti?

Turinys ir funkcijos

Išteklių rinkinį sudarys tekstiniai korpusai, žodynai, užrašytos kalbos įrašai, anotacijos ir katalogai, skirti balso atpažinimui (ASR), balso sintezei (TTS), natūralios kalbos apdorojimui (NLP) ir kalbos modeliams mokyti. Tokie produktai leis kurti vietinius balso asistentus, automatinį diktavimą, transkripcijos paslaugas, prieinamumo sprendimus neįgaliesiems ir geresnius sektorių sprendimus sveikatos apsaugoje ar švietime — ypač Vilniuje, Kaune ir regionuose.

Integracija ir prieinamumas

Ministerija žada surinkti duomenis į vieningus katalogus ir duomenų masyvus bei suteikti prieigą verslui nemokamai. Tai reiškia, kad Lietuvos įmonės, startuoliai ir viešasis sektorius gaus techninius komponentus ir švarius duomenis, kuriuos galės integruoti per API ar vietinius sprendimus.

Finansai ir laiko grafikas

Pagal 16 RRF (Atsigavimo ir atsparumo mechanizmo) projektų numatoma investuoti apie 26 mln. eurų šiems 23 ištekliams kurti. Iš viso kalbinių išteklių plėtrai anksčiau buvo skirta 42,35 mln. eurų (2021–2026 m.), o projektų techniniai reikalavimai ir biudžetai 2023 m. buvo patikslinti, taip sutaupyta apie 11,34 mln. eurų. Be to, ministerija skirs 10 mln. eurų Vidurio ir vakarų Lietuvos labai mažoms, mažoms ir vidutinėms įmonėms, kurios kuria DI produktus ar sprendimus.

Privalumai Lietuvos rinkai

Lietuvos verslams tai reiškia greitesnę DI sprendimų kūrimo pradžią ir mažesnes pradines išlaidas. Dabartinė DI įsidiegimo Lietuvoje statistika rodo apie 9% įmonių naudojančių DI, kai ES vidurkis — 14%. Prioritetas prieigai prie lietuviškų žodžių ir aukštos kokybės balso įrašų gali paskatinti spartesnę DI plėtrą Vilniuje, Kaune ir regionuose, taip prisidedant prie produktyvumo augimo — siekiant iki 2030 m. priartėti prie ES vidurkio.

Palyginimas ir poveikis

Palyginti su globaliais žaidėjais, Lietuvos iniciatyva išsiskiria tuo, kad daug dėmesio skiriama kalbos lokalizacijai ir atviram prieinamumui. Tarptautinis EY tyrimas rodo, kad derinant DI įrankus su darbuotojų mokymu galima padidinti darbo našumą iki 40%, tačiau Lietuvoje tik nedidelė dalis darbuotojų (apie 5%) DI naudoja radikaliems procesų pertvarkymams. Prieinami lietuviški duomenys padės užpildyti šią spragą.

Naudojimo atvejai (use cases)

  • Sveikatos apsauga: automatinė paciento pokalbių transkripcija, medicininių anketų apdorojimas.
  • Švietimas: automatinės paskaitų transkripcijos, lietuviškos kalbos mokymosi įrankiai.
  • Viešasis sektorius: klientų aptarnavimas telefonu, viešųjų paslaugų prieinamumo gerinimas regionuose.
  • Privatus sektorius ir SME: vietiniai chatbotai, automatizuotos žmogiškųjų išteklių sistemos, teksto analizė klientų atsiliepimams.

LitAI ir tolimesnė ekosistema

Be duomenų išteklių, Lietuvos konsorciumas 2025 m. gavo 65 mln. eurų kofinansavimą „LitAI“ centrui — projekto, kurio vertė siekia 130 mln. eurų. Tai taps didžiausiu DI technologijų vystymo centru Baltijos šalyse ir papildys duomenų infrastruktūrą, reikalingą pažangiems modeliams kurti Lietuvoje.

Apibendrinant: 23 lietuvių kalbos ištekliai yra kertinis žingsnis, kad DI sprendimai Lietuvos rinkoje taptų prieinamesni, tiksliau pritaikyti lietuviams ir padėtų įmonėms bei viešajam sektoriui sparčiau didinti produktyvumą.

Šaltinis: madeinvilnius

„Technologijos visada mane žavėjo – nuo išmaniųjų telefonų iki dirbtinio intelekto proveržių. Džiaugiuosi galėdama dalintis naujienomis su jumis kiekvieną dieną.“

Palikite komentarą

Komentarai