Proveržis Lietuvai: atviras lietuviškas didysis kalbos modelis „TildeOpen“ atveria DI galimybes verslui ir valstybei

Proveržis Lietuvai: atviras lietuviškas didysis kalbos modelis „TildeOpen“ atveria DI galimybes verslui ir valstybei

0 Komentarai Andrius Janulevičiūtė

4 Minutės

Trumpai: ką pristatė „Tilde“ ir kodėl tai svarbu Lietuvai

Baltijos šalių kalbos technologijų lyderė „Tilde“ pristatė atvirą pamatinę didžiojo kalbos modelio (LLM) versiją lietuvių kalbai – „TildeOpen“. Modelis, sukurtas per metus naudojant Europos superkompiuterius „LUMI“ ir „JUPITER“, turi daugiau nei 30 mlrd. parametrų ir yra specialiai apmokytas naudojant mažųjų kalbų tekstynus, tarp jų – lietuvių. Tai reiškia geresnį veikimą lietuviškai, galimybę diegti modelį vietiniuose serveriuose ir platesnį DI pritaikymą Lietuvos rinkoje.

Modelio savybės ir technologinė išraiška

Architektūra ir efektyvumas

„TildeOpen" architektūra sukurta orientuojantis į Europos daugialypes kalbas. Pagal bandymus modelis lietuviškai veikia apie 37 % efektyviau už „LLaMA-3“ ir 18 % efektyviau už „GPT-4o“. Tai reiškia mažesnį skaičiavimo kaštą ir greitesnį atsakų generavimą – ypač svarbu Lietuvos įmonėms, startuoliams Vilniuje ir Kaune bei viešojo sektoriaus institucijoms, kurios siekia optimizuoti diegimo kaštus ir infrastruktūrą.

Parametrai ir apmokymai

Modelis turi daugiau nei 30 mlrd. parametrų ir buvo treniruojamas naudojant dideles mažųjų kalbų kolekcijas. Tokio tipo mokymai užtikrina aukštesnę kokybę dirbant su lietuviškais tekstais: nuo terminologijos atpažinimo iki stiliaus ir gramatikos subtilybių, kurios yra itin svarbios teisiniams, medicininiams ir finansiniams dokumentams.

Saugumas ir duomenų nuosavybė – esminė nauda Lietuvos vartotojams

Vienas esminių „TildeOpen“ privalumų – galimybė talpinti modelį organizacijos vidiniuose serveriuose ar ES debesijos sprendimuose. Tai ypač aktualu Lietuvos viešosioms įstaigoms, finansų įmonėms ir sveikatos sektoriui, kuriems galioja griežtos asmens duomenų apsaugos taisyklės (GDPR). Vietinis diegimas sumažina duomenų nutekėjimo riziką ir padeda atitikti teisės aktų reikalavimus, kas iki šiol ribojo DI sprendimų taikymą strategiškai svarbiose institucijose.

Kaip „TildeOpen“ keičia Lietuvos rinkos perspektyvas

Lietuvoje auga susidomėjimas DI sprendimais – tiek versle, tiek valstybinėse institucijose. „TildeOpen“ suteikia galimybę kurti specializuotus lietuvių kalbos DI produktus: automatizuotus klientų aptarnavimo asistentus, dokumentų santraukų ir vertimo sistemas, duomenų analizės įrankius, taip pat sektoriams pritaikytus sprendimus bankams, draudimo bendrovėms, sveikatos priežiūros įstaigoms ir mokslo institucijoms. Dėl vietinio diegimo galimybių technologijų tiekėjai Vilniuje ir Kaune gali pasiūlyti saugius, teisės aktus atitinkančius paslaugų modelius Lietuvos įmonėms.

Naudojimo scenarijai ir praktiniai pavyzdžiai

Valstybė ir viešasis sektorius

Valstybinės institucijos gali diegti „TildeOpen“ vidaus serveriuose ir naudoti jį dokumentų analizavimui, dažnai užklausų automatizavimui, viešųjų paslaugų automatizavimui bei greitesniam ataskaitų rengimui. Tai ypač aktualu departamentams, dirbantiems su jautria informacija.

Verslas ir privačios organizacijos

Lietuvos įmonės gali kurti DI padėjėjus klientų aptarnavimui lietuvių kalba, automatizuotus vertimus didelių apimčių turiniui, teksto santraukas ir duomenų analizės įrankius. Startuoliai gali greitai integruoti „TildeOpen“ į savo produktus, taip paspartindami inovacijų diegimą Lietuvos rinkoje ir tarptautiniu mastu.

Komparacija su tarptautiniais modeliais

Nors pasauliniai modeliai kaip „GPT-4o“ pasižymi plačiu funkcionalumu, jie dažnai yra apmokyti daugiausia anglų kalba ir hostinami ne ES. „TildeOpen“ prisitaikė prie lietuvių kalbos ypatumų ir užtikrina duomenų saugumą bei atitikimą ES reikalavimams. Tai leidžia Lietuvos organizacijoms išvengti teisinių ir saugumo kliūčių, susijusių su duomenų saugyklų geografinėmis nuostatomis.

Ateities perspektyvos Lietuvoje

„TildeOpen“ – tai pamatas, ant kurio Lietuvos technologijų ekosistema gali statyti sprendimus. Kūrėjai kviečiami pritaikyti modelį konkrečioms užduotims: nuo medicininių semantinių paieškų iki pažangių DI asistentų verslams Vilniuje, Kaune ir visoje Lietuvoje. Modelio atvirumas skatina bendruomenės indėlį: akademija, startuoliai ir verslas gali kartu tobulinti ir sertifikuoti sprendimus, pritaikytus Lietuvos rinkai.

Išvados

„TildeOpen“ žymi reikšmingą žingsnį lietuviško DI link: tai ne tik technologinis pasiekimas, bet ir praktinis įrankis, kuris padeda Lietuvos institucijoms ir verslui saugiai ir efektyviai diegti dirbtinį intelektą vietinėje aplinkoje. Dėl didesnio veikimo efektyvumo lietuvių kalba, galimybės vietinio diegimo ir atviro prieinamumo, „TildeOpen“ turi potencialą pagreitinti DI pritaikymą Lietuvos rinkoje ir sustiprinti vietinių technologijų tiekėjų konkurencingumą.

„Man patinka gilintis į detales. Tiek vertindama naują įrenginį, tiek kurdama mokomuosius straipsnius, stengiuosi rašyti paprastai, bet išsamiai.“

Komentarai

Palikite komentarą

Susijusios straipsniai