„TildeOpen“: atvira lietuviška didžiojo kalbos modelio pamatinė versija, kuri keičia DI galimybes Lietuvoje

„TildeOpen“: atvira lietuviška didžiojo kalbos modelio pamatinė versija, kuri keičia DI galimybes Lietuvoje

0 Komentarai Austėja Kavaliauskaitė

4 Minutės

Kas yra „TildeOpen“ ir kodėl tai svarbu Lietuvai?

Baltijos šalių kalbos technologijų bendrovė „Tilde“ pristatė atvirą pamatinę didžiojo kalbos modelio (LLM) versiją lietuvių kalbai – „TildeOpen“. Modelis, sukurtas naudojant vienus galingiausių Europos superkompiuterių, yra prieinamas visiems: vyriausybinėms institucijoms, įmonėms, mokslininkams, universitetams ir kūrėjams Lietuvoje. Tai reikšmingas žingsnis Lietuvos rinkoje, nes leidžia kurti specializuotus DI sprendimus lietuvių kalba, sprendžiant tiek saugumo, tiek lokalizacijos problemas.

Techninės charakteristikos ir architektūra

„TildeOpen“ yra neuroninių tinklų pagrindu sukurtas pamatinis modelis, turintis daugiau nei 30 mlrd. parametrų. Jis buvo apmokytas naudojant didelius mažųjų kalbų tekstynus, įskaitant lietuvių kalbą, ir optimizuotas Europos daugiakalbiams poreikiams. Modelio architektūra buvo sukurta taip, kad užtikrintų efektyvumą: pagal „Tilde“ tyrimų rezultatus, „TildeOpen“ lietuvių kalboje veikia apie 37 % efektyviau nei LLaMA-3 ir 18 % efektyviau nei GPT-4o. Tai reiškia mažesnes infrastruktūros sąnaudas bei greitesnį reakcijos laiką diegiant sprendimus Vilniuje, Kaune ar kituose Lietuvos miestuose.

Kur ir kaip buvo kuriamas modelis

Modelis buvo mokytas pasitelkiant Europos superkompiuterius „LUMI“ ir „JUPITER“ – prieigą prie GPU valandų „Tilde“ gavo per Europos Komisijos konkurso „Dirbtinio intelekto didysis iššūkis“ programą. Intensyvus mokymas ir optimizavimas leido parengti pirmąją „TildeOpen“ versiją per maždaug metus. Modelis paskelbtas kaip atvirojo kodo sprendimas platformoje Hugging Face ir atitinka ES Dirbtinio intelekto akto reikalavimus.

Saugumas ir vietinis diegimas

Saugumas yra vienas iš kertinių „TildeOpen“ privalumų Lietuvos rinkai. Populiarieji komerciniai LLM dažnai talpinami duomenų centruose už ES ribų, todėl daug institucijų (ypač valstybinių) negalėjo jų naudoti dėl griežtų duomenų apsaugos reikalavimų. „TildeOpen“ galima diegti vietiniuose serveriuose ar ES debesijos infrastruktūroje, taip išlaikant jautrius duomenis organizacijos viduje ir eliminuojant nutekėjimo rizikas. Tai ypač aktualu Lietuvos ministerijoms, sveikatos įstaigoms ir finansų sektoriui.

Pritaikymas valstybės institucijoms

Valstybės institucijoms, kurios tvarko asmens duomenis ar nacionalinio saugumo informaciją, atsiranda galimybė saugiai naudoti DI sprendimus – nuo dokumentų automatinio analizės iki natūralaus kalbos supratimo įrankių. Tai atveria kelią platesniam DI diegimui Lietuvos viešajame sektoriuje.

Funkcijos, privalumai ir naudojimo scenarijai

Funkcijos: lietuvių kalba optimizuotas teksto supratimas, mašininis vertimas, santraukų generavimas, natūralios kalbos sąveika, duomenų apdorojimas bei specializuotų DI asistentų kūrimas.

Privalumai: atvirumas (open-source), vietinis diegimas, atitikimas ES reguliavimams, mažesnės eksploatacijos sąnaudos dėl efektyvumo, geresnė lokalizacija lietuviams bei kitoms mažosioms Europos kalboms.

Panaudojimo atvejai Lietuvos rinkoje: automatizuotas didelių apimčių dokumentų vertimas ir apdorojimas valstybiniuose archyvuose; medicininių įrašų analizė ir santraukų generavimas ligoninėse; klientų aptarnavimo bei draudimo bylinėjimų atvejų analizė bankuose ir draudimo bendrovėse; mokymo priemonių kūrimas Lietuvos universitetams ir startuoliams Vilniuje bei Kaune.

Komparacija su globaliais modeliais ir rinkos reikšmė

Nors pasauliniai modeliai, tokie kaip GPT-4 serija, yra galingi, jie ne visada gerai atstovauja mažajoms kalboms ir dažnai sukelia duomenų suvereniteto dilemas. „TildeOpen“ užpildo šią spragą – jis yra specialiai pritaikytas Europos ir Lietuvos kontekstui, todėl Lietuvos verslams ir viešajam sektoriui suteikia įrankį, leidžiantį pasiekti geresnę kalbinę kokybę ir laikytis ES teisinės bazės. Lietuvos startuoliai ir tyrėjai dabar gali eksperimentuoti su pamatiniu modeliu ir kurti nišinius sprendimus lietuviams bei regiono rinkai.

Ateities perspektyvos ir integracija į Lietuvos ekosistemą

„TildeOpen“ yra tik pradžia – pamatinis modelis yra skirtas tolesnei adaptacijai ir specializacijai pagal konkrečias užduotis. Laukiama, kad Lietuvos universitetai, mokslo instituti ir technologijų įmonės aktyviai prisidės prie jo adaptavimo. Diegiant šiuos sprendimus Vilniuje ir Kaune, galima tikėtis spartesnės DI įsisavinimo, didesnės automatizacijos ir geresnio paslaugų lokalizavimo lietuviams.

Apibendrinant: „TildeOpen“ suteikia Lietuvos rinkai saugų, efektyvų ir atvirą pagrindą DI sprendimams lietuvių kalba – nuo viešojo sektoriaus optimizavimo iki inovacijų privačiame sektoriuje.

Šaltinis: delfi

„Technologijos visada mane žavėjo – nuo išmaniųjų telefonų iki dirbtinio intelekto proveržių. Džiaugiuosi galėdama dalintis naujienomis su jumis kiekvieną dieną.“

Komentarai

Palikite komentarą

Susijusios straipsniai