Latvijā radīts pasaules līmeņa mākslīgā intelekta modelis Eiropas valodām

Author
kursors.lv

4. septembris, 2025. gads

mākslīgais intelekts

Latvijas pētnieki publicējuši pasaulē pirmo mākslīgā intelekta modeli, kurā līdzvērtīgi pārstāvētas latviešu un citas Eiropas valodas. Valodu atbalsta un drošības ziņā jaunais modelis sekmīgi konkurē ar ASV un Ķīnas tehnoloģiju milžiem. Atvērtā koda modelis TildeOpen ļauj veidot daudzveidīgus MI pakalpojumus, kas teicami darbosies arī latviešu un citās mazāk pārstāvētās valodās. Šis unikālais modelis, kura izveidi Eiropas Komisija uzticējusi Latvijas uzņēmumam Tilde, ir brīvi pieejams jebkuram interesentam.

TildeOpen.png
Kursors.lv publicitātes attēls. 

TildeOpen izstrāde kļuva iespējama pēc Tildes uzvaras Eiropas Komisijas konkursā Mākslīgā intelekta lielais izaicinājums (Large AI Grand Challenge), kas ļāva 12 mēnešus izmantot jaudīgāko Eiropas superdatoru LUMI Somijā. Modeļa apmācībai tika atvēlētas divi miljoni superdatora stundas. Modeli radījusi Tildes pētniecības laboratorijas zinātnieku komanda ar deviņiem zinātņu doktoriem un plašu starptautisku pētniecības pieredzi.

Modelim TildeOpen ir 30 miljardi parametru, un tas ir apmācīts ar simtiem miljardu vārdu no visām Eiropas valodām. Latviešu valodas apmācībai izmantoti 29 miljardi vārdu, kas ir lielākais zināmais datu apjoms, kāds jebkad izmantots mākslīgā intelekta izstrādē.

“Lietojot populāros MI modeļus latviešu valodā, redzam gramatiskas kļūdas un neveiklas frāzes, jo tie galvenokārt apmācīti angļu valodā. TildeOpen ir veidots pēc citiem principiem, lai visas Eiropas valodas tajā būtu līdzvērtīgas, tāpēc rezultāts ir daudz kvalitatīvāks,” skaidro Tildes vadītājs Artūrs Vasiļevskis.

Pirmie testi liecina, ka latviešu valodā TildeOpen darbojas par 41% efektīvāk nekā populārais modelis LLaMA-3 un par 24% labāk nekā GPT-4o. Pielāgots tulkošanas uzdevumam, TildeOpen spēj tulkot tekstus būtiski labāk nekā salīdzināma izmēra GPT-4.1 modeļi un strādā ne sliktāk par 60 reizes lielāko supermodeli, uz kā balstās ChatGPT.

Modelis izstrādāts saskaņā ar ES mākslīgā intelekta regulējumu un atbalsta visas 24 ES oficiālās valodas, kā arī ukraiņu un citas kandidātvalstu valodas. Atšķirībā no globālajiem modeļiem, kas parasti darbojas ASV vai Āzijas datu centros, TildeOpen var izvietot lokālos serveros vai Eiropas mākoņkrātuvēs, nodrošinot datu glabāšanu ES robežās saskaņā ar Eiropas datu aizsardzības standartiem.

TildeOpen ir brīvi pieejams platformā Hugging Face, un to var izmantot valsts iestādes, uzņēmumi, zinātnieki un studenti, lai veidotu pielāgotus MI risinājumus – no informācijas apstrādes un klientu apkalpošanas līdz izglītības un kultūras projektiem.

"Mūsu mērķis bija pierādīt, ka arī Latvijā iespējams radīt pasaules līmeņa mākslīgā intelekta tehnoloģijas. TildeOpen ir nozīmīgs solis pretī latviešu un citu mazāku valodu digitālajai līdztiesībai," uzsver Vasiļevskis.

saistītie raksti

mākslīgais intelekts sadarbība pētījumi

Pieejama brīvpieejas grāmata “Mākslīgais intelekts biobanku darbībā: ētiskie, juridiskie un sabiedriskie izaicinājumi”

Izdevniecība Routledge publicējusi grāmatu “Mākslīgais intelekts biobanku darbībā: ētiskie, juridiskie un sabiedriskie izaicinājumi”.  Tajā aplūkoti ētiskie, juridiskie un sabiedrības jautājumi, kas saistīti ar mākslīgā intelekta (MI) pieaugošo lomu medicīnas biobankās. Biobankas ir …

Latvijas Biomedicīnas pētījumu un studiju centrs | researchLatvia

19. augusts, 2025. gads