CLARIN-LV: atskats uz 2025.gadu
29. janvāris, 2026. gads
2025. gads ir bijis nozīmīgs Latvijas CLARIN-LV darbībā: tika papildināts nacionālais valodas resursu un rīku repozitorijs, ar CLARIN infrastruktūru tika iepazīstināti studējošie, mācībspēki un zinātnieki, tika paplašināta sadarbība un iesaiste zināšanu apmaiņā gan Latvijā, gan starptautiski.
CLARIN-LV repozitorijs papildināts ar jauniem digitāliem valodas resursiem, tostarp runas korpusiem, leksiskām datubāzēm un vārdnīcām, veicinot humanitāro un sociālo zinātņu pētnieku piekļuvi kvalitatīviem datiem. Skatītākie valodas resursi CLARIN-LV repozitorijā 2025. gadā bija Tēzaurs.lv (vairāk nekā 1000 skatījumu mēnesī), Līdzsvarotais mūsdienu latviešu valodas tekstu korpuss (ap 250 skatījumu mēnesī) un LATE korpuss runas atpazīšanas novērtēšanai (ap 220 skatījumu mēnesī). Būtisku ieguldījumu repozitorija satura papildināšanā devuši DHELI un Valodu tehnoloģiju iniciatīvas projekti. Lai arī vairums valodas resursu ir brīvpiekļuves, CLARIN-LV reģistrējušies vairāk nekā 120 lietotāju, ne tikai no Latvijas, bet arī no Nīderlandes, Islandes, Polijas, Zviedrijas un citām valstīm.
Sadarbībā ar citiem CLARIN ERIC konsorcija dalībniekiem uzsākts PressMint projekts, kura laikā tiks veidots daudzvalodu vēsturisko laikrakstu korpuss. Projektā no Latvijas piedalās gan Latvijas Nacionālā bibliotēka, gan Latvijas Universitātes Matemātikas un informātikas institūts. Tāpat CLARIN-LV iesaistījies 2025. gadā izveidotajā CLARIN zināšanu centrā par lielajiem valodas modeļiem humanitārajām un sociālajām zinātnēm LLMs4SSH.
Ar CLARIN iepazīstināti gan datorzinātņu studenti kursā “Valodu tehnoloģiju pamati”, gan valodniecības studenti kursā “Ievads datorlingvistikā”. Decembrī CLARIN-LV organizēja praktisku semināru universitāšu pasniedzējiem par Digitālo humanitāro zinātņu kursu reģistru, kura dalībnieki apguva, kā reģistrēt kursus digitālo humanitāro zinātņu reģistrā.
CLARIN-LV pārstāvji aktīvi piedalījās vairākos CLARIN ERIC pasākumos: ikgadējā CLARIN konferencē Vīnē, kur prezentēja Latvijas pētījumus un rīkus, un CLARIN virtuālajā kafejnīcā par CLARIN zināšanu centru atbalstu pētījumiem ar multimodāliem datiem, lielajiem valodu modeļiem un diskursa analīzi.
CLARIN ir Eiropas vienotā valodas resursu un rīku pētniecības infrastruktūra, kuras viena no 26 dalībvalstīm ir Latvija. Latvija CLARIN pievienojās 2016. gadā un kopš 2018. gada tiek uzturēta, izmantojot Valsts pētījumu programmu (piem. DHELI, LATE), Latvijas Zinātnes padomes projektus un citus finanšu instrumentus. Kopš 2025. gada rudens CLARIN-LV publicitātes un izglītības aktivitātes finansē projekts “Latvijas Universitāte un institūti Eiropas pētniecības telpā- izcilība pētniecībā un sadarbībā” (Nr. 1.1.1.5/3/25/I/011).