Kā rodas latviešu valodas vārdi? LU pētnieki izveido unikālu datubāzi

Author
Andra Kalnača (Tenūrprofesore, Dr. philol., Latvijas Universitātes Humanitāro zinātņu fakultāte)

3. jūlijs, 2026. gads

Latvijas Universitātes Humanitāro zinātņu fakultātes valodnieki izstrādājuši jaunu un unikālu digitālu resursu "Latviešu valodas morfēmu un vārddarināšanas modeļu datubāze (LVMVMD)", kurā apkopoti sistēmiski dati par latviešu valodas vārdu uzbūvi un darināšanu. Datubāze balstīta uz vairāk nekā 75 000 lemmu jeb vārdu pamatformu analīzi, kas izgūtas no "Līdzsvarotā mūsdienu latviešu valodas korpusa LVK2018" – plaša digitāla latviešu valodas tekstu krājuma.

tjwj.jpg
Publicitātes attēls. Foto: Magnific

Jaunizveidotais resurss var noderēt ne tikai valodniekiem – tas palīdz analizēt valodas attīstību, veidot korpusus un vārdnīcas, uzlabot mašīntulkošanu un attīstīt latviešu valodai pielāgotus mākslīgā intelekta rīkus. Tas ļauj pētīt, kā veidojas latviešu valodas vārdi, kā tie savstarpēji saistīti un kā laika gaitā valoda mainās.

Kas ir morfēmas?

Katrs latviešu valodas vārds, ko ikdienā lietojam, sastāv no sīkākām vienībām jeb morfēmām – saknes, priedēkļa, piedēkļa un galotnes – kam katrai piemīt sava nozīme. Pārnestā nozīmē var teikt, ka tām ir līdzība ar skeletu un kauliem dzīvu būtņu anatomijā.

Vissvarīgākā morfēma ir sakne, jo tā ietver vārda nozīmi.

Blakus saknei dažādās kombinācijās var pievienoties arī citas morfēmas, turklāt vārdiem var būt arī vairākas saknes. Piemēram, vārdā "saule" ir divas morfēmas – sakne saul- un galotne -e, savukārt vārdā "saulīte" blakus saknei pievienojies arī piedēklis -īt-, attiecīgi vārdā ir trīs morfēmas saul-īt-e.

Mācoties valodu un tās struktūru, esam apguvuši arī visas morfēmas, to kombinācijas un ietverto nozīmi. Bez šīs prasmes mēs nevarētu sazināties, jo tā ļauj mums katrā situācijā veidot vajadzīgos izteikumus – savienot morfēmas vārdos, sakārtot vārdus teikumos un veidot tekstus atbilstoši saziņas mērķim.

Izzinot morfēmas, var labāk saprast ne tikai pēc kādiem principiem veidojas vārdi, bet arī kā darbojas cilvēka domāšana un valoda kopumā, uz kādām asociācijām, metaforām un metonīmijām balstās mūsu valodiskā un ārpusvalodas uztvere. Piemēram, ne vienam vien latviešu valodas lietotājam pārsteigums var būt tas, ka daļa ogu un sēņu nosaukumu ar piedēkli -en- ir atvasināti no dzīvnieku un putnu nosaukumiem, piemēram, avene-avs, kazene-kaza, lācene-lācis, kā arī cūcene-cūka, gailene-gailis.

Datubāze atklāj vārdu radniecību

Katrs vārds jaunizveidotajā datubāzē ir sadalīts morfēmās un klasificēts pēc vārddarināšanas modeļiem, ļaujot pārliecināties, kurš vārds ir pirmatnīgs, kurš – atvasināts vai salikts, kā arī ar kādiem paņēmieniem latviešu valodā tiek darināti vārdi.

Datubāzē nošķirti arī homonīmi (vārdi, kurus izrunā un raksta vienādi, bet kam atšķiras nozīme, piemēram, dumpis kā "ūdensputns" un dumpis kā "sacelšanās") un homogrāfi (vārdi, kurus izrunā dažādi, raksta vienādi un kam atšķiras nozīme, piemēram, zāle kā "maurs", "zālaugi" un zāle kā "liela telpa"), jo tiem valodā ir dažādi vārddarināšanas modeļi.

Ieguvums ir arī aizgūtu vārdu iezīmēšana ar īpašu norādi tāpēc, ka dalījums morfēmās un vārddarināšanas modeļi mantotiem latviešu valodas vārdiem un aizguvumiem parasti nesakrīt. Turklāt aizgūtus vārdus nereti nav iespējams dalīt sīkāk, jo oriģinālvalodas sastāvdaļas atšķiras no latviešu valodas elementiem. Piemēram, no latviešu valodas viedokļa tādiem aizgūtiem vārdiem kā "kupols", "ingvers", "panelis" varam fiksēt tikai galotni -s vai -is, taču ne sakni, priedēkli vai piedēkli.

Datubāzē vārdi ir sakārtoti ligzdās pēc kopīgas saknes, tāpēc viegli izsekot to izcelsmei, redzēt atvasinājumu un salikteņu veidošanos, kā arī pamanīt atkārtotus vārddarināšanas modeļus un to nozīmes. Ja šādu ligzdu pamatā ir pirmatnīgs darbības vārds, tad bieži ap to grupējas apmēram simts dažādu atvasinājumu un salikteņu.

Piemēram, savstarpēji saistītām mantotām saknēm, kas visas vēsturiski ir vienas saknes varianti, – ved-, ves-, ve-, vez-, vež-, vad-, vaz-, važ- – latviešu valodā atbilst tādi vārdi kā vest, vedējs, pavediens, vedekla, vezums, vadīt, vadība, vadītājs, vads, novads, vazāt, važa, barvedis, tiesvedība, apvedceļš, asinsvads, vadlīnija u. c.

Noderīgi ne tikai valodniekiem

Šobrīd "GitHub" repozitorijā ikviens interesents var piekļūt jaunajai datubāzei, kurā iespējams iepazīties arī ar tās veidošanas principiem, ietverto latviešu valodas materiālu un tā klasifikāciju. 2026. gada laikā taps arī datubāzes lietošanas rokasgrāmata latviešu un angļu valodā. Resurss izveidots atbilstoši starptautiskiem un mūsdienīgiem digitālo valodas resursu standartiem.

Datubāze noderēs ne tikai valodniekiem, bet arī datorlingvistiem, tulkotājiem, informācijas tehnoloģiju speciālistiem, mākslīgā intelekta rīku izstrādātājiem, korpusu, datubāzu un vārdnīcu sastādītājiem, latviešu valodas skolotājiem un latviešu valodas apguvējiem.

Jaunais resurss nodrošina nozīmīgu pamatu turpmākiem datos balstītiem latviešu valodas gramatikas, vārddarināšanas un citiem pētījumiem, kā arī dažādu valodas apguves un lietojuma mācību līdzekļu un rokasgrāmatu izstrādei, jo šai jomā šobrīd trūkst digitālu valodas resursu.

Bez vispusīgas vārddarināšanas sistēmas izpētes nav iespējams pilnvērtīgi izprast arī pārējās valodas apakšsistēmas – gramatiku, vārdu krājumu, pragmatiku, semantiku un to lietojumu.

Raksts izstrādāts Latvijas Zinātnes padomes Fundamentālo un lietišķo pētījumu programmas projektā "Latviešu valodas morfēmu un vārddarināšanas modeļu datubāze (LVMVMD)" (Nr. lzp-2022/1-0013). Plašāka informācija pieejama vietnē https://www.dlmdm.lu.lv/

saistītie raksti

inovācija sasniegumi zinātne

RTU profesors Kristaps Kļaviņš starptautiskā zinātņietilpīgo tehnoloģiju samitā iegūst prestižu «Deep Tech Pioneer» statusu

Rīgas Tehniskās universitātes (RTU) Dabaszinātņu un tehnoloģiju fakultātes profesors Kristaps Kļaviņš, kura vadībā tiek attīstīta neinvazīvās diagnostikas platforma «SwyCard», zinātņietilpīgo tehnoloģiju samitā «Hello Tomorrow Global Summit 2026» gūst lielu starptautisku atzinību. Šis novērtējums n…

Rīgas Tehniskā universitāte

18. jūnijs, 2026. gads

zinātne

Rīgā notiks 2. starptautiskais transkulturālo studiju kongress “Dot un ņemt: “Kohēzijas tīklu” starpdisciplinārā telpa”

2. starptautiskais transkulturālo pētījumu kongress, ko īsteno trīs Eiropas universitātes – Latvijas Kultūras akadēmija Rīgā, Mačeratas Universitāte (Università di Macerata) Itālijā un Lēvenes Katoļu universitāte (KU Leuven) –  norisināsies Rīgā no 2026. gada 30. jūnija līdz 2. jūlijam. Š…

Latvijas Kultūras akadēmija

11. jūnijs, 2026. gads

zinātne

RTU pētnieki iesaistās inovatīva bateriju risinājuma izstrādē elektriskajam transportam

Elektriskajai mobilitātei turpinot strauji attīstīties visā Eiropā, tādi izaicinājumi kā ilgs uzlādes laiks, augstas izmaksas un vides ilgtspējas jautājumi joprojām kavē tās plašāku ieviešanu. Šo izaicinājumu risināšanā iesaistījušies arī Rīgas Tehniskās universitātes (RTU) pētnieki, piedaloties ar…

Rīgas Tehniskā universitāte

11. jūnijs, 2026. gads

zinātne dabaszinātnes

Kā uz Zemes atkārtot procesu, kas notiek Saulē? LU pētnieki strādā pie nākotnes kodolsintēzes tehnoloģijām

Kodolsintēze ir process, kurā, saplūstot vieglu atomu kodoliem, izdalās liels enerģijas daudzums. Tas norisinās arī Saules iekšienē. Lai gan kodolsintēze vēl netiek izmantota komerciālai enerģijas ieguvei, zinātnieki visā pasaulē strādā pie tās attīstības, jo nākotnē tā varētu nodrošināt efektīvu e…

Matīss Sondars (LU Eksakto zinātņu un tehnoloģiju fakultātes Ķīmiskās fizikas institūta pētnieks)

2. jūnijs, 2026. gads