Lietuvių kalbos automatinė morfologinė analizė susiduria su iššūkiais, kai kalbama apie prieveiksmių ir prielinksnių morfologinį daugiareikšmiškumą. Šis reiškinys dažnai apsunkina automatinio morfologinio žymėjimo procesą, nes vienas žodis gali būti klasifikuojamas kaip skirtingos kalbos dalys arba interpretuojamas kaip įvairios tos pačios žodžio linksniuojamosios formos, dėl to pasirenkami neteisingi gramatiniai ženklai iš kelių galimų variantų.
Šiame straipsnyje analizuojama viena tokių problemų, išryškėjusi atliekant lietuvių kalbos automatinę morfologinę analizę - prieveiksmių ir prielinksnių morfologinis daugiareikšmiškumas. Peržvelgus lietuvių kalbos žodynus ir gramatikas, rasta atvejų, kai prieveiksmių ir prielinksnių skirtis neaiški net teoriškai (pvz., kaip traktuoti junginius „toliau nuo“, „šiauriau nuo“ - ar tai dviejų prielinksnių samplaika, ar prielinksnis kartu su prieveiksmiu). Straipsnyje atskleidžiamas šios skirties teorinis bei praktinis problemiškumas, aptariama, kaip būtų galima aiškiau aprašyti prieveiksmių ir prielinksnių skirtumus.
Prieveiksmiai yra viena sudėtingiausių lietuvių kalbos dalių. Apie juos pradėta rašyti dar XVII a. - jau tada imtas kelti klausimas, kaip prieveiksmiai susiję su prielinksniais. Pirmieji tyrėjai, kaip Danielius Kleinas, atkreipė dėmesį į šių dviejų kalbos dalių ryšį, pabrėžė, kad abu gali valdyti linksnius. Nors šiandien žinoma, kad prieveiksmiai linksnių nevaldo, taip kalbininkas rašė apie naujybinius prielinksnio - tokius prielinksnio, kurie sutampa su prieveiksmiais (abipus, anapus) arba sustabarėjusiais daiktavardžių linksniais (vietoj, viršuj), yra iš jų padaryti. Senybiniai prielinksniai pagal darybą nesiejami su savarankiškais žodžiais, pavyzdžiui, per, su, už. XIX a. pradėta teigti, kad prielinksniai yra sustabarėję prieveiksmiai, kai kurie iš jų susijungė su linksniais ir tapo neatskiriami. XX a. kalbininkai, kaip Jonas Jablonskis, pradėjo aiškiai skirti senybinis ir naujybinius prielinksnio ir siūlė, kaip šias dvi kalbos dalis atskirti: jei žodis paaiškina veiksmažodį ar būdvardį, tai jis yra prieveiksmis, o jei vartojamas prie linksnio, be kurio neturi prasmės - prielinksnis. Nors atrodo, kad šiuolaikinėje kalbotyroje skirtumai tarp prieveiksmių ir prielinksnių vis ryškesni, tačiau kyla ir klausimų, į kuriuos atsakymą rasti sunku. Pavyzdžiui, kaip traktuoti junginius „toliau nuo“, „šiauriau nuo“ - ar tai dviejų prielinksnių samplaika, ar prielinksnis kartu su prieveiksmiu; ar prielinksniai gali būti vartojami su naudininko linksniu (pvz., „lygiagrečiai namui“, „statmenai sienai“) - juk įprastai prieveiksmiai vartojami be linksnio, o prielinksniai nevaldo naudininko. Taip pat kyla diskusijų, ar į žodynus verta įtraukti prielinksnius, kilusius iš aukštesniojo ir aukščiausiojo laipsnio prieveiksmių; kokiais konkrečiais kriterijais remiantis atskirti prieveiksmį nuo prielinksnio. Aiškių atsakymų gramatikose nėra, tačiau ši problema tampa vis svarbesnė, ypač sparčiai plėtojantis kompiuterinei lingvistikai.
Automatizuota kalbos analizė dažnai būna netiksli dėl daugiareikšmiškumo tarp įvairių kalbos dalių, tarp jų - ir prieveiksmių bei prielinksnių. Rengiant šį straipsnį, bendradarbiauta su Vytauto Didžiojo universiteto (VDU) Skaitmeninių išteklių ir tarpdisciplininių tyrimų instituto (SITTI) tyrėju Virginijumi Dadurkevičiumi. Jis padėjo iš morfologiškai anotuoto tekstyno MATAS automatiškai išrinkti morfologiškai daugiareikšmius žodžius, t. y. tokias žodžių formas, kurios gali turėti ne vieną gramatinių pažymų variantą. Gavus tokių žodžių sąrašą (iš viso tokių skirtingų žodžių - 63 410, tik nekaitomųjų kalbos dalių - 272), išrinkti prieveiksmiai, kurie gali sutapti su prielinksniais, pvz., „aplank“ („plg. eik aplink“ ir „aplink mane stovi žmonės“ - pavyzdžiai iš „Dabartinės lietuvių kalbos žodyno“ (DLKŽ)). Be to, dalį prieveiksmių, nebuvusių automatiškai sudarytame žodžių sąraše, rankiniu būdu atrinko šio straipsnio autorė iš rengiamos „Lietuvių kalbos homoformų duomenų bazės“.
Kai kurie paminėti žodžiai gali būti ne tik prieveiksmiai ir prielinksniai, bet ir, pavyzdžiui, dalelytės, jungtukai, jaustukai, būdvardžiai (pvz., „iki“ gali būti ir prielinksnis („eik iki namų“), ir prieveiksmis („iki gyvas, to neužmiršiu“), ir jungtukas („lauk, iki aš pareisiu“)). Šiame straipsnyje analizuojami tik prieveiksmių ir prielinksnių sutapimai, nepaisant to, kad tam tikras žodis gali atlikti ir dar kitos nekaitomosios kalbos dalies funkciją. Be to, čia rašoma tik apie 10 žodžių iš 46: arčiau, arčiausiai, arti, iki, netoli, paraleliai, piečiau, skersai, šiauriau, už - straipsnyje aptariami daugiausia diskusijų, neaiškumų keliantys atvejai.
Tyrimo šaltiniai - automatinės morfologinės analizės programa „Morfuoklis“, žodynai - DLKŽ, „Lietuvių kalbos žodynas“ (LKŽ) ir „Bendrinės lietuvių kalbos žodynas“ (BLKŽ) - taip pat gramatikos: „Dabartinės lietuvių kalbos gramatika“ (DLKG 1994), „Lietuvių kalbos gramatika“ (LKG II 1971), „Praktinė bendrinės lietuvių kalbos gramatika“ (PBLKG 2024) ir Jono Šukio knyga „Lietuvių kalbos linksniai ir prielinksniai: vartosena ir normos“ (1998); taip pat tekstynai MATAS bei „Dabartinės lietuvių kalbos tekstynas“ (DLKT).
Verta paminėti, kad iš šaltinių išsiskiria LKŽ, apimantis senųjų raštų ir tarmių vartosenos duomenis, nors iš esmės analizuojami dabartinės lietuvių kalbos raiškos atvejai - šiuo žodynu nutarta remtis dėl platesnio vartojimo konteksto, o į jame esančių pavyzdžių archajiškumą dėmesys nekreipiamas.
Prieš pereinant prie tyrimo medžiagos, reikalinga pabrėžti, kad prieveiksmiai atsiranda arba darybiškai (pvz., gražus - gražiai), arba prieveiksmėjant kitoms kalbos dalims (pvz., gaila) ar konstrukcijoms (pvz., iš tikro). Remiantis Kaziu Ulvydu (1969: 7), iš kitų kalbos dalių padarytus prieveiksmius „prieveiksmėjimo procesas yra palietęs nevienodu laipsniu“, kalbininkas, apibūdindamas iš vardažodžių padarytus prieveiksmius, mini tokias frazes kaip „absoliučiai suprieveiksmėjęs“, „didelis prieveiksmiškumo laipsnis“, „sąlygiškai galima vadinti prieveiksmiais“, „linkęs prieveiksmėti“, „labiausiai suprieveiksmėjęs“, „formų stabarėjimas“, „apstabarėjusi frazė“ ir pan. (Ulvydas, 1969: 7-16). Be to, lietuvių kalboje yra ir nesuprieveiksmėjusių konstrukcijų, kurioms būdinga aplinkybinė raiška, pavyzdžiui, „iš širdies“, „be reikalo“ - tokios frazės yra įgavusios vieno žodžio reikšmę, t. y. įvykusi leksikalizacija.
Kaip rašoma LKG (II 1971: 428), „į prieveiksmį jokiu būdu negalima žiūrėti kaip į kalbos dalį, kur pakliūva visi žodžiai, pradėję netekti vardažodžio ar veiksmažodžio ypatybių. Tarp vardažodžių ir prieveiksmio nuo pat šios kalbos dalies formavimosi pradžios buvo, dabar tebėra (ir, be abejo, ateityje bus) pereinamųjų reiškinių - žodžių bei konstrukcijų, kur jau galima įžiūrėti vardažodiškumo ar veiksmažodiškumo silpnėjimą, bet dar negalima konstatuoti visiško suprieveiksmėjimo“, pavyzdžiui, „iš matymo“, „iš ryto“, „iš viršaus“, „be pertrūkio“. Tai reiškia, kad prieveiksmėjimas gali būti tik dalinis - vardažodiškumas yra nusilpęs, bet visiško suprieveiksmėjimo dar nėra. Kai kurie prieveiksmiai pereina į nesavarankiškas kalbos dalis: prielinksnį, dalelytę. Vadinasi, šis procesas yra nesustojantis, prieveiksmėjimas vyksta lėtai. Toks kalbinės sistemos sudėtingumas iš dalies lemia, kad ne visi prieveiksmiai ar iš jų padaryti prielinksniai būna įtraukti į žodynus - tyrėjai gali nustatyti skirtingą prieveikšmiškumo laipsnį ar dar jo neįžvelgti, o jų nuomonės ne visuomet sutampa. Pavyzdžiui, DLKŽ prieveiksmiu laikomas „iš tikro“, o „Frazeologijos žodyne“ apibrėžiamas kaip frazeologizmas.
Šiuo straipsniu siekiama išanalizuoti, kaip konkretūs prieveiksmiai ir prielinksniai aprašomi žodynuose, jei jie juose aprašomi, pakomentuojama, ar pakankamai aiškios abiejų kalbos dalių apibrėžtys, žodynuose pateikti pavyzdžiai.
Istorinis požiūris į prieveiksmių ir prielinksnių skyrimą
Lietuvių kalbos prieveiksmius ir prielinksnius pirmasis XVII a. aprašė Kleinas „Grammatica Litvanica“. Apibrėžta, kad prieveiksmiai - „žodžiai, kurie neturi savo kaitymo (išskyrus laipsniuojamus prieveiksmius) ir vadinami nekaitomaisiais, arba pastoviaisiais, arba nelinksniuojamaisiais žodžiais“. Remiantis Kleinu, prieveiksmiai gali būti samplaikiniai arba ne: „kiti prieveiksmiai gaunami sujungus vardus (taip vadinti daiktavardžiai) su skiriamuoju prielinksniu, kaip antai „iz tolo““. Vadinasi, jau nuo pirmųjų lietuvių kalbos gramatikų rašoma apie samplaikumą. Prieveiksmiai priskirti tai pačiai nekaitomųjų kalbos dalių grupei kaip ir prielinksniai. Kleinas paliečia ir homonimijos problemą - anot jo, kai kurie prieveiksmiai valdo kilmininką ir turi prielinksnių savybių, pavyzdžiui, „arti miesto“. Dabar tokius žodžius laikome prielinksniais. Rašoma ir apie prielinksnius: kad jie valdo vieną ar daugiau linksnių, tačiau nepaaiškinama, kuo jie skiriasi nuo prieš tai pateiktų prieveiksmių pavyzdžių.
Kiek vėliau, 1651 m., apie prieveiksmius ir prielinksnius rašo Kristupas Sapūnas gramatikoje „Compendium Grammaticae Lithvanicae“. Prieveiksmiai čia irgi priskiriami nekaitomųjų kalbos dalių grupei kartu su prielinksniais. Rašoma ir apie prieveiksmių sintaksę: kad jie vartojami su veiksmažodžiais, dalyviais ar vardažodžiais ir kitais prieveiksmiais. Neužsimenama, kad prieveiksmiai gali valdyti linksnį, tad prieveiksmių ir prielinksnių skirtis aiškesnė.
1730-aisiais apie prieveiksmius ir prielinksnius vokiečių kalba rašė Friedrichas Wilhelmas Haackas gramatikoje „Anhang einer kurtzgefassten Litthauischen Grammatik“, tačiau jų ryšys panašus į aprašytąjį Kleino - teigiama, kad prieveiksmiai gali eiti su linksniu („arti“, „viduje“, „lauke“), tik nepaaiškinama, kaip juos atskirti nuo prielinksnių. Tad iki XVIII a. lietuvių kalbos gramatikos buvo gan panašios - jose apie prieveiksmių ir prielinksnių ryšį rašoma mažai, jie priskiriami vienai kategorijai; teigiama, kad prieveiksmiai gali valdyti linksnius, tačiau neaiškinama, kuo jie skiriasi nuo prielinksnių.
Požiūris į lietuvių kalbotyrą ir į prieveiksmius bei prielinksnius keitėsi nuo XIX a., kai į Rytų Prūsiją atvyko Augustas Schleicheris. Jo „Lietuvių kalbos gramatika“ (1856) - pirmoji akademinė gramatika, parašyta remiantis gyvąja kalba. Schleicheris prieveiksmius apibrėžia taip: „Prieveiksmiai - nekaitoma ir nelinksniuojama kalbos dalis, padaryta iš kaitomų kalbos dalių“. Daug dėmesio skiriama prielinksniams: teigiama, kad jie kilo iš prieveiksmių - iš pradžių buvę savarankiški, dėl dažno vartojimo su tam tikrais linksniais tapo nuo jų nebeatskiriami. Tačiau neaišku, ar taip teigiama apie visus, ar tik apie kai kuriuos prielinksnius.
Nuo XX a. lietuvių kalbos gramatikose imta dar daugiau dėmesio skirti prieveiksmių ir prielinksnių ryšiui. 1901 m. Jablonskis (pasivadinęs Petru Kriaušaičiu) rašė apie prieveiksmių ryšį su prielinksniais: anot jo, iš prieveiksmių kilę tik netikrieji arba prieveiksminiai prielinksniai (pvz., greta, aplink), o tikrųjų (pvz., į, iš) kilmė neaiški. Kalbininkas aiškina, kaip atskirti prieveiksmį nuo prielinksnio - jei žodis paaiškina veiksmažodį ar jo vietoje stovintį būdvardį, tai jis - prieveiksmis, o jei žodis pavartotas prie linksnio, be kurio neturi prasmes, tai jis - prielinksnis. Mėginama įvardyti aiškias taisykles, tačiau matyti, kad jos neapima visų situacijų - pavyzdžiui, prielinksniai gali būti vartojami ir su kitais prieveiksmiais ar padalyviais, o prieveiksmiai - su prielinksniais, dalyviais. Dar vieną gramatiką Jablonskis išleido 1922 m., tik prielinksniai, padaryti iš prieveiksmių, čia vadinami naujybiniais (likę - senybiniais).
1965-1976 m. išleista LKG (red. Ulvydas, Ambrazas, Valeckienė). Joje pabrėžiama, kad kai kurie prieveiksmiai gali būti vartojami kaip prielinksniai, tačiau nuo prielinksnių jie skiriasi „tuo, kad išlaiko labai aiškią ir apibrėžtą leksinę reikšmę“, pavyzdžiui: „laikykis arčiau manęs“, „vandens buvo žemiau kelių“. Sunku suprasti, kodėl „arčiau“ ir „žemiau“ čia laikomi prieveiksmiais, o ne prielinksniais. Toliau gramatikoje (1971: 578) rašoma apie senybinius ir naujybinius prielinksnius, tačiau nesigilinama, kaip pastaruosius atskirti nuo prieveiksmių. Aktualu, kad gramatikoje užsimenama apie prieveiksmių ir prielinksnių samplaikas: „Prieš kai kuriuos senybinius prielinksnius esti pavartojamas vienas kitas žodis, galintis eiti ir prieveiksmiu, ir naujybiniu prielinksniu. Pavyzdžiui, mes nusikėlėme gyventi toliau nuo namų“. Aiškinama, kad junginyje „toliau nuo“ žodis „toliau“ yra prieveiksmis, o ne prielinksnis, nes nesudaro.

Teorinės ir praktinės problemos
Straipsnyje atskleidžiamas šios skirties teorinis bei praktinis problemiškumas, aptariama, kaip būtų galima aiškiau aprašyti prieveiksmių ir prielinksnių skirtumus. Tirta 10 žodžių, galinčių būti ir prieveiksmiais, ir prielinksniais: arčiau, arčiausiai, arti, iki, netoli, paraleliai, piečiau, skersai, šiauriau, už. Aiškinamasi, kaip skirtis atspindima žodynuose, gramatikose ir tekstynuose; pateikiami siūlymai, kaip galėtų būti papildyta ar patikslinta teoriniuose ir leksikografiniuose darbuose pateikta informacija, kad automatinis prieveiksmių ir prielinksnių atpažinimas būtų tikslesnis.
Šis reiškinys dažnai apsunkina automatinio morfologinio žymėjimo procesą, nes vienas žodis gali būti klasifikuojamas kaip skirtingos kalbos dalys arba interpretuojamas kaip įvairios tos pačios žodžio linksniuojamosios formos, dėl to pasirenkami neteisingi gramatiniai ženklai iš kelių galimų variantų.
Peržvelgus lietuvių kalbos žodynus ir gramatikas, rasta atvejų, kai prieveiksmių ir prielinksnių skirtis neaiški net teoriškai (pvz., kaip traktuoti junginius „toliau nuo“, „šiauriau nuo“ - ar tai dviejų prielinksnių samplaika, ar prielinksnis kartu su prieveiksmiu).
Pavyzdžiui, kaip traktuoti junginius „toliau nuo“, „šiauriau nuo“ - ar tai dviejų prielinksnių samplaika, ar prielinksnis kartu su prieveiksmiu; ar prielinksniai gali būti vartojami su naudininko linksniu (pvz., „lygiagrečiai namui“, „statmenai sienai“) - juk įprastai prieveiksmiai vartojami be linksnio, o prielinksniai nevaldo naudininko. Taip pat kyla diskusijų, ar į žodynus verta įtraukti prielinksnius, kilusius iš aukštesniojo ir aukščiausiojo laipsnio prieveiksmių; kokiais konkrečiais kriterijais remiantis atskirti prieveiksmį nuo prielinksnio.
Aiškių atsakymų gramatikose nėra, tačiau ši problema tampa vis svarbesnė, ypač sparčiai plėtojantis kompiuterinei lingvistikai.
Automatizuota kalbos analizė dažnai būna netiksli dėl daugiareikšmiškumo tarp įvairių kalbos dalių, tarp jų - ir prieveiksmių bei prielinksnių.
Iš šaltinių išsiskiria LKŽ, apimantis senųjų raštų ir tarmių vartosenos duomenis, nors iš esmės analizuojami dabartinės lietuvių kalbos raiškos atvejai - šiuo žodynu nutarta remtis dėl platesnio vartojimo konteksto, o į jame esančių pavyzdžių archajiškumą dėmesys nekreipiamas.
Kaip rašoma LKG (II 1971: 428), „į prieveiksmį jokiu būdu negalima žiūrėti kaip į kalbos dalį, kur pakliūva visi žodžiai, pradėję netekti vardažodžio ar veiksmažodžio ypatybių. Tarp vardažodžių ir prieveiksmio nuo pat šios kalbos dalies formavimosi pradžios buvo, dabar tebėra (ir, be abejo, ateityje bus) pereinamųjų reiškinių - žodžių bei konstrukcijų, kur jau galima įžiūrėti vardažodiškumo ar veiksmažodiškumo silpnėjimą, bet dar negalima konstatuoti visiško suprieveiksmėjimo“, pavyzdžiui, „iš matymo“, „iš ryto“, „iš viršaus“, „be pertrūkio“. Tai reiškia, kad prieveiksmėjimas gali būti tik dalinis - vardažodiškumas yra nusilpęs, bet visiško suprieveiksmėjimo dar nėra.
Kai kurie prieveiksmiai pereina į nesavarankiškas kalbos dalis: prielinksnį, dalelytę. Vadinasi, šis procesas yra nesustojantis, prieveiksmėjimas vyksta lėtai. Toks kalbinės sistemos sudėtingumas iš dalies lemia, kad ne visi prieveiksmiai ar iš jų padaryti prielinksniai būna įtraukti į žodynus - tyrėjai gali nustatyti skirtingą prieveikšmiškumo laipsnį ar dar jo neįžvelgti, o jų nuomonės ne visuomet sutampa.
Pavyzdžiui, DLKŽ prieveiksmiu laikomas „iš tikro“, o „Frazeologijos žodyne“ apibrėžiamas kaip frazeologizmas. Šiuo straipsniu siekiama išanalizuoti, kaip konkretūs prieveiksmiai ir prielinksniai aprašomi žodynuose, jei jie juose aprašomi, pakomentuojama, ar pakankamai aiškios abiejų kalbos dalių apibrėžtys, žodynuose pateikti pavyzdžiai.
Aiškinamasi, kaip skirtis atspindima žodynuose, gramatikose ir tekstynuose; pateikiami siūlymai, kaip galėtų būti papildyta ar patikslinta teoriniuose ir leksikografiniuose darbuose pateikta informacija, kad automatinis prieveiksmių ir prielinksnių atpažinimas būtų tikslesnis.
Taikomieji aspektai ir siūlymai
Šis tyrimas ypač aktualus, sparčiai plėtojantis kompiuterinei lingvistikai ir reikalingi tikslesni automatiniai kalbos analizės įrankiai. Būtina patikslinti teorinius apibrėžimus ir leksikografinius aprašymus, kad jie padėtų kompiuterinei lingvistikai.
Pateikiami siūlymai, kaip galėtų būti papildyta ar patikslinta teoriniuose ir leksikografiniuose darbuose pateikta informacija, kad automatinis prieveiksmių ir prielinksnių atpažinimas būtų tikslesnis.
Šie patobulinimai ypač svarbūs tolesnei lietuvių skaitmeninių kalbos išteklių ir įrankių plėtotei.
Tyrimas atliktas bendradarbiaujant su Vytauto Didžiojo universiteto (VDU) Skaitmeninių išteklių ir tarpdisciplininių tyrimų instituto (SITTI) tyrėju Virginijumi Dadurkevičiumi.
| Žodis | Prieveiksmis | Prielinksnis | Kita funkcija |
|---|---|---|---|
| arčiau | Taip | Taip | |
| arčiausiai | Taip | Ne | |
| arti | Taip | Taip | |
| iki | Taip | Taip | Jungtukas |
| netoli | Taip | Taip | |
| paraleliai | Taip | Taip | |
| piečiau | Taip | Taip | |
| skersai | Taip | Taip | |
| šiauriau | Taip | Taip | |
| už | Taip | Taip | Dalelytė |

tags: #kaip #isskiriama #aut #past #vlkk