Up: Appendix B Comparison with other recommendations for morphosyntactic annotation Previous: Appendix B.1 Samostalnik Next: Appendix B.3 Pridevnik
Table of contents
Za označevanje po sistemu Multext je značilno, da so kategorije označene s točno določenimi mesti v oznakah, imajo samo en znak, za kategorije, ki se ne uporabljajo, pa je določen poseben znak. Mesta v oznakah so oštevilčena po zaporedju 0, 1¸ 2, n, pri čemer oznaka 0 pripada besedni vrsti, oznake od 1 dalje pa opredeljenim kategorijam. Atributi oz. kategorije, ki se ne uporabljajo, so označene z znakom '-'.
Glagol ima v priporočilih MULTEXT-East V3 za slovenščino opredeljenih 14 kategorij: vrsta, glagolska oblika, čas, oseba, število, spol, način, nikalnost- oblike od 9. do 13. se ne uporabljajo- in vid.
Tabela:
P ATT-en VAL-en C-en ATT-sl VAL-sl C-sl
1 Type main m vrsta polnopomenski p
modal o naklonski n
copula c vezni v
2 VForm indicative i gl. oblika povednik p
imperative m velelnik v
conditional c pogojnik g
infinitive n nedoločnik n
participle p deležnik d
supine u namenilnik m
3 Tense present p čas sedanjik s
future f prihodnjik p
past s nesedanjik r
4 Person first 1 oseba prva 1
second 2 druga 2
third 3 tretja 3
5 Number singular s število ednina e
plural p množina m
dual d dvojina d
6 Gender masculine m spol moški m
feminine f ženski z
neuter n srednji s
7 Voice active a način tvornik t
passive p trpni deležnik r
8 Negative no n nikalnost nezanikani n
yes y zanikani d
9 Definiteness -
10Clitic -
11Case -
12Animate -
13Clitic_s -
14Aspect progressive p vid nedovršni n
perfective e dovršni d
V kategoriji vrste so glagoli rtazvrščeni v 3 skupine: polnopomski, vezni in naklonski. Vezni glagol je samo biti v vseh funkcijah, tj. kot pomožni glagol in kot glagol obstajanja, naklonski glagoli pa so razmeroma omejena skupina glagolov; po iskanju v FidiPlus so to morati, moči, hoteti, dovoliti, smeti, zmoči, marati, želeti.
Kategorija gl. oblike izenačuje gl. naklon (povednik, velelnik, pogojnik) z neosebnimi glagolskimi oblikami (nedoločnikom, deležnikom, namenilnikom). Deležja so zajeta pod pridevnike in prislove.
Gl. način se označuje samo pri deležnikih in sicer označevalec razlikuje tvornik (pri tvornih deležnikih; v vzorcu sem zasledil samo primere deležnikov na -l) ter trpni deležnik (pri slednjih).
Kategorija nikalnosti je označena pri treh glagolih: nisem, nočem, nimam. V opombah priporočil (Erjavec 2004: 162) sta pod peto opombo navedena samo prva dva, zato je to treba popraviti (v leksikonu in kombinacijah so vsebovani vsi trije).
Kategorija vida je v verziji 2 Multext/East dodana kot nova, prva je ni vsebovala.
Vir:
Erjavec, Tomaž, ed. (2004): MULTEXT-East Morphosyntactic Specifications, Version 3.0.
Označevalec POS glagolov ne razvršča po posebnih kategorijah in podkategorijah kot v primeru nabora Multext/East, temveč uporablja 16 glavnih besednovrstnih oznak za naslednje kategorije: glavni glagol, pomožni glagol biti v sedanjiku, istov prihodnjiku, zanikani pomožni glagol biti, glagol biti, zanikani glagol biti, zanikani glagol imeti, velelnik, deležnik na –l. deležnik glagola biti, deležnik na –n/-t (2 oznaki), deležnik na –č/-ši (2 oznaki), nedoločnik, namenilnik, pogojnik, prosti gl. morfem.
Te oznake so nato lahko kombinirane s fleksijskimi oznakami za osebo (3 oznake), spol (3 oznake) in število (3 oznake). Oznaka za deležnik na –n/-t se lahko kombinira še z oznako za sklon (vrednosti za imenovalnik in rodilnik).
Vira:
- Lönneker, Birte in Primož Jakopin (2004): Checking POSBeseda, a Part-of-Speech tagged Slovenian corpus.
- Jakopin, Primož and Bizjak, Aleksandra (1997): O oblikoslovnem označevanju slovenskega besedila. V: Slavistična revija 45/3–4, 513–532.
V SImlexu se glagoli po vrsti delijo na glavne, pomožne in naklonske, tj. podobno kot pri Multext/East, vendar s to razliko, da SImlex razlikuje glagol biti kot pomožni in kot glavni glagol, za naklonske pa so označeni morati, smeti, moči, hoteti, želeti (Verdonik et al. 2003: 440; primerjano s Toporišič 2000: 401).
Za glagole so izpisani:
neosebne oblike: nedoločnik, namenilnik, deležnik na -l, deležnik na -n/-t, glagolnik, deležnik/deležje na -č, deležnik/deležje na -ši in deležje na -e v osnovni obliki;
vse tvorne sedanjiške in velelniške oblike, oblike za preteklik, prihodnjik, predpreteklik, sedanji pogojnik in za pretekli pogojnik (v vseh osebah, številih in spolih);
vse trpne oblike z deležnikom na -n/-t za sedanjik, velelnik, preteklik, prihodnjik in sedanji pogojnik (v vseh spolih, številih in osebah).
Določena sta glagolski vid in prehodnost (pri vseh glagolih, ki imajo pri sebi predmetno dopolnilo).
Pri glagolih biti, imeti, hoteti je označena nikalnost (nisem, nimam, nočem). Zložene glagolske oblike so vpisane kot ena enota, pri čemer so podatki vneseni tako, da se lahko kasneje avtomatsko določijo potrebne oblikoskladenjske lastnosti vsake sestavne enote posebej.
Vira:
- Verdonik et al. (2003): Analiza jezikovnih vprašanj, nastalih pri gradnji Simflexa –
oblikoskladenjskega in glasoslovnega slovarja za slovenski knjižni jezik.
- Verdonik et al. (2004): Creating Slovenian Language Resources for Development of Speech-to-Speech Translation Components.
Struktura oznak pri označevalcu PDT določa, da lema in oznaka skupaj označujeta besedno obliko.
Oznake se delijo na položajne (Positional tags) in zgoščene (Compact tags). Položajna oznaka je sestavljena iz 15 znakov; vsako mesto označuje eno oblikoskladenjsko kategorijo z uporabo enega znaka:
1 POS Part of speech
2 SubPOS Detailed part of speech
3 Gender Gender
4 Number Number
5 Case Case
6 PossGender Possessor's gender
7 PossNumber Possessor's number
8 Person Person
9 Tense Tense
10 Grade Degree of comparison
11 Negation Negation
12 Voice Voice
13 Reserve 1 Reserve
14 Reserve 2 Reserve
15 Var Variant, style
Nekateri znaki lahko označujejo več vrednosti; npr. 'X' katero koli vrednost. Oznaka '-' pomeni, da se vrednost ne uporablja. "not applicable". Pri zgoščenih oznakah se v večini primerov (a ne povsod) izpustijo črtice ('-') iz položajnih oznak.
Vrednosti SubPOS za glagol:
B glagol, sedanjik ali prihodnjik
c pogojnik (samo glagola být (biti))
e glagol, sedanji deležnik/deležje (transgresiv) (končnice -e/-ě, -íc, -íce)
f glagol, nedoločnik
i glagol, velelnik
m glagol, pretekli deležnik/deležje (transgresiv); tudi arhaični sedanji deležnik/deležje (transgresiv) dovršnih glagolov
p glagol, pretekli tvorni deležnik (vključno z oblikami z naslonskim – s)
q glagol, peretkli tvorni deležnik, z naslonskim –t' (arhaično)
s glagol, pretekli trpni deležnik (vključno z oblikami z naslonskim – s)
t glagol, sedanjik ali prihodnjik, z naslonskim –t' (arhaično)
Pri kategoriji osebe je poleg 1., 2. in 3. možna oznaka X (katera koli oseba). Pri kategoriji časa so možne vrednosti: F (prihodnjik), H {R, P} (preteklik ali sedanjik), P (sedanjik), R (preteklik), X (kateri koli čas). Označena sta tudi nikalnost in gl. način.
Za angleške glagole uporablja označevalec PDT naslednje oznake:
- Infinitive (go): Vf- - - - - - - - A- - - -
- Present other than 3rd person singular (go): VB-X- - -XP-AA- - -
- Present 3rd person singular (goes): VB-S- - -3P-AA- - -
- Imperative (go): Vi-X- - -X- - A- - - -
- Past tense (went): Vp-X- - -XR-AA- - -
- Perfect / passive participle (gone): Vs-X- - -XX-AP- - -
Vir:
Hana et al. (2005): Manual for Morphological Annotation. Revision for the Prague Dependency Treebank 2.0. ÚFAL Technical Report No. 2005-27.
Nabor oznak Ajka za glagol označuje kategorije nikalnost, vid, gl. obliko, osebo, spol, število, stilistično oznako oblike ter oblika z naslonskim -s.
Kategorija gl. oblike podobno kot pri Multext/East vključuje gl. naklon in neosebne gl. oblike, obenem pa tudi čas. Posebni oznaki sta za povedni sedanjik in povedni prihodnjik. Vrednosti kategorije gl. oblike so:
F Infinitiv
I Indikativ prézentu
R Imperativ
A Příčestí činné (minulé)
N Příčestí trpné
S Přechodník přítomný (současnost)
D Přechodník minulý (dřívější děj)
B Indikativ futura
Med posebnostmi nabora Ajka omenjam, da je pri kategoriji vida možna oznaka za dvovidskost (Obouvidé) ter da sta v okviru kategorije spola pri moškem spolu ločeni živost in neživost.
Vir: Sedlaček, Radek (2005): Ajka tagset
Nabor oznak BNC uporablja trimestne oznake. Glagoli so razvrščeni v tri temeljne skupine: glagoli be, have, in do, leksikalni glagoli in modalni glagoli.
Glagoli be, have, in do imajo začetne oznake VB-, VH- in VD-. Razlika v rabi teh glagolov v funkciji pomožnih ali glavnih glagolov ni upoštevana.
Ostali (leksikalni) glagoli imajo začetno oznako VV-, modalni glagoli pa zgolj oznako VM0 (brez razlikovanja med oblikami sedanjika in preteklika).
Tretje mesto v oznaki označuje slovnične oblike:
- - B base form finite, - - Z 3rd person sing present, - - I infinitive, - - D past tense, - - N past participle, - - G present participle. Oznaka base form finite označuje vse tiste oblike, v katerih se glagol pojavlja v osnovni obliki brez obrazil, tj. poleg sedanjika (razen 3. osebe ednine s končnico –s) tudi velelnik in sedanji vezni naklon (present subjunctive). Ta rešitev je sorodna tisti pri PDT, kjer slednji loči Present other than 3rd person singular in Present 3rd person singular
Nabor osnovnih oznak BNC za glagol je naslednji:
Oblike glagola be:
VBB VBD VBG VBI VBN VBZ
Oblike glagola do:
VDB VDD VDG VDI VDN VDZ
Oblike glagola have:
VHB VHD VHG VHI VHN VHZ
Modalni glagoli:
VM0
Leksikalni glagoli:
VVB VVD VVG VVI VVN VVZ
Skrajšane oblike (Contracted forms), kot so can't, won't, gimme, dunno idr., se razdelijo na sestavne elemente, ki so nato označeni posamezno.
Primerjava med nivoji označevanja:
Poleg osnovnih oznak nabor BNC vsebuje tudi dvoumnostne oznake (Ambiguity tags). Te se uporabljajo, kadar je verjetnost, ki jo avtomatski označevalec CLAWS pripiše prvi in drugi izbiri oznake, prenizka za zanesljivo razdvoumljanje. Dvoumnostne oznake lahko torej vključuje dve izbiri, pri čemer označevalec pripisuje večjo verjetnost tisti, ki je na prvem mestu.
Za besedno vrsto glagola so to naslednje dvoumnostne oznake:
Večja verjetnost za glagol:
VVB-NN1 VVD-VVN VVD-AJ0 VVG-AJ0 VVG-NN1 VVZ-NN2
Manjša verjetnost za glagol:
NN1-VVB VVN-VVD AJ0-VVD AJ0-VVG NN1-VVG NN2-VVZ
Oznaka AJ0 ima vrednost pridevnika v osnovni stopnji (Adjective, general or positive), oznaka z začetnim NN- pa samostalnika, ki je občno ime (Common noun).
Leech, Geoffrey in Nicholas Smith: Manual to accompany The British National Corpus (Version 2) with Improved Word-class Tagging.
Trenutna rešitev v FidiPlus ponuja naslednje kategorije za glagol: 1. vrsta, 2. gl. oblika, 3. čas, 4. oseba, 5. število, 6. spol, 7. način, 8. nikalnost, 9.-13. (ne uporabljamo), 14. vid.
- Nabor Multext/East glagole deli v polnopomenske, vezne in naklonske. Vezni glagol je samo biti v funkcijah pomožnega glagola in glagola obstajanja, naklonski glagoli pa so omejena skupina glagolov: morati, moči, hoteti, dovoliti, smeti, zmoči, marati, želeti. Nabora POS in SImlex v tem smislu omogočata razlikovanje glagola biti kot pomožnega glagola in glagola obstajanja. Razlikovanja med pomožnimi in polnopomenskimi glagoli v primerih angleških be, have in do ne upošteva tudi nabor BNC. Pri čeških označevalcih ne zasledimo posebej opredeljene kategorije modalnosti/naklonskosti.
- Glede lastnost nikalnosti lahko ugotovimo podobnosti: vsebujejo jo nabori Multext/East, POS, SImlex ter oba češka nabora, PDT in Ajka.
- Nabor Multext/East gl. naklon označuje v okviru kategorije gl. oblike, ki vključuje tudi neosebne gl. oblike. eležja so pri Multext/East zajeta pod pridevnike ali prislove. Označevalec POS, ki ima gl. oznake na enotni ravni, deli neosebne gl. oblike po končnicah, posebej pa sta označena deležnik na –l glavnih glagolov in glagola biti (skupno 6 oznak za deležnike). Za razlika od deležnika na –i in –n/-t, se oznaka za deležnik na –č/-ši ne kombinira z dodatnimi oznakami za spol, sklon in število, zato se zdi, da je pri tej končnici zabrisana meja med deležniki in deležji. Deležji na –aje in –e nista opredeljeni. Poudariti velja, da označevalec POS loči velelnik in pogojnik, vendar ne označuje povednega naklona. Med slovenskimi označevalci je POS tudi edini, ki v okvir glagola vključuje tudi prosti gl. morfem s posebno oznako ter vrednost sklona pri deležniku na –n/-t
Nabor SImlex neosebne oblike prav tako razlikuje glede na končnice, pri čemer ima možnosti deležnik/deležje na -č, deležnik/deležje na -ši in deležje na –e. Opredeljene so vse tvorne sedanjiške in velelniške oblike, oblike za preteklik, prihodnjik, predpreteklik, sedanji pogojnik in za pretekli pogojnik ter vse trpne oblike z deležnikom na -n/-t za sedanjik, velelnik, preteklik, prihodnjik in sedanji pogojnik.
Podobnosti lahko ugotovimo tudi v primerjavi naborov Multext/East in Ajka. Tudi slednji v okvir kategorije gl. oblike vključuje gl. naklon in neosebne gl. oblike. Pri naboru Ajka sta med drugim označena povedni sedanjik in povedni prihodnjik, ni pa oznake za pogojnik.
- Pri kategoriji čas ugotavljamo razlike. Nabor Multext/East ima vrednosti sedanjik, prihodnjik in nesedanjik. Vrednost prihodnjik pokriva glagol biti v prihodnosti, vrednost nesedanjik (tj. preteklik ali prihodnjik) pa opisni deležnik na –l. Angleška ustreznica vrednosti nesedanjik je sicer past (preteklik).
Označevalec POS opredeljuje prihodnjik samo pri glagolu biti. Nabor SImlex gre med slovenskimi označevalci najgloblje, saj pri tvornih oblikah opredeljuje tudi predpreteklik ter loči sedanji in pretekli pogojnik, pri trpnih oblikah pa le sedanji pogojnik.
Nabor PDT ima možnost oznak za preteklik ali sedanjik (H) in za kateri koli čas (Y). Nabor Ajka presenetljivo nima posebne kategorije za čas, temveč jo vključuje v okvir kategorije gl. oblike, skupaj z naklonom in neosebnimi gl. oblikami. Možne vrednosti so povedni sedanjik, povedni prihodnjik, pretekli tvorni deležnik, trpni deležnik ter sedanji deležnik/deležje in pretekli deležnik/deležje (izvirni češki izraz za slednji dve vrednosti je přechodník).
- Kategorijo načina opredeljujeta nabora Multext/East (vrednosti: tvornik, trpni deležnik) in PDT (vrednosti: active, passive).
- Kategorijo vida poznajo nabori Multext/East, SImlex, in Ajka. Slednji omogoča možnost označevanja dvovidskih glagolov. Nabor POS ne opredeljuje ne gl. vida, ne načina.
- Gl. oblika:V vzorcu semopazil samo en primer napačne opredelitve gl. oblike: ne pozabimo je označen kot povednik, čeprav je dejansko velelnik; v istem stavku se pojavlja kontekst še dveh (pravilno označenih) velelnikov: Povežimo..., poiščimo... in ne pozabimo...
- Število: V povedniku sedanjika se v vzorcu pojavljajo primeri, ko napačno prepoznava drugo ali tretjo osebo dvojine (ki imata enako glagolsko končnico -ta). Povsod gre za primere, ko napačno označi drugo osebo namesto tretje.
- Spol:Pri trpnih deležnikih pogosto napačno označuje spol in število, še posebej kadar so oddaljeni od besed, na katere se nanašajo.
pripravljeni > srednji spol dvojine namesto moški spol množine:...so ti dokumenti dovolj pripravljeni za obravnavo ali ne.
prilagojena > moški spol dvojine namesto ženski spol ednine: občinska uprava, ki mora biti prilagojena...
obdarjena > moški spol dvojine namesto ženski spol ednine: Škofja Loka tako bogato obdarjena...
urejena > moški spol dvojine namesto srednji spol množine: Javna dela naj bodo urejena...
začinjena > moški spol dvojine namesto ženski spol ednine: Predvolilna mrzlica je, kot že nekajkrat doslej, posebej začinjena...
- Ločevanje med naklonskimi in veznimi glagoli v naboru Multext/East ne upošteva dovolj skladenjskih možnosti povezovanja nepolnopomenskih glagolov z nedoločnikom. Neupravičeno se zdi opredeljevanje glagola biti kot zgolj veznega, ker je lahko tudi polnopomenski kot glagol obstajanja (to npr. upoštevata nabora POS in SImlex). V zvezi z naklonskostjo oz. modalnostjo velja opozoriti, da t. im. naklonski glagoli (hoteti, želeti, morati, smeti) niso edina možnost izražanja naklonskosti v slovenščini. Ostale možnosti npr. navaja Slovenska slovnica (Toporišič 2000: 401). Opredeljevanje zaprte skupine naklonskih glagolov (kot v primeru naborov Multext/East in SImlex) ne upošteva možnosti vseh glagolskih zvez z glagolom. V slovenščini se glagolom lahko veže z glagolom tedaj, ko je eden od njiju pomensko nepopoln. Slovenska slovnica v zvezi s tem omenja 14 vrst t. im. pomožnih glagolov (Toporišič 2000: 587; enako tudi Toporišič 1982: 101-2). Poleg glagolov, ki so pri označevalcih Multext/East in POS opredeljeni kot naklonski, se zdijo za označevanje relevantni tudi t. im. fazni glagoli (npr. začeti, nehati), ker prav tako ob sebi zahtevajo nedoločnik.
- Precej različni pristopi so v pojmovanju gl. oblike ter tega, kaj konkretno ta kategorija vključuje, saj to vpliva na označevanje gl. naklona in neosebnih gl. oblik. V okviru slednjih so zlasti opazne razlike v natančnosti označevanja deležnikov in deležij.
Nabor Multext/East pod kategorijo gl. oblike vključuje naklon in neosebne gl. oblike (podobno nabor Ajka), pri čemer ima samo eno vrednost za označevanje deležnika. Nabor POS postavlja naklon in neosebne gl. oblike na isto raven, deležnike pa deli na končnice (podobno tudi SImlex). Nabor Ajka razlikuje tvorni in trpni deležnik.
- Nabor Multext/East označuje kategorijo gl. načina samo pri deležnikih (tj. pri zloženi gl. obliki): razlikuje med tvornikom (v vzorcu sem to zasledil samo pri deležnikih na –l) in trpnimi deležniki. To se zdi nenavadno, kajti o tvorniku govorimo, če je osebek stavka (iz)vršilec dejanja ali nosilec stanja (Toporišič 2000: 358) in v tem primeru bi bilo upravičeno označevati tvornik tudi pri polnopomenskih glagolih v povednem sedanjiku, npr. Kranjska gora potrebuje turizem, ki bo prijazen do okolja in do prebivalcev.Trpni deležnik na –n/-t je sicer res najpogostejša, vendar ne edina oblika izražanja trpnika; druga možnost je trpnik s se: Vse prireditve in tekmovanja se morajo organizirati v soglasju z občino in krajani (prim. Toporišič 2000: 359).
- Vezni glagol biti nima opredeljenega vida ne v vzorcu ne v FidiPlus (Po FiDI nedovršnega ali dovršnega veznega glagola ni). Kljub temu je v SSKJ opredeljen kot nedovršen. Dovoliti je v FidiPlus dovršni naklonski glagol, želeti in hoteti pa sta nedovršna (vendar zanikani hoteti (nočem) v FidiPlus nima opredeljenega vida). Enako je opredeljeno v SSKJ. Po Toporišičevi slovnici so naklonski glagoli samo nedovršni. V FidiPlus 1360 glagolskih lem (več kot 10%) nima opredeljenega vida (9-mestni MSD-ji z začetnim G-). Pri tistih, ki imajo označen nedovršni vid, je ogromno takih, kjer gre za tipkarske napake ali napačno lematizacijo nasploh. Po rezultatih iz FidePlus bi opozoril, da je označevalec občutljiv na tuja lastna imena moškega spola na –u.
- Predlagam vrstno ločitev glagolov na polnopomenske in nepolnopomenske oz. pomožne. Kategorija pomožnih bi vključevala glagol biti kot pomožni (ali po opredelitvi Multext/East vezni) glagol (glagol biti kot glagol obstajanja bi bil polnopomenski) in glagole, ki jih kot pomožne opredeljujeta Slovenska slovnica (Toporišič 2000: 587-8) in Nova slovenska skladnja (Toporišič 1982: 101-2); avtor v obeh virih naniza 14 vrst pomožnih glagolov. Če za kriterij pomožnosti vzamemo obvezno dopolnilo nedoločnika (Toporišič 2000: 587), so poleg glagolov, ki so po iskanju v FidiPlus in pri označevalcu Multext/East opredeljeni kot naklonski, zlasti relevantni t. im. fazni glagoli (začeti, nehati). Med ostalimi, ki jih omenja Slovenska slovnica, so sicer primeri, za katere ni nujno, da imajo ob sebi dopolnilo v nedoločniku (npr. pomagati).
- Predlagam ločeni kategoriji gl. naklona (povednik, pogojnik, velelnik) in (neosebnih) gl. oblik (nedoločnik, namenilnik, deležnik, deležje) ter opustitev združevanja naklona in neosebnih gl. oblik pod isto kategorijo.
- V okviru neosebnih gl. oblik se zdi smiselno dosledno razlikovati med tvornim deležnikom na –l in trpnim deležnikom na –n/-t. Prvi bi vključeval vse tvorne zložene glagolske oblike (preteklik, pogojnik, prihodnjik), drugi pa trpne zložene glagolske oblike, ki ne nastopajo v atributivnem položaju (o tem prim. Oblikoskladenjske oznake v besedilnih korpusih slovenskega jezika Fida, Nova Beseda, Lc-Star, str. 14). Kategorijo načina bi v takem primeru lahko odpravili.
- Deležja se zdi smiselno posebej označevati, bodisi v okviru glagolov (kot v primeru naborov POS in SImlex) ali prislovov. Pri Multext/East so zaenkrat označena v okviru pridevnikov in prislovov, vendar se slednja možnost, ki opredeljuje zgolj splošno vrsto prislovov, zdi nezadostna, kajti po izvoru lahko v slovenščini ločimo najmanj samostalniške, pridevniške in glagolske prislove, dodatno pa še zaimenske in števniške (Toporišič 2000: 406).
- Premisliti velja o obdržanju kategorije vida. Splošna ugotovitev je, da je omenjena kategorija izrazito leksikalna in vezana na semantične lastnosti glagolov, odvisna pa je tudi od vsebinskega konteksta. Zaradi številnosti glagolov je kategorija odprta, veliko glagolov je dvovidskih (npr. glagoli na –irati). Kot taka, je kategorija vida za označevalec problematična. To ponazarja tudi razlaga v Slovenski slovnici: Slovenski glagoli so načeloma dovršni ali nedovršni, so torej enovidski. Nekateri pa so dvovidski, tj. dovršni ali nedovršni, kar nam je pač na misli (Toporišič 2000: 348).
Rezultati iskanja po SSKJ so naslednji: od skupno 16477 glagolov je 8539 opredeljenih kot dovršnih, 6470 kot nedovršnih in 1468 kot dvovidskih (dovršnih ali nedovršnih).
Med glagoli, ki so po SSKJ opredeljeni kot dovršni ali nedovršni, je velika večina glagolov na –irati (brez predpone!; FidaPlus je glede tega manj jasna: veliko glagolov na –irati šteje med tudi med dovršne). Nekaj drugih relevantnih primerov: dati, dejati (v pomenu: izraziti z besedami, reči), fasati, glasovati, grešiti, imenovati, imeti, iti, leteti, ločiti, menjati, nesti, podati, praviti, priti, premoči, prileči se, roditi, slediti, slišati, staviti, stopati, škoditi, štopati, teči, veleti, vezati, videti, voliti, zadostiti, zaupati.
V FidiPlus je pri glagolih, ki imajo označen nedovršni vid, ogromno takih, kjer gre za tipkarske napake ali napačno lematizacijo nasploh.
Če se odločimo kategorijo obdržati, ne vidim druge možnosti, kot vnaprej opredeliti glagole po vidu, kar se zdi glede na odprtost že same besedne vrste problematično. Nekatere možne rešitve v tej smeri so:
Glagoli na –irati (razen tistih s predpono) so v večini dvovidski (tako mnenje izraža tudi Toporišič 2000: 348). Možnost označevanja dvovidskih glagolov zasledimo pri naboru Ajka.
Nepredponski glagoli so načeloma nedovršni (Toporišič 2000: 357; izjeme, ki so dovršne, so naštete prav tam). Dovršni so skoraj vsi t.im. trenutni glagoli s pripono –ni-ti/-ne-m, razen tistih, ki izražajo prehajanje iz stanja ali potek.
Samo nedovršni so glagoli stanja (sedeti, ležati, stati, imeti), naklonski glagoli (morati, smeti, moči), glagoli enovitega dejanja (delati, iti, čakati, svetiti, ljubiti, brati) in glagoli navade (videvati se) (Toporišič 2000: 350).
Vidski pari: Vid je izražen tudi z morfološkim materialom, npr. dovršnike tvorimo iz nedovršnikov z dodajanjem predpone, iz dovršnikov pa nedovršnike z menjavo glagolske pripone.
Druga možnost je izpustitev kategorije vida, kar zasledimo pri označevalcu POS. V priporočilih MULTEXT-East verziji 1, npr. ni bila vsebovana, v verziji 3 pa jo vsebujejo slovenščina, srbščina in rezijanščina.
POSKUSNA RAZPREDELNICA KATEGORIJ ZA BESEDNO VRSTO GLAGOL:
1. Vrsta: polnopomenski
pomožni
2. Gl. naklon povedni, velelni, pogojni
3. Gl. oblika nedoločnik, namenilnik, deležnik na –l, deležnik na –n/-t, (deležje)
4. Čas sedanjik, prihodnjik, nesedanjik
5. Oseba prva, druga, tretja
6. Število ednina, dvojina, množina
7. Spol moški, ženski, srednji
8. Nikalnost zanikani, nezanikani
TOPORIŠIČ Jože (1982): Nova slovenska skladnja. Ljubljana: Državna založba Slovenije.
TOPORIŠIČ Jože (2000): Slovenska slovnica. 4., prenovljena in razširjena izd., 1. natis. Maribor: Obzorja, 2000.
Up: Appendix B Comparison with other recommendations for morphosyntactic annotation Previous: Appendix B.1 Samostalnik Next: Appendix B.3 Pridevnik