JOS morphosyntactic specifications for Slovene

Appendix B.3 Pridevnik

Up: Appendix B Comparison with other recommendations for morphosyntactic annotation Previous: Appendix B.2 Glagol Next: Appendix B.4 Prislov

Table of contents

Breda Sivec
5. 4. 2007

Appendix B.3.1 1 Analiza obstoječih rešitev

Appendix B.3.1.1 1.1 MULTEXT-East V3

Projekt MULTEXT-East − kot tudi vsi drugi poskusi ujetja žive slovenščine v kar se da optimalen nabor kategorij in podkategorij z namenom avtomatskega označevanja korpusa in na tej podlagi analize besedil najprej na oblikoslovni, pozneje pa tudi na skladenjski, semantični in celo diskurzivni ravnini − upošteva smernice in priporočila mednarodne ekspertne pobude EAGLES (1996) za standardizacijo jezikovnih tehnologij. Celotni nabor morfosintaktičnih oznak, ki veljajo za jezike, vključene v projekt MULTEXT-East, je za slovenščino nekoliko prilagojen, tako da ustreza njenim izraznim možnostim in posebnostim, predvsem izraziti fleksiji.

Besedna vrsta pridevnik se tako členi na sedem kategorij, te pa na različno število podkategorij:

VRSTA
kakovostni
k

svojilni
s

vrstni
v
STOPNJA
osnovnik
o

primernik
p

presežnik
s

elativ
e
SPOL
moški
m

ženski
ž

srednji
s
ŠTEVILO
ednina
e

množina
m

dvojina
d
SKLON
imenovalnik
i

rodilnik
r

dajalnik
d

tožilnik
t

mestnik
m

orodnik
o
DOLOČNOST
ne
n

da
d
ŽIVOST
ne
n

da
d

Naboru kategorij in podkategorij je dodano pojasnilo o označevanju določnosti in živosti, v skladu s katerim je določnost (izražena s končnico -i v imenovalniku in pri neživem še v tožilniku) označena samo pri pridevnikih moškega spola ednine, ki so v imenovalniku oz. pri neživem še v tožilniku. Nepregibni pridevniki, kot npr. poceni, nimajo določne oblike. Živost (izražena s tožilniško končnico –ega) pa je označena samo pri samostalnikih moškega spola ednine, ki so v tožilniku. Nepregibni poceni nima lastnosti živosti. Kategorija se členi na tri možnosti: nedoločno živo, nedoločno neživo in določno neživo.

Slabost take odločitve projekta MULTEXT-East V3 je, da sta določnost in živost označeni le pri razmeroma majhnem deležu vseh pridevnikov. Uspešnost takega označevanja pa je odvisna tudi od pravilne opredelitve kategorij, na podlagi katerih se sploh določata. Če pride do napake pri spolu, številu, sklonu in pri določnosti vrste, sta tudi določnost in živost nujno napačno označeni.

Kategorijama vrsta in stopnja, ki se ob pozorni analizi prav tako izkažeta za problematični − pri vrsti zaradi neostrih meja med posameznimi razredi in kontekstualnih vplivov, pri opisnem stopnjevanju in deloma elativu pa zaradi večbesednosti pomenskih enot −, ni namenjeno posebno pojasnilo.

Appendix B.3.1.2 1.2 POS-beseda

ADJECTIVES


Type
Gender
Number
Case
Degree
Definiteness
Example
adjective
P
{m,ž,s}
{e,d,p}
{1,2,3,4,5,6}
{/,j,jj}
{/,i}
Pme1i
(pomladni)
participle ending in -l
PL
{m,ž,s}
{e,d,p}
{1,2,3,4,5,6}

{/,i}
PLmp4
(uspele)
participle ending in -n/-t
PN/PT
{m,ž,s}
{e,d,p}
{1,2,3,4,5,6}

{/,i}
PNme4i
(zgrešeni)
participle ending in -č/-ši
PČ/PŠI
{m,ž,s}
{e,d,p}
{1,2,3,4,5,6}

{/,i}
PČže2
(cvetoče)
predicative adjective
PD
{m,ž,s}
{e,d,p}

{/,j,jj}

PDme
(rad)
possesive adjectives from proper names of persons
PIO
{m,ž,s}
{e,d,p}
{1,2,3,4,5,6}


PIOžp4
(Andrejeve)
poss.adj.from proper names of inhabitants
PIP
{m,ž,s}
{e,d,p}
{1,2,3,4,5,6}


PIPme1
(Brikin)
poss.adj.from divine names
PIV
{m,ž,s}
{e,d,p}
{1,2,3,4,5,6}


PIVse4
(Kronovo)
poss.adj.from proper names of places
PIZ
{m,ž,s}
{e,d,p}
{1,2,3,4,5,6}


PIZže5
(Krimski)
poss.adj.from proper names of mythological places
PIM
{m,ž,s}
{e,d,p}
{1,2,3,4,5,6}


PIMme5
(Hadovem)
poss.adj.from other names
PIS
{m,ž,s}
{e,d,p}
{1,2,3,4,5,6}


PISže5
(Mohorjevi)

POS-beseda pridevnik členi kar na trinajst skupin/razredov: pridevnik, deležnik (-l), deležnik (-n), deležnik (-t), deležnik (-č), deležnik (-ši), povedkovnik in pridevnike, nastale iz osebnih imen, iz imena prebivalcev, iz veroslovnih imen, iz živalskih imen, iz zemljepisnih imen, iz mitoloških imen ter iz stvarnih imen. Poleg tega mu določa spol, sklon, število, stopnjo in določnost. Kategorije živosti torej ne upošteva, vrsto pa nadomešča s trinajstimi razredi oz. skupinami. Videti je, da razmeroma veliko skupino netvorjenih kakovostnih pridevnikov (npr. lep, grd) upošteva pri prvi skupini, ki je poimenovana kar pridevnik. Vrstni pridevniki so, kot kaže, razdeljeni med tiste, ki so nastali iz stvarnih imen, in tiste, ki so nastali iz imen krajev, svojilni pa med tiste, nastale iz osebnih, veroslovnih, živalskih in mitoloških imen.

Z vidika avtomatičnega označevanja besedil se zdi problematično že samo členjenje na tako veliko število podkategorij. Postavlja se zlasti vprašanje, kako analizator ločuje med skupinami pridevnikov, nastalih iz različnih imen (npr. Metin : Herin). Zanimivo je, da med pridevnike šteje tudi povedkovnik.

Appendix B.3.1.3 1.3 Simlex

V sklopu projekta Simplex, tj. oblikoskladenjskega slovarja knjižne slovenščine, Darinka Verdonik s sodelavci pri pridevniku kot besedni vrsti upošteva naslednje kategorije: spol, število, sklon, stopnjo (navaja tako oblike za obrazilno kot za opisno stopnjevanje), določnost in vrsto. Na težave naleti pri med seboj povezanih kategorijah vrsta in določnost. Za svoj namen določnost opredeli samo pri pridevnikih moškega spola, ki ločijo določno in nedoločno obliko, ne pa tudi pri pridevnikih ženskega in srednjega spola. Kot zapiše, so se tako »odločili v skladu z osnovnim namenom slovarja, tj. uporabo pri razvijanju jezikovnih tehnologij«. Zaveda se, da pri tem upošteva zunanjo obliko, ne pa tudi pomenskih lastnosti pridevnika. O določanju vrste pridevnika ugotavlja, da je le-to posebno težavno in zelo povezano z določnostjo. Ob primerih, kot so »avtobusen, magneten, kamnit, baročen …« ugotavlja, da bi ob upoštevanju konteksta »morali za skoraj vsak pridevnik predvideti dve ali celo tri vrste. Ker bi s tem vnesli zmedo in nedoslednost, smo sklenili, da je za naše potrebe najprimernejša naslednja, zelo poenostavljena delitev, ki se opira samo na obliko pridevnika:

- vsi pridevniki, ki ločijo določno in nedoločno obliko, so v določni in nedoločni obliki in v vseh spolih določeni kot kakovostni, kar ustreza oznaki lastnostni pridevniki po najnovejši slovnici (Toporišič, 2000)

(npr. avtobusen -i -a -o, kamnit -i -a -o)

- vsi pridevniki, ki ne ločijo določne in nedoločne oblike in se v imenovalniku ednine moškega spola končajo na -i, so določeni kot vrstni (torej tudi divji, božji ipd.)

- vsi pridevniki, ki ne ločijo določne in nedoločne oblike in se v imenovalniku ednine moškega spola končajo na -0, so določeni kot svojilni (npr. sestrin, bratov, lipov)«

Avtorji projekta Simplex se torej dobro zavedajo zagate, povezane z opredeljevanjem kategorij vrste in določnosti, a ravnajo pragmatično: pridevnike razdelijo po vrstah na podlagi možnosti izražanja nedoločnosti in določnosti z različnimi morfemi, kar se zdi spričo zmuzljivosti posameznih vrst, kot nastopajo v živem jeziku, in precejšnje prekrivnosti med njimi še najbolj trdna podlaga za označevanje.

Kategorije živosti projekt Simplex ne upošteva.

Appendix B.3.1.4 1.4 Praški Treebank

Besedno vrsto pridevnik členi na pet skupin:

- pridevnik, splošno (A – adjective)

- posamostaljeni pridevnik??? (adjective, nominal (short, participial) form)

- pridevnik, izpeljan iz preteklega tvornega deležnika (present transgressive form of a verb)

- pridevnik, izpeljan iz preteklega trpnega deležnika (verbal past transgressive form)

- svojilni pridevniki (moški na -ov, ženski na -in)

Pridevniku določajo spol (pozor – kar deset vrednosti!), število (pet podkategorij), sklon (osem podkategorij), spol svojilnega pridevnika »possessor's gender« (štiri podkategorije), possessor's number (tri podkategorije – samo zaimki???), stopnjo (tri podkategorije). Zadnje mesto morfosintaktične oznake, ki jo tvori petnajst znakov, je prihranjeno za eventuelno slogovno določitev leme (starinsko, pogovorno …).

SPOL – podkategorije:

- ženski

- ženski ali srednji

- moški za živo

- moški za neživo

- srednji

- ženski (samo ednina) ali srednji (samo množina), in sicer samo za deležniške in nominalne oblike (nominal forms) pridevnikov

- moški neživi ali ženski (samo množina), in sicer samo za deležniške in nominalne oblike (nominal forms) pridevnikov

- kateri koli

- moški (živo in neživo)

- ne ženski (moški za živo ali neživo ali srednji), in sicer samo za nekatere zaimke in števnike

ŠTEVILO – podkategorije:

  1. dvojina

  2. množina

  3. ednina

  4. ednina za ženski spol, množina za srednji spol, in sicer samo za deležniške in posamostaljene oblike (nominal forms) pridevnikov

  5. katero koli

SKLON – podkategorije:

  1. imenovalnik

  2. rodilnik

  3. dajalnik

  4. tožilnik

  5. zvalnik

  6. mestnik

  7. orodnik

  8. kateri koli

SPOL SVOJILNEGA PRIDEVNIKA (possessor's gender) – podkategorije:

  1. ženski

  2. moški za živo

  3. kateri koli

  4. ne ženski

STOPNJA – podkategorije:

  1. osnovnik

  2. primernik

  3. presežnik

NEGACIJA – podkategorije:

  1. nezanikano

  2. zanikano

Gre za precej kompleksen nabor oznak, ki se v mnogih pogledih razlikuje od obstoječih slovenskih alternativ.

Kategorija vrsta pridevnika ima v skladu s SS tri vrednosti (kakovostni, vrstni, svojilni), PDT pa pridevnike deli na pet skupin. Posebej upošteva podkategorijo svojilnih pridevnikov, posamostaljene pridevnike ter deležnike.

Kategorija spol je z desetimi vrednostmi veliko bolj razčlenjena od slovenskih alternativ, in sicer zato, ker so v njej zaobsežene tudi razlike, povezane s kategorijo živosti (te Čehi ne obravnavajo posebej), ter morfemsko prekrivanje, npr. oblik za

ženski spol ednine in srednji spol množine. V skladu z The positional tag system for Chech pa so podkategorije štiri: moški za živo, moški za neživo, ženski, srednji.

Kategorija število poleg slovenskih ednine, dvojine in množine ter vrednosti kateri koli upošteva še podkategorijo ednina za ženski spol, množina za srednji spol, ki se obrazilno ujemata tudi v slovenščini.

Kategorija sklon predvideva osem vrednosti, in sicer poleg šestih slovenskih sklonov še zvalnik in »kateri koli«.

Kategorija spol svojilnega pridevnika (possessor's gender) obsega štiri vrednosti: ženski, moški za živo, kateri koli in ne ženski. Relevantnost za slovenščino???

Kategorija stopnja enako kot v slovenskih modelih predvideva tri podkategorije: osnovnik, primernik in presežnik. Pri določenih vrstah pridevnikov, kot so na primer svojilni pridevniki, kategorija stopnje ni relevantna. Opisnega stopnjevanja v fazi morfosintaktičnega označevanja PDT ne obravnava posebej.

Posebnost glede na slovenske modele je kategorija negacije, ki se v češčini (tudi v slovenščini) izraža s predpono ne-. Do prekrivanja pa lahko pride pri pridevnikih, ki se začnejo z ne-, npr. nežen, nem, neroden, Nežin.

Kategorije živosti PDT ne obravnava posebej, ampak jo s z naborom vrednosti integrira k drugim relevantnim kategorijam, predvsem jo upošteva pri spolu, in sicer tako, da predvideva ločeni vrednosti za moški spol: za živo in za neživo.

Določnosti sploh ne obravnava, saj jo domnevno razume kot besedilno oziroma, še raje, pragmatično kategorijo.

Pozdravljam rešitev za obravnavo živosti, ki kategorije neupravičeno ne oži le na razmeroma majhen izsek vseh pridevnikov, hkrati pa upošteva morfemske variante, ki jih povzroča. Tudi podkategorije, ki upoštevajo prekrivanje oblik za posamezne spole, sklone in števila, so dobrodošle, saj omejujejo število možnih napak, vendar po drugi strani z večjo razčlenjenostjo kategorij stopnjujejo kompleksnost sistema.

Appendix B.3.1.5 1.5 Ajka

Opis rešitev za obravnavano besedno vrsto. Vir: Sedlaček, 2005. Zadeva je v češčini.

Appendix B.3.1.6 1.6 BNC

BNC pridevnike deli v dve veliki skupini: pridevnike nasploh ter primernike in presežnike. V skladu s tem so tudi osnovne morfosintaktične oznake tri: AJO (za prvo skupino), AJC (za primernike) in AJS (za presežnike). Ker v praksi prihaja do prekrivanja, zlasti z deležniki, samostalniki in prislovi, so predvidene tudi »dvojne« oznake, ki na to opozarjajo:

AJ0-NN1, AJ0-VVG, AJ0-VVN = pridevnik bolj verjeten
NN1-AJ0, VVG-AJ0, VVN-AJ0 = pridevnik manj verjeten

Prva skupina se naprej členi glede na skladenjsko vlogo pridevnika na predikativno in atributivno rabo, kvazikomparative in kvazisuperlative ter pridevnika »able« in »unable«.

Za kvazi stopnjevanje gre pri tistih pridevnikih, ki imajo podobno kot primerniki in presežniki učinek stopnjevanja ali šibitve, vendar se sintaktično vedejo drugače, zato jih obravnavamo kot navadne pridevnike. Zgledi so npr. popoln, skrajni, dokončen, gornji, minimalen.

V primerjavi s slovenskimi modeli BNC ponuja zelo preprosto razčlenitev pridevnika, ki temelji na stopnjevanju kot inherentni lastnosti te besedne vrste ter hkrati upošteva predikativne in atributivne rabe. Za slovenščino, ki se od angleščine bistveno razlikuje zlasti po izraziti pregibnosti, ta sicer zelo izdelani model ne more neposredno predstavljati zgleda.

Appendix B.3.2 2 Predlog kategorij in lastnosti

Appendix B.3.2.1 2.1 Težave

Spol, število in sklon so kategorije, s katerimi je, kot je videti na podlagi pregleda vzorca, relativno malo težav.

Vrsta

Vrsta pridevnika je, enako kot pri Verdonikovi, opredeljena glede na kategorijo določnosti, in sicer glede na (sistemsko) možnost izražanja določnosti z morfemi, tj. upoštevaje zunanjo obliko, ne pa tudi pomenskih lastnosti pridevnika. V skladu s tem so pridevniki, ki ločijo določno in nedoločno obliko, opredeljeni kot kakovostni, vsi pridevniki, ki ne ločijo določne in nedoločne oblike in se v imenovalniku ednine moškega spola končajo na -i, so določeni kot vrstni, vsi pridevniki, ki ne ločijo določne in nedoločne oblike in se v imenovalniku ednine moškega spola končajo na -ø, pa so določeni kot svojilni. To je precejšen kompromis, saj je zlasti veliko vrstnih pridevnikov tako napačno opredeljenih kot kakovostnih. Nekaj, a manj napak je tudi pri opredelitvi pridevnikov, ki so sicer kakovostni, a se končajo na -i (kraljevski, divji ipd.), kot vrstnih. Razmeroma najbolj zanesljivo zaradi predvidljivih končnic analizator deluje pri označevanju svojilnih pridevnikov.

Ob uvrščanju pridevnikov v posamezne podkategorije vrste se je potrebno zavedati, da je problematična že nejasnost meja med posameznimi vrstami sama po sebi; te prehajajo druga v drugo in se deloma prekrivajo (prim. npr. tipologijo pridevnikov A. V. Muha, Slovensko leksikalno pomenoslovje, 2000).

Po Muhovi (2000) so tisti pridevniki, ki niso lastnostni ali količinski, tvorjeni in pripadajo naslednjim skupinam (glede na denotat v podstavi):

  1. vezani na pomen, ki ga lahko označimo s človeško (č+) z izrazno predvidljivimi obrazili -ov (moški) in -in (ženski)

  2. snovnost , snovne prvine (čokolad-ni, jagod-ov)

  3. sestavine koga ali česa; vrstni svojilni (tovarniški dimnik, človeška roka, lasni koren, šivankino uho)

  4. katera koli predmetnost – gre za povečano abstraktnost in s tem ekstenzivnost pomena samostalnika, ki ta pridevnik motivira (cerkveni – povezan s cerkvijo, cestni – povezan s cesto, kozji – povezan s kozo, pisateljski – povezan s pisateljem)

Vrstnost pridevnika se izraža s predvidljivimi obrazili: -ni (prislovni, obrazni), -ski (gorski, puščavski), -ški (pridevniški, bolniški), -ji (kokošji), -nji (zadnji, letošnji), -ov (fižolov), -čki (xxxxx), konverzni -i (črni, poslovni), pri čemer je treba upoštevati, da imajo priponska obrazila -ski, -ški, -ji tudi kakovostni pridevniki (stremuški, hujskaški, komolčarski …).

Pri svojilnih pridevnikih je treba biti posebej pozoren na splošno svojino, pri kateri so priponska obrazila taka kot pri vrstnih pridevnikih: -ski, -ški, -čki, -ji; -en (kmečki gozd – gozd kmetov, cerkvena zemlja – zemlja cerkve, beraška malha – malha beračev, državni denar – denar države), kar pomeni, da je meja med vrstnimi in svojilnimi pridevniki na tem mestu zelo porozna in nejasna.

Pri obravnavi vrst pridevnika pa bi vsekakor morali vzeti resno tudi naslednje opozorilo A. V. Muha (2000: 72, drobni tisk): »V naših slovnicah je zanemarjeno razmerje med tvorjenimi lastnostnimi in vrstnimi pridevniki z obrazilom -(e)n oziroma -ni: pojem vrstnosti se v naših slovnicah meša s pojmom skladenjske, v bistvu besedilne določnosti pridevnika (npr. SS 1976: 263–264). – Obrazilo -(e)n imajo namreč lahko samo tvorjeni lastnostni pridevniki, tip solzen. Pri teh primerih tako kot pri vseh drugih lastnostnih pridevnikih se končnica –ø, ko gre za skladenjsko določnost, zamenja z -i (1) v določenih besedilnih okoliščinah (SS 1976: 263, 1. točka), (2) ko se z zvezo lastnostnega pridevnika – natančneje samostalniške zveze s takšnim pridevnikom – s kazalnim zaimkom ali z osebnosvojilnim zaimkom vzpostavlja razmerje s posameznim, tip ta solzni obraz, njen solzni obraz … Obrazilo -ni imajo lahko le vrstni pridevniki, tip solzni kanal.«

Določnost

Najbolj problematično pri identifikaciji določnosti se zdi, da analizator upošteva samo pridevnike moškega spola ednine v imenovalniku (pri neživem še v tožilniku). Iz analize tako izpade večina pridevnikov: vsi pridevniki ženskega in srednjega spola, pa tudi moškega, če niso edninski in ne stojijo v imenovalniku. Nesprejemljivo je tudi to, da se določnost označuje ne glede na vrsto oziroma vrstne pridevnike napačno opredeli kot določne. Kot vemo, pa je določnost aktualna samo za del pridevnikov, in sicer za skupino kakovostnih, pri katerih se razmerje med določnostjo in nedoločnostjo kaže v priponi -i v imenovalniku, pri neživem pa še v tožilniku ednine za moški spol. Iz analize je razvidno tudi, da so kot določni upoštevani presežniki, kar ni problematično, in primerniki, kar je po mojem mnenju napačno, saj primernik namesto enega samega referenta identificira celo množico možnih referentov (po Muhi denotatov). Določnost je domnevno ugotovljena tudi v primerih, ko pred pridevnikom stoji kazalni ali svojilni zaimek. Za določni pridevnik gre tudi v zvezah, ki tvorijo lastnima imena.

So pa tudi vrstni pridevniki, ki enoznačno poimenujejo referent, npr. indijski kralj (je en sam!), nemški filozof Immanuel Kant (zaradi lastnega imena), desni pritok (določljiv s stališča pisca), … v sloviti Carnegie Hallu, nekdanji profesor Palm

Pri nadaljnjem razmišljanju o umestnosti opredeljevanja kategorije določnosti na morfosintaktični ravni morda (poleg Toporišičene slovnice) lahko pripomorejo naslednji viri:

A. V. Muha v okviru strukturalističnega pristopa k razumevanju jezika o določnosti razpravlja ob Kopitarjevi slovnici (Kopitar in njegova doba 1996). Ugotavlja, da gre jezikovno določnost razumeti na dveh ravneh: najprej kot razmerje med jezikovnosistemsko nedoločnostjo in govorno določnostjo, potem pa še kot besedilno določnost oz. nedoločnost. Jezikovne prvine, ki spreminjajo jezikovnosistemsko nedoločnost v govorno določnost, t. i. aktualizatorji, so poleg lastnih imen še deiksi v najširšem smislu in nefrazeološke imenske besedne zveze (tiste, ki po govornem dejanju razpadejo).

M. Schlamberger Brezar se zavzema za diskurzivni pristop k problemu določnosti v slovenščini (glej JiS sept.−okt. 2004), ki »osvetli primere rabe določnih oblik, ki na prvi pogled niso zajeti v definiciji 'določno je, kar je že znano' − to so primeri anaforične in deiktične rabe, ki vključujejo elemente, ki so dostopni tudi iz stvarnega konteksta.«

Toporišičeva skopa obravnava določnosti se omejuje na (sistemsko) možnost izražanja te kategorije z morfemi. A. V. Muha kot ustrezen okvir za obravnavo določnosti postavlja besedilo, znotraj katerega določene jezikovne prvine, tj. lastna imena, deiksi in frazeološke besedne zveze, »jezikovnosistemsko nedoločnost spreminjajo v govorno določnost«. Enako kot pri Muhovi je tudi zame pri vprašanju določnosti ključno vprašanje nanašanja, in sicer tako znotrajbesedilno (navezovanje, vzpostavitev koreferenčnih vezi) kot tudi na relevantno zunajbesedilno predmetnost in pojmovnost, tj. kontekst.

Christopher Lyons v svojem delu Definiteness (Cambridge University Pres 1999) ugotavlja, da je določnost zapleten jezikovni pojav, ki se v različnih jezikih izraža na različne načine, temelji pa na hipotezi že znanega/omenjenega, uvedenega v besedilo (anafora, katafora), kontekstualni/situacijski določnosti (govorcu in naslovniku je skupnomesto izrekanja) ali pa izhaja iz skupne vednosti. Določnost je v skladu z njim pravzaprav gramatikalizacija identifikacijskosti.

Živost

Podobno kot pri določnosti analizator kategorijo živosti upošteva samo tam, kjer naleti na tožilnik moškega spola ednine, zato iz obravnave izpade večina pridevnikov: vsi pridevniki ženskega in srednjega spola ter moškega, če niso edninski in niso v imenovalniku.

Pregled je pokazal, da je analizator kategorijo živosti opredelil v relativno malo primerih. V prvih 10 000 vrsticah jo npr. opredeli 31-krat, od tega samo štirikrat nepravilno, in sicer zaradi nepravilno določenega sklona.

Toporišič v Novi slovenski skladnji (1982: 391−393) v poglavju Tesnierjevska skladnja slovenskega knjižnega jezika med drugim pravi: »Pripisovati živost tudi pridevniku … je napačno … Tu se pridevnik kot prilastek le ujema s samostalnikom …« Kategorijo živosti naj bi samostalniku dajala moškost večje živali (vključno s človekom).

Za premislek: Če nas kategorija živosti zanima samo z vidika skladenjskega vzorca, ki se razlikuje pri samostalnikih (in pridevnikih) moškega spola ednine v tožilniku za živo+ oziroma živo-, sedanje označevanje ni problematično (napake so namreč posledica napačno določenih sklonov). Če pa nas zanima kategorija živosti kot taka, potem je potrebno ugotoviti, da 1. je živost lastnost samostalnika in 2. glavnina pridevnikov (vsi pridevniki ob samostalnikih ženskega in srednjega spola) ni upoštevana.

Stopnjevanje

  1. problem:

Analizator opredeli stopnjo pri vseh vrstah pridevnikov, ne le pri kakovostnih, čeprav vrstnih in svojilnih načeloma ne stopnjujemo.

Ta problem se zdi rešljiv, vendar na podlagi pravilne umestitve pridevnikov v podkategorije vrste.

  1. problem

Analizator, ki temelji na enobesednih lemah, ne upošteva opisnega stopnjevanja, ker obravnava vsako besedo posebej. Ko naleti npr. na bolj pameten, kot pridevnik obravnava samo pameten, in sicer kot osnovnik.

  1. problem

Podobno je s podkategorijo elativ. Analizator kot elativ opredeli le pridevnike s predpono pre-, kar ni ustrezno, saj je možnih prislovov za izražanje druge stopnje neskončno mnogo, npr. čudovito lep, nič kaj lep, blazno lep. Problematično pa je že to, da ta kategorija v celotnem vzorcu nastopa samo petkrat, od tega enkrat napačno (... ni nam preostalo …).

Rešitev je verjetno potrebno iskati v smeri večbesednih lem oz. (leksikalnih) enot analize.

Prim. Sinclaire (2004: 133):

amnogo če ne večina pomenov zahteva prisotnost več kot ene besede, da bi se normalno izrazili;

bvzorci koselekcije med besedami, ki so veliko močnejši kot dopušča katerikoli dosedanji opis, so neposredno povezani s pomenom.

Appendix B.3.2.2 2.2 Predlog

vrstanesvojilni, svojilni

stopnjaosnovnik, primernik, presežnik

spolmoški, ženski, srednji

številoednina, dvojina, množina

sklonimenovalnik, rodilnik, dajalnik, tožilnik, mestnik, orodnik

Namesto treh vrst pridevnika predlagam samo dve vrsti, s čimer bi odpravili velik del napak pri določanju vrstnih pridevnikov kot kakovostnih (in precej manjši del kakovostnih kot vrstnih) ter hkrati ohranili podkategorijo svojilnih pridevnikov, kjer število napak v vzorcu ni veliko.

Pri kategoriji stopnje predlagam, da izpustimo podkategorijo elativ, ki je trenutno omejena na pridevnike s predpono pre-, s čimer je celotni nabor elativov nedopustno okrnjen. Poleg tega elativ v vzorcu nastopa zanemarljivo malokrat.

Stopnja se določa samo za skupino nesvojilnih pridevnikov.

Vprašanje opisnega stopnjevanja (in zloženk, npr. črno-bel, avstrijsko-italijanski) kaže – kot pri PDT – reševati na naslednji, tj. skladenjski stopnji analize.

Pri spolu, sklonu in številu ni sprememb, eventuelno bi kazalo ugotoviti najpogostejša prekrivanja, npr.

Kategorijo živosti bi izločila, saj obstoječi model z redukcijo te kategorije na majhen del vseh pridevnikov ni sprejemljiv, o njej oziroma o spremenjenem skladenjskem vzorcu pa je mogoče tako in tako sklepati iz sovpadanja vrednosti moški spol, ednina, tožilnik, kar pomeni, da z izpustitvijo ne izgubimo nobene relevantne informacije.

Iz istega razloga (kot pri živosti), predvsem pa zato, ker določnosti ne razumem kot oblikoskladenjsko kategorijo, tudi sedanja kar se da zožena obravnava določnosti že načeloma ni sprejemljiva. Ker lahko o njej sklepamo na podlagi sovpadanja vrednosti moški spol, ednina, imenovalnik (oz. pri neživem še tožilnik), jo lahko brez škode izvzamemo iz nabora oznak.

V nadaljevanju raziskave bi bilo priporočljivo opredeliti najpogostejša prekrivanja in na podlagi dognanj določiti eventuelne kombinacije, npr. imenovalnik ednine ženskega spola in imenovalnik množine srednjega spola.

(… zahteva po 45.000 tolarjih izhodiščne plače …: prebere kot tožilnik množine namesto kot rodilnik ednine

… s spoštovanja vrednim samoodpovedovanjem…: analizator identificira kot dajalnik množine namesto kot orodnik ednine

… slovito … Šeherezado: prebere kot imenovalnik srednjega spola (ednine) namesto kot tožilnik ženskega spola

… v celotni proizvodnji: prebere kot tožilnik dvojine namesto mestnik ednine)

Ponekod analizator kot pridevnike (srednjega spola ednine imenovalnika) zazna prislove (… je krstno izvedel …; … včasih je težavno usklajevati …; … bi se obnašal ignorantsko …;), redkeje samostalnike ( Luciano Pavarotti). Zadrega glede mešanja pridevnika in prislova je rešljiva v večini primerov, saj pridevnik večinoma stoji neposredno pred samostalnikom.

Up: Appendix B Comparison with other recommendations for morphosyntactic annotation Previous: Appendix B.2 Glagol Next: Appendix B.4 Prislov



Tomaž Erjavec, Simon Krek, Špela Arhar, Darja Fišer, Nina Ledinek, Amanda Saksida, Breda Sivec, Blaž Trebar. Date: 2010-03-07
This work is licenced under the Creative Commons Attribution 3.0 Slovenia.