JOS morphosyntactic specifications for Slovene

Appendix A Differences between FidaPLUS / MULTEXT-East V3 and JOS / MULTEXT-East V4 specifications

Up: Contents Next: Appendix B Comparison with other recommendations for morphosyntactic annotation

This appendix summarises the differences in attributes and their values between the MULTEXT-East Version 3 specifications used in the annotation of FIDA and FidaPLUS corpora, and the JOS and MULTEXT-East V4 specifications. It is available only in Slovene.

Samostalnik:
  1. Samostalnik: lastnost "živost" je prestavljena na 5. mesto

Glagol:
  1. Lastnost "vrsta":

    1. "polnopomenski" in “modalni” postenejo "glavni"

    2. "vezni" se preimenuje v "pomožni".

  2. Ukinjena je kategorija "čas" (bivša št. 3)

    1. sedanja in prihodnja obl. glagola se prestavita v gl. obliko (št. 2)

    2. povednik se ukinja in namesto njega uporabi sedanjo obl. glagola.

  3. Ukinjena je kategorija "način" (bivša št. 7)

    1. deležniki z lastnostjo "tvornik" ostanejo

    2. deležniki z lastnostjo "trpni_deležnik" se spremenijo v pridevnike vrste "deležniški".

  4. Kategorija "vid" se prestavi na št. 2 (iz št. 14) in dobi lastnost "dvovidski".

  5. Vse kategorije od kategorija oblika se prestavijo za mesto višje.

Pridevnik:
  1. Pridevniki z lastnostjo "kakovostni" in "vrstni" postanejo "splošni".

  2. Kategorija vrsta dobi lastnost "deležniški".

  3. Ukine se kategorija "živost".

  4. Pri kategoriji "stopnja" gre "elativ" v “osnovnik”.

Prislov:
  1. Kategorija vrsta dobi lastnost "deležniški".

  2. Pri kategoriji "stopnja" gre “osnovnik” v nedoločeno.

  3. Pri kategoriji "stopnja" gre "elativ" v nedoločeno.

Zaimek:
  1. Ukinejo se vse kategorije od 8. naprej, vključno z živostjo.

  2. Pri kategoriji 8. se poimenovanje spremeni v "naslonskost" in lastnosti "da" in "ne" zamenjata s "klitična" in “navezna”

Števnik:
  1. Pod kategorijo "vrsta" se doda lastnost "zaimkovni".

  2. Ukine se kategorija "živost".

  3. Kategorija zapis gre na 1. mesto. Ostale kategorije se pomaknejo za mesto višje.

Predlog:
  1. Ukineta se kategoriji "vrsta" in "sestavljenost".

Veznik:
  1. Ukine se kategorija "oblika".

Neuvrščeno:
  1. Dodan atribut vrsta z naslednjimi vrednostmi:

    1. j – tujejezični citat, ponavadi večbeseden, ki deluje izven sistema slovenskega jezika, npr. “and so on” ima vse tri besede označene z Nj.

    2. t – tipkarska napaka; tudi če je zarado majkajočega ali odvečnega presledka, npr. “inje kon čal” ima vse tri “besede” označene z Nt.

    3. p – napaka zaradi pomanjkljivosti programa, kjer je delil preveč ali premalo, npr. pri “http:// nl. ijs. si” označimo vse štiri pojavnice z Np.

Up: Contents Next: Appendix B Comparison with other recommendations for morphosyntactic annotation



Tomaž Erjavec, Simon Krek, Špela Arhar, Darja Fišer, Nina Ledinek, Amanda Saksida, Breda Sivec, Blaž Trebar. Date: 2010-03-07
This work is licenced under the Creative Commons Attribution 3.0 Slovenia.