JOS morphosyntactic specifications for Slovene

Appendix B.10 Medmet

Up: Appendix B Comparison with other recommendations for morphosyntactic annotation Previous: Appendix B.9 Členek

Table of contents

Simon Krek
Špela Arhar
5. 7. 2007

Appendix B.10.1 1 Analiza obstoječih rešitev

Appendix B.10.1.1 1.1 MULTEXT-East V3

Slovenski del nabora oznak v specifikacijah MULTEXT-East V3 ne predvideva dodatne členitve označevanja za besedno vrsto medmet (za obravnavo medmetov v tem viru glej Erjavec, 2004: 184), posledično tudi niso navedene kombinacijeoznak. Leksikonprinaša en sam primer, in sicer medmet ah.

Appendix B.10.1.2 1.2 POS-beseda

Tudi Jakopin in Bizjak, 1997 medmeta ne členita:

tip
oznaka
primer
medmet
M
oh

V Lönneker in Jakopin, 2004 je medmet uvrščen v označevalno skupino X, med besede, ki se ne pregibajo, prav tako pa niso nadaljnje podoznačevane.

Appendix B.10.1.3 1.3 LC-STAR in SImlex

Slovenščini prilagojene oblikoskladenjske oznake, izdelane po direktivah projekta LC-STAR, medmetne besedne vrste ne členijo na nikakršen način (Verdonik et al., 2004). Literatura (Verdonik et al., 2003) tudi ne prinaša informacij o tem, da bi bili medmeti na kakršenkoli način posebej obravnavani na ravni leksikona.

Appendix B.10.1.4 1.4 Praški Treebank

Nabor oznak PDT za označevanje medmetov predvideva le najsplošnejšo besednovrstno oznako medmet (I) (Hana et al., 2005).

Appendix B.10.1.5 1.5 Ajka

Tudi nabor oznak Ajka ne predvideva nadaljnjega označevanja medmetov (Citoslovce?).

Appendix B.10.1.6 1.6 BNC

Sistem oznak CLAWS 7 prinaša za označevanje medmetov eno samo kategorijo, tj. UH – medmet (npr. oh, yes, um), prav tako ostali nabori CLAWS, razen CLAWS 5, ki ima nekoliko širšo kategorijo ITJ - medmet ali druga izolirana jezikovna pojavnost (interjection or other isolate).

Appendix B.10.2 2 Analiza označenega vzorca iz korpusa FidaPLUS

Besed, označenih za medmete, je bilo v danem vzorcu relativno malo: denimo, recimo, no, la ter zdravo. [Note: Ker gre za leksikonsko določene medmete, na tem mestu tudi ne bo govora o ne/upravičenosti uvrščenosti navedenih leksemov med medmete.]Označevanje temelji na leksikonskih podatkih, zato podrobnejša analiza vzorca na tem mestu ni potrebna.

Appendix B.10.3 3 Predlog kategorij in lastnosti

Predlog ne predvideva nikakršne oblike označevanja medmetov, razen besednovrstne – medmet (M).

Up: Appendix B Comparison with other recommendations for morphosyntactic annotation Previous: Appendix B.9 Členek



Tomaž Erjavec, Simon Krek, Špela Arhar, Darja Fišer, Nina Ledinek, Amanda Saksida, Breda Sivec, Blaž Trebar. Date: 2010-03-07
This work is licenced under the Creative Commons Attribution 3.0 Slovenia.