§interpretacija
|
Besedilo je bilo avtomatsko tokenizirano,
besede pa označena z oblikoskladenjsko oznako in lemo. Za
označevanje slovenščine je bil upoabljen program ToTrTaLe,
za angleščino pa TreeTagger z modelom naučenim na Penn
Treebank. Vsaka beseda ima dve oblikoskladenjski oznaki.
Za slovenščino poda atrubut @ctag reducirano angleško
oznako po specifikacijah
SPOOK tag, atribut @ana pa celotno angleško oznako
pospecifikacijah
JOS. Za angleščino vsebuje @ctag izvorno TreeTagger
(Penn) oznako, medtem ko vsebuje @ana preslikavo na
ekvivalentno oznako iz specifikacij
SPOOK.
|