Dan Tufis & al * Corpora and Corpus-Based Morpho-Lexical Processing
Într-o zi seninã ºi friguroasã de aprilie, pe când ceasurile bãteau ora treisprezece, Winston Smith, cu bãrbia înfundatã în piept pentru a scãpa de vântul care-l lua pe sus, se strecurã iute prin uºile de sticlã .... |
Fig. 1. - Plain text. |
Într- | Într- | Spsay | Într- | Spsay |
o | o | Qf Pp3fsa--------w Mcfsrl Tifsr Va--3s
|
o | Tifsr |
zi | zi | Vmip1s Ncfsrn Vmm-2s | zi | Ncfsrn |
seninã | seninã | Afpfsrn | seninã | Afpfsrn |
ºi | ºi | Ccssp Px3--d--------w Rp | ºi | Ccssp |
friguroasã | friguroasã | Afpfsrn | friguroasã | Afpfsrn |
de | de | Csssp Spsa | de | Spsa |
aprilie | aprilie | Ncms-n | aprilie | Ncms-n |
, | , | , | ||
pe | pe | Spsa | pe | Spsa |
când | când | Rw | când | Rw |
ceasurile | ceasurile | Ncfpry | ceasurile | Ncfpry |
bãteau | bãteau | Vmii3p | bãteau | Vmii3p |
ora | ora | Ncfsry | ora | Ncfsry |
treisprezece | treisprezece | Mc-p-l | treisprezece | Mc-p-l |
, | , | , | ||
Winston | Winston | Npms-n | Winston | Npms-n |
Smith | Smith | Np | Smith | Np |
, | , | , | ||
cu | cu | Spsa | cu | Spsa |
bãrbia | bãrbia | Ncfsry | bãrbia | Ncfsry |
înfundatã | înfundatã | Vmp--sf Afpfsrn | înfundatã | Afpfsrn |
în | în | Spsa | în | Spsa |
piept | piept | Ncms-n | piept | Ncms-n |
pentru | pentru | Spsa | pentru | Spsa |
a | a | I Qn Spsa Tsfs Va--3s | a | Qn |
scãpa | scãpa | Vmnp Vmii3s Vmm-2s | scãpa | Vmnp |
de | de | Csssp Spsa | de | Spsa |
vântul | vântul | Ncmsry | vântul | Ncmsry |
care | care | Pw3--r Vmsp3 Ncfp-n Dw3--r---e | care | Dw3--r---e |
-l | -l | Pp3msa--y-----w | -l | Pp3msa--y-----w |
lua | lua | Vmp--sm Vmnp Vmii3s Vmm-2s | lua | Vmii3s |
pe | pe | Spsa | pe | Spsa |
sus | sus | Ncms-n Rgp | sus | Rgp |
, | , | , | ||
se | se | Px3--a--------w | se | Px3--a--------w |
strecurã | strecurã | Vmis3s | strecurã | Vmis3s |
iute | iute | Afpfsrn Afpms-n Rgp Ncfson | iute | Rgp |
prin | prin | Spsa | prin | Spsa |
uºile | uºile | Ncfpry | uºile | Ncfpry |
de | de | Csssp Spsa | de | Spsa |
sticlã | sticlã | Ncfsrn | sticlã | Ncfsrn |
... | ... | ... | ||
Fig. 2. - Segmented text |
Fig. 3. - Ambiguously annotated text | Fig. 4. - Disambiguated text |
40