MAKS (MlAdinski KorpuS) je korpus besedil v obsegu 10 mio besed. Zajema besedila iz
leposlovja, publicistike in v manjšem obsegu s spleta. Prilagojen je potrebam učnega
e-okolja Slovenščina na dlani, kjer služi kot vir primerov za tvorjenje nalog iz slovnice
in pravopisa. Besedila so zato izbrana tako, da so čim bolj slogovno nevtralna in
lektorsko pregledana ter predstavljajo za šolajočo se populacijo zanimive vsebine.
Besedila za korpus MAKS so bila izbrana tako, da so čim bolj slogovno nevtralna in
lektorsko pregledana ter predstavljajo za šolajočo se populacijo zanimive vsebine.
Zajeta so iz leposlovja, publicistike in v manjšem delu iz spleta.
Vsebuje eno odvisnostno skladenjsko povezavo ali kazalce na pojavnice, ki konstituirajo
en glagoski večbesedni izraz ali povezavo udeleženskih vlog med dvema pojavnicama.
Zasebni naslovi URI s to predpono kažejo na elemente, ki podajo preslikavo v njihove
slovenske in angleške termine. V pričujočem dokumentu so to enostavno lokalne reference
v taksonomijo UD-SYN, ki se nahajaja v kolofonu TEI.
Oblikoskladenjsko označevanje MULTEXT-East in lematizacija s programom ReLDI Tagger,
izšolanimi za slovenščino in dostopnim na https://github.com/clarinsi/reldi-tagger.