Gradnja korpusov
izbirni podiplomski predmet
za študente Filozofske fakultete Univerze v Ljubljani
Obravnavane teme
- uvod v jezikovne tehnolgije
- osnove operacijskega sistema Linux (po želji)
- osnove programskega jezika Perl
- osnove označevalnega jezika XML
Obveznosti
Izdelava projektne naloge, kar je pogoj za pristop k ustnemu
izpitu. Tu se preveri znanje iz obravnavanih tem.
- prisostvovanje drugemu bloku predavanj na
New Media and Language
Technologies na JSIPS, ter okvirno poznavanje tematike
predstavljene v materialih na tem URL
- Razumevanje tem obdelanih v seznamu literature:
- Tomaž Erjavec:
MULTEXT-East Version 3:
Multilingual Morphosyntactic Specifications, Lexicons and Corpora.
In: Proc. of the Fourth Intl. Conf. on
Language Resources and Evaluation,
LREC'04,
pp. 1535 - 1538,
ELRA, Paris, 2004.
[c.f. also http://nl.ijs.si/ME/V3/]
- ERJAVEC, Tomaž, IGNAT, Camelia, POULIQUEN, Bruno, STEINBERGER, Ralf.
Massive multi-lingual corpus
compilation: Acquis Communautaire and totale.
In Proceedings of the 2nd Language & Technology Conference, April 21-23, 2005, Poznan, Poland. 2005, pp. 32-36.
- Tomaž Erjavec and Sašo Džeroski:
Machine Learning of Morphosyntactic Structure:
Lemmatising Unknown Slovene Words.
Applied Artificial Intelligence
18(1), pp. 17-40, 2004.
- ERJAVEC, Tomaž, OGRIN, Matija.
Digitalisation of literary heritage
using open standards.
In CUNNINGHAM, Paul CUNNINGHAM, Miriam (eds.).
Innovation and knowledge economy: issues, applications, case studies,
(Information and communication technologies and the
knowledge economy). Amsterdam [etc.]: IOS Press, 2005,
str. 999-1006.
- Kmalu se kaksna slovesnka..
Zadnja sprememba 2006-02-23,
et