Sklopi projekta

Delovni sklop 1: KORPUS

V okviru DS1 smo v 2016 izdelali prototipno različico korpusa KAS, ki vsebuje skoraj milijardo besed znanstvenih besedil, zbranih iz digitalnih knjižnic slovenskih univerz. Besedila v korpusu so opremljena z bogatimi metapodatki, sama besedila pa so oblikoskladenjsko označena in lematizirana. Korpus je javno dostopen prek IJS instalacije konkordančnika noSketch Engine, kjer je razdeljen na sledeče podkorpuse:

Izdelava in vsebina korpusa sta opisana v publikaciji:

  • ERJAVEC, Tomaž, FIŠER, Darja, LJUBEŠIĆ, Nikola, LOGAR, Nataša, OJSTERŠEK, Milan. Slovenska znanstvena besedila: prototipni korpus in načrt analiz. Proceedings of the Conference on Language Technologies & Digital Humanities, September 29th – October 1st, 2016 Faculty of Arts, University of Ljubljana, Ljubljana, Slovenia, 2016, str. 58-64. [COBISS.SI-ID 62530146] [PDF]

Delovni sklop 2: TERMINI

V okviru DS2 smo v 2016 izdelali vzorce za luščenje terminov v orodju Sketch Engine. Delo je opisano v publikaciji:

  • FIŠER, Darja, SUCHOMEL, Vit, JAKUBIČEK, Miloš. Terminology extraction for academic Slovene using Sketch Engine. RASLAN 2016: Recent Advances in Slavonic Natural Language Processing : proceedings. Brno: Tribun EU, 2016, str. 135-141. [COBISS.SI-ID 62994018] [PDF]

Delovni sklop 3: DISKURZ

V okviru DS3 smo v 2016 uporabili izdelani prototipni korpus KAS za preučitev uporabe trpnika v slovenskem strokovnem jeziku. Analiza je opisana v publikaciji:

  • LOGAR, Nataša, ARHAR HOLDT, Špela, ERJAVEC, Tomaž. Slovenski strokovni jezik: korpusni opis trpnika. Toporišičeva obdobja, (Obdobja, ISSN 1408-211X, Simpozij, = Symposium, 35), 2016, str. 237-245. [COBISS.SI-ID 34453853] [PDF]

Delovni sklop 4: DISEMINACIJA

V okviru DS4 smo v 2016 v sklopu konference “Jezikovne tehnologije in digitalna humanistika” organizirali panel “Terminologija v poklicnem vsakdanu: stanje in potrebe” z namenom, da preveri stanje in potrebe slovenske terminologije, da lahko projekt čim bolje uresniči svoje poslanstvo na tem področju. Panel je povezovala Nataša Logar, Univerza v Ljubljani, Fakulteta za družbene vede. Govorci in govorke so bili:

  • Urban Bren, Univerza v Mariboru, Fakulteta za kemijo in kemijsko tehnologijo
  • Miro Romih, Amebis, d. o. o., Kamnik
  • Mojca Žagar Karer, Inštitut za slovenski jezik Frana Ramovša, ZRC SAZU
  • Katja Benevol Gabrijelčič, Islovar
  • Sašo Dolenc, Kvarkadabra
  • Katarina Krapež, Univerza na Primorskem, Fakulteta za management

Pogovor bo v 2017 objavljen v reviji Slovenščina 2.0.