DSI

kolofon TEI

§opis datoteke
§navedba naslova
§naslov

tip = main
DSI-ana: jezikoslovno označen korpus informatike 2003-2019
§navedba odgovornosti
§ime Katarina Puc
§odgovornost

Zagotovitev izvornih besedil.
§navedba odgovornosti
§ime Tomaž Erjavec
§odgovornost

Pretvorba v TEI P5, jezikslovno označevanje.
§navedba izdaje
§izdaja V5.0
§obseg
§mera

enota = texts
1.776 prispevkov
§mera

enota = besede
4.335.534 besed
§mera

enota = tokens
5,245,073 pojavnic
§navedba objave
§distributer CLARIN.SI
§kraj objave http://hdl.handle.net/11356/1239
§datum 2019-07-25
§dostopnost

§opis vira

Zborniki konferenc "Dnevi slovenske informatike" (2003-2019)

Zbornik konferenc "Informatika v javni upravi" (2015-2018)

Revija "Uporabna informatika" (2010-2019)

§opis označevanja
§opis projekta

Korpus je bil narejen kot podpora spletnemu terminološkemu slovarju informatike iSlovar.

Zasnova korpusa je opisana v: Špela Vintar Tomaž Erjavec iKorpus in luščenje izrazja za Islovar Zbornik Šeste konference Jezikovne tehnologije, IJS, Ljubljana 2008. str. 65-69

§načela označevanja
§imenski prostor

ime = http://www.tei-c.org/ns/1.0
§uporaba oznake

ime elementa = text pojavitev = 30
besedilo
§uporaba oznake

ime elementa = body pojavitev = 30
telo besedila
§uporaba oznake

ime elementa = div pojavitev = 1776
razdelek
§uporaba oznake

ime elementa = head pojavitev = 1776
naslov
§uporaba oznake

ime elementa = docAuthor pojavitev = 3005
avtor dokumenta
§uporaba oznake

ime elementa = forename pojavitev = 3005
ime
§uporaba oznake

ime elementa = surname pojavitev = 3005
priimek
§uporaba oznake

ime elementa = p pojavitev = 125550
odstavek
§uporaba oznake

ime elementa = s pojavitev = 266940
povedna enota
§uporaba oznake

ime elementa = w pojavitev = 4444265
beseda
§uporaba oznake

ime elementa = pc pojavitev = 800808
ločilo
§uporaba oznake

ime elementa = c pojavitev = 4321684
znak
§listPrefixDef
§prefixDef

identifikator = mte

Zasebni naslovi URI s to predpono kažejo na element fs, ki definirajo slovenske oblikoskladenjske oznake MULTEXT-East V6.

§podatki o aplikaciji

Oblikoskladenjsko označevanje in lematizacija s programom ReLDI Tagger, izšolanimi za slovenščino in dostopnim na https://github.com/clarinsi/reldi-tagger.

§aplikacija

identifikator = reldi-tagger
§napis ReLDI tagger
§opis sprememb
§sprememba

kdaj = 2019-07-25
Tomaž Erjavec<ime>: Dodani letniki 2017-2019, dodani metapodatki o prispevkih, na novo pretvorjen in označen celoten korpus.
§sprememba

kdaj = 2017-03-22
Tomaž Erjavec<ime>: Dodan letnik 2016 in na novo pretvorjen in označen celoten korpus.
§sprememba

kdaj = 2016-02-24
Tomaž Erjavec<ime>: Dodan letnik 2015
§sprememba

kdaj = 2015-03-15
Tomaž Erjavec<ime>: Dodan letnik 2014
§sprememba

kdaj = 2013-10-15
Tomaž Erjavec<ime>: Dodan letnik 2013
§sprememba

kdaj = 2012-12-23
Tomaž Erjavec<ime>: Spremenjena struktura, dodan letnik 2012


Datum: 2019-09-06

Avtorske pravice za besedilo te izdaje določa licenca Creative Commons Priznanje avtorstva 4.0.