kolofon TEI

§opis datoteke
§navedba naslova
§naslov Gigafida: INTERNET (2011-01-29)
§navedba izdaje
§izdaja 1.1
§obseg 20957 besed
§navedba objave
§založba
Univerza v Ljubljani, Center za jezikovne vire in tehnologije
§identifikacijska številka najdi.si
§dostopnost

Avtorske pravice za to izdajo ureja Pogodba o zbiranju in uporabi besedilnega korpusa v okviru projekta Sporazumevanje v slovenskem jeziku, katere skrbnik je Fakulteta za družbene vede Univerze v Ljubljani, Kardeljeva ploščad 5, Ljubljana. Kopija pogodbe je dostopna na URL www.slovenscina.eu/korpusi/pogodba

§datum 2018-02-04
§opis vira
§bibliografska enota
§naslov INTERNET
§avtor
neznani avtor
§datum 2011-01-29
§založba
najdi.si
§opomba
tip = sourceLang
§opomba
§opis označevanja
§seznam definicij prefiksov
§shema za prefiksiranje vrednosti data.pointer
identifikator = msd

Zasebni naslovi URI s predpono "msd" kažejo na elemente fs, ki definirajo slovenske oblikoskladenjske oznake MULTEXT-East V5.

§opis projekta

Projekt Nadgradnja korpusov Gigafida, Kres, ccGigafida in ccKres.

§opis projekta

Projekt Sporazumevanje v slovenskem jeziku.

§uredniška načela
§interpretacija

Besedne oblike imajo pripisano avtomatsko določeno lemo in oblikoskladenjsko oznako.

§standardne vrednosti

Oblikoskladenjske oznake sledijo oblikoskladenjskim specifikacijam MULTEXT-East različica 5 za slovenski jezik, cf. http://nl.ijs.si/ME/V5/msd/.

p/@ana določa ali je odstavek bližnji duplikat (vrednost "dup") nekega drugega odstavka ali ne (vrednost "nodup"). Tudi besedila so označena s text/@ana, ki ima vrednost "dup" takrat, kadar so vsi odstavki besedila bližnji duplikati.

§načela označevanja
§imenski prostor
ime = http://www.tei-c.org/ns/1.0
§uporaba oznake
ime elementa = c pojavitev = 20465
znak
§uporaba oznake
ime elementa = body pojavitev = 1
telo besedila
§uporaba oznake
ime elementa = pc pojavitev = 3677
ločilo
§uporaba oznake
ime elementa = p pojavitev = 759
odstavek
§uporaba oznake
ime elementa = s pojavitev = 1255
povedna enota
§uporaba oznake
ime elementa = text pojavitev = 1
besedilo
§uporaba oznake
ime elementa = w pojavitev = 20957
beseda
§načela klasifikacije
§taksonomija
identifikator = SSJ
§kategorija
identifikator = SSJ.T
§opis kategorije tisk
§kategorija
identifikator = SSJ.T.K
opis kategorije knjižno
kategorija
identifikator = SSJ.T.K.L
opis kategorije leposlovno
kategorija
identifikator = SSJ.T.K.S
opis kategorije strokovno
§kategorija
identifikator = SSJ.T.P
opis kategorije periodično
kategorija
identifikator = SSJ.T.P.C
opis kategorije časopis
kategorija
identifikator = SSJ.T.P.R
opis kategorije revija
§kategorija
identifikator = SSJ.T.D
opis kategorije drugo
§kategorija
identifikator = SSJ.I
§opis kategorije internet
§taksonomija
identifikator = duplicates
§kategorija
identifikator = nodup
§opis kategorije ni (bližnji) duplikat
§kategorija
identifikator = dup
§opis kategorije je (bližnji) duplikat
§opis značilnosti besedila
§klasifikacija besedila
§sklic na kategorijo
cilj = #SSJ.I
§opis sprememb
§sprememba Tomaž Erjavec<ime>: deduplication marking; new tagging and lemmatisation; format according to CLARIN.SI specs.
§datum
kdaj = 2018-02-04
2018-02-04