kolofon TEI

§opis datoteke
§navedba naslova
§naslov Gigafida: Janice Galloway. DIHATI MORAŠ, TO JE VSA SKRIVNOST. (2000)
§navedba izdaje
§izdaja 1.1
§obseg 65050 besed
§navedba objave
§založba
Univerza v Ljubljani, Center za jezikovne vire in tehnologije
§identifikacijska številka JANICE
§dostopnost

Avtorske pravice za to izdajo ureja Pogodba o zbiranju in uporabi besedilnega korpusa v okviru projekta Sporazumevanje v slovenskem jeziku, katere skrbnik je Fakulteta za družbene vede Univerze v Ljubljani, Kardeljeva ploščad 5, Ljubljana. Kopija pogodbe je dostopna na URL www.slovenscina.eu/korpusi/pogodba

§datum 2018-02-04
§opis vira
§bibliografska enota
§navedba odgovornosti
§ime Tina Mahkota
§odgovornost prevod
§opomba Beletrina. Prevedeno verjetno ze l. 1998.
§naslov DIHATI MORAŠ, TO JE VSA SKRIVNOST
§avtor Janice Galloway
§datum 2000
§založba
Študentska organizacija Univerze, Študentska založba
§opomba
tip = sourceLang
§opis označevanja
§seznam definicij prefiksov
§shema za prefiksiranje vrednosti data.pointer
identifikator = msd

Zasebni naslovi URI s predpono "msd" kažejo na elemente fs, ki definirajo slovenske oblikoskladenjske oznake MULTEXT-East V5.

§opis projekta

Projekt Nadgradnja korpusov Gigafida, Kres, ccGigafida in ccKres.

§opis projekta

Projekt Sporazumevanje v slovenskem jeziku.

§uredniška načela
§interpretacija

Besedne oblike imajo pripisano avtomatsko določeno lemo in oblikoskladenjsko oznako.

§standardne vrednosti

Oblikoskladenjske oznake sledijo oblikoskladenjskim specifikacijam MULTEXT-East različica 5 za slovenski jezik, cf. http://nl.ijs.si/ME/V5/msd/.

p/@ana določa ali je odstavek bližnji duplikat (vrednost "dup") nekega drugega odstavka ali ne (vrednost "nodup"). Tudi besedila so označena s text/@ana, ki ima vrednost "dup" takrat, kadar so vsi odstavki besedila bližnji duplikati.

§načela označevanja
§imenski prostor
ime = http://www.tei-c.org/ns/1.0
§uporaba oznake
ime elementa = c pojavitev = 62550
znak
§uporaba oznake
ime elementa = body pojavitev = 1
telo besedila
§uporaba oznake
ime elementa = pc pojavitev = 13971
ločilo
§uporaba oznake
ime elementa = p pojavitev = 2570
odstavek
§uporaba oznake
ime elementa = s pojavitev = 7763
povedna enota
§uporaba oznake
ime elementa = text pojavitev = 1
besedilo
§uporaba oznake
ime elementa = w pojavitev = 65050
beseda
§podatki o aplikaciji
§aplikacija
identifikator = Onion
§napis Onion deduplicator with n-gram length 9 and duplicate content threshold 0.5 used for paragraph level deduplication.
§aplikacija
identifikator = MetaTagger
§napis Used meta tagger to determine which MSD and lemma to use, given Obeliks and ReLDI tagger output.
§aplikacija
identifikator = Amebis_pretvornik
§napis [ZDRUZEVANJE] 1:1
§napis [IME] D:\FIDA\KORPUS\VNOS\2_ZDR\JANICE.ZDR
§napis [1] **********
§napis [IZVOR] D:\FIDA\KORPUS\Vhod\Beletrina\janice\JANICE.doc
§napis [FORMAT] MS Word for Windows 6.0/7.0
§napis [DATUM] 18.4.2000
§napis [IZVOR_RTF] D:\FIDA\KORPUS\Vhod\BELETR~1\janice\JANICE.RTF
§napis [PRETVORBA] RTF
§napis [KONEC] **********
§načela klasifikacije
§taksonomija
identifikator = SSJ
§kategorija
identifikator = SSJ.T
§opis kategorije tisk
§kategorija
identifikator = SSJ.T.K
opis kategorije knjižno
kategorija
identifikator = SSJ.T.K.L
opis kategorije leposlovno
kategorija
identifikator = SSJ.T.K.S
opis kategorije strokovno
§kategorija
identifikator = SSJ.T.P
opis kategorije periodično
kategorija
identifikator = SSJ.T.P.C
opis kategorije časopis
kategorija
identifikator = SSJ.T.P.R
opis kategorije revija
§kategorija
identifikator = SSJ.T.D
opis kategorije drugo
§kategorija
identifikator = SSJ.I
§opis kategorije internet
§taksonomija
§kategorija
identifikator = Ft.P
§opis kategorije prenosnik
§kategorija
identifikator = Ft.P.G
opis kategorije govorni
§kategorija
identifikator = Ft.P.E
opis kategorije elektronski
§kategorija
identifikator = Ft.P.P
opis kategorije pisni
kategorija
identifikator = Ft.P.P.O
opis kategorije objavljeno
kategorija
identifikator = Ft.P.P.O.K
opis kategorije knjižno
kategorija
identifikator = Ft.P.P.O.P
opis kategorije periodično
kategorija
identifikator = Ft.P.P.O.P.C
opis kategorije časopisno
kategorija
identifikator = Ft.P.P.O.P.C.D
opis kategorije dnevno
kategorija
identifikator = Ft.P.P.O.P.C.V
opis kategorije večkrat tedensko
kategorija
identifikator = Ft.P.P.O.P.C.T
opis kategorije tedensko
kategorija
identifikator = Ft.P.P.O.P.R
opis kategorije revialno
kategorija
identifikator = Ft.P.P.O.P.R.T
opis kategorije tedensko
kategorija
identifikator = Ft.P.P.O.P.R.S
opis kategorije štirinajstdnevno
kategorija
identifikator = Ft.P.P.O.P.R.M
opis kategorije mesečno
kategorija
identifikator = Ft.P.P.O.P.R.D
opis kategorije redkeje kot na mesec
kategorija
identifikator = Ft.P.P.O.P.R.O
opis kategorije občasno
kategorija
identifikator = Ft.P.P.N
opis kategorije neobjavljeno
kategorija
identifikator = Ft.P.P.N.J
opis kategorije javno
kategorija
identifikator = Ft.P.P.N.I
opis kategorije interno
kategorija
identifikator = Ft.P.P.N.Z
opis kategorije zasebno
§taksonomija
§kategorija
identifikator = Ft.Z
§opis kategorije zvrst
§kategorija
identifikator = Ft.Z.U
opis kategorije umetnostna
kategorija
identifikator = Ft.Z.U.P
opis kategorije pesniška
kategorija
identifikator = Ft.Z.U.R
opis kategorije prozna
kategorija
identifikator = Ft.Z.U.D
opis kategorije dramska
§kategorija
identifikator = Ft.Z.N
opis kategorije neumetnostna
kategorija
identifikator = Ft.Z.N.S
opis kategorije strokovna
kategorija
identifikator = Ft.Z.N.S.H
opis kategorije humanistična in družboslovna
kategorija
identifikator = Ft.Z.N.S.N
opis kategorije naravoslovna in tehnična
kategorija
identifikator = Ft.Z.N.N
opis kategorije nestrokovna
kategorija
identifikator = Ft.Z.N.P
opis kategorije pravna
§taksonomija
§kategorija
identifikator = Ft.L
§opis kategorije lektorirano
§kategorija
identifikator = Ft.L.D
opis kategorije da
§kategorija
identifikator = Ft.L.N
opis kategorije ne
§taksonomija
identifikator = duplicates
§kategorija
identifikator = nodup
§opis kategorije ni (bližnji) duplikat
§kategorija
identifikator = dup
§opis kategorije je (bližnji) duplikat
§opis značilnosti besedila
§klasifikacija besedila
§sklic na kategorijo
cilj = #SSJ.T.K.L
§sklic na kategorijo
cilj = #Ft.P.P.O.K
§sklic na kategorijo
cilj = #Ft.Z.U.R
§sklic na kategorijo
cilj = #Ft.L.N
§opis sprememb
§sprememba Tomaž Erjavec<ime>: deduplication marking; new tagging and lemmatisation; format according to CLARIN.SI specs.
§datum
kdaj = 2018-02-04
2018-02-04