VAYNA

kolofon TEI

§opis datoteke
§navedba naslova
§naslov

tip = main
Korpus "Napadi na JNA" (1989)
§naslov

tip = sub
jezikoslovno označena različica
§navedba odgovornosti
§osebno ime Igor Žagar
§osebno ime Peter Tancig
§odgovornost

Vodenje projekta, izbira vzorcev
§navedba odgovornosti
§osebno ime Tomaž Erjavec
§odgovornost

Pretvorba korpusa v TEI, jezikoslovno obdelava
§navedba izdaje
§izdaja 1.1
§obseg
§mera

enota = text
360 besedil
§navedba objave www.clarin.si

To delo je ponujeno pod Creative Commons Priznanje avtorstva 4.0 mednarodna licenca.

§izdajatelj
§ime organizacije

Slovenska raziskovalna infrastruktura CLARIN.SI
§identifikacijska številka

tip = handle
http://hdl.handle.net/11356/1237
§kraj objave http://hdl.handle.net/11356/1237
§dostopnost

§licence http://creativecommons.org/licenses/by/4.0/
§datum

kdaj = 2019-06-01
§opis vira

Korpus vsebuje časopisne in revijalne članke, ki so izšli april — avgust 1989 in se ukvarjajo z JNA, v veliki meri pa tudi z sojenjem JBTZ. Korpus vsebuje članke iz naslednjih virov: Delo (182), Dnevnik (62), Komunist (19), Teleks (18), Mladina (18), Primorski Dnevnik (9), Nova Revija (8), Tribuna (6), Večer (5), Nedeljski Dnevnik (4), TV-15 (3), Jana (3), Delavska Enotnost (3), 7 D (2), Tanjug (1), Skupščinski Poročevalec (1), Razmerja (1), Radar (1), Intervju (1), Gospodarski Vestnik (1), Družina (1), Danas (1).

The corpus contains newspaper and magazine articles that were published April — August 1989 and that deal with the Yugoslav National Army or with the JBTZ Trial. The corpus contains articles from the following sources: Delo (182), Dnevnik (62), Komunist (19), Teleks (18), Mladina (18), Primorski Dnevnik (9), Nova Revija (8), Tribuna (6), Večer (5), Nedeljski Dnevnik (4), TV-15 (3), Jana (3), Delavska Enotnost (3), 7 D (2), Tanjug (1), Skupščinski Poročevalec (1), Razmerja (1), Radar (1), Intervju (1), Gospodarski Vestnik (1), Družina (1), Danas (1).

Zbirka in nje analiza je opisana v: Tancig, Peter, Žagar, Igor: Računalniško podprta analiza velikih tekstualnih baz podatkov: Primer napadov na JNA Zbornik V. kongresa Zveze društev za uporabno jezikoslovje Jugoslavije, Ljubljana 1989. Str. 51-56. URN:NBN:SI:doc-XGCMAHI4

§opis označevanja
§opis projekta

Korpus je bila narejen, da empirično preuči resničnost trditev, da slovenski tisk napada Jugoslovansko Ljudsko Armado.

§načela vzorčenja

V korpus so bili zajeti članki iz slovenskega časopisja v obdobju april — avgust 1989, ki so se tako ali drugače navezovali na JNA.

The corpus contains articles from Slovene newspapers and magazines published in the period April — August 1989 that had some connection to the Yugoslav National Army.

§uredniška načela

Korpus so po predlogi originalov vtipkali študentje. Zbirka zato vsebuje tipkarske napake in izpuste. Vtipkana besedila so bila urejena za potrebe konkordančnega programa OKUS. Ta format je bil nato polavtomatsko normaliziran in pretvorjen v TEI. V tem koraku so bile popravljene najdene tipkarske napake, delejene besede so bile združene in pomišljaj kot stavčno ločilo zamenjan s '—'.

§načela označevanja
§imenski prostor

ime = http://www.tei-c.org/ns/1.0
§uporaba oznake

ime elementa = text pojavitev = 1
besedilo
§uporaba oznake

ime elementa = body pojavitev = 1
telo besedila
§uporaba oznake

ime elementa = author pojavitev = 251
avtor
§uporaba oznake

ime elementa = div pojavitev = 360
razdelek
§uporaba oznake

ime elementa = bibl pojavitev = 355
bibliografska enota
§uporaba oznake

ime elementa = title pojavitev = 355
naslov
§uporaba oznake

ime elementa = publisher pojavitev = 350
izdajatelj
§uporaba oznake

ime elementa = date pojavitev = 345
datum
§uporaba oznake

ime elementa = p pojavitev = 3899
odstavek
§uporaba oznake

ime elementa = s pojavitev = 11460
povedna enota
§uporaba oznake

ime elementa = name pojavitev = 10123
ime
§uporaba oznake

ime elementa = c pojavitev = 256777
znak
§uporaba oznake

ime elementa = w pojavitev = 259501
beseda
§uporaba oznake

ime elementa = pc pojavitev = 41165
ločilo
§listPrefixDef
§prefixDef

identifikator = mte

Zasebni naslovi URI s to predpono kažejo na elemente fs, ki definirajo slovenske oblikoskladenjske oznake MULTEXT-East različica 6.

§podatki o aplikaciji

Oblikoskladenjsko označevanje in lematizacija s programom ReLDI Tagger, izšolanimi za slovenščino in dostopnim na https://github.com/clarinsi/reldi-tagger.

Označevanje imenskih entitet s programom Janes NER, izšolanimi za slovenščino in dostopnim na https://github.com/clarinsi/janes-ner.

§aplikacija

identifikator = reldi-tagger
§napis ReLDI tagger
§aplikacija

identifikator = janes-ner
§napis NER system for South Slavic languages
§načela klasifikacije
§taksonomija
§opis

Vrste besedil
§kategorija

identifikator = report
opis

poročilo
§kategorija

identifikator = comment
opis

komentar
§kategorija

identifikator = letter
opis

pismo
§opis značilnosti besedila
§uporaba jezikov
§jezik

identifikator = sl
slovenski
§jezik

identifikator = en
angleški
§opis sprememb

§sprememba

kdaj = 2019-09-29
Tomaž Erjavec<ime>: Manjši popravki, jezikoslovna obdelava.
§sprememba

kdaj = 2019-05-15
Tomaž Erjavec<ime>: Pretvorba v TEI P5.
§sprememba

kdaj = 1997-07-03
Tomaž Erjavec<ime>: Normaliziral narekovaje, deljene besede, pretvoril originalni digitalni zapis v format TEIlite.


Datum: 2019-09-29

Avtorske pravice za besedilo te izdaje določa licenca Creative Commons Priznanje avtorstva 4.0.