SUSS

kolofon TEI

§opis datoteke
§navedba naslova
§naslov

tip = main
Arhiv vprašanj in odgovorov o slovenskem jeziku ŠUSS (1998-2010) - jezikoslovno označena različica
§avtor Franc Lanko Marušič
§avtor Tatjana Marvin
§avtor Tina Potrato
§avtor Amanda Saksida
§avtor Petra Tomažin
§avtor Tina Verovnik
§avtor Rok Žaucer
§avtor Jaka Železnikar
§avtor Barbara Benčina
§avtor Ivana Vekjet
§avtor Irena Jejčič
§avtor Petra Mišmaš
§avtor Neva Marc
§avtor Ivana Leban
§avtor Elena Kobal
§avtor Amra Halilović
§avtor Sara Krošelj
§avtor Elbasana Gaši
§avtor Urša Papler
§avtor Marina Koglot
§avtor Mateja Žnidarčič
§avtor Sara Bajc
§avtor Karmen Brus
§avtor Sara Adamlje
§avtor Špela Šušanj
§avtor Ana Vodopivec
§navedba odgovornosti
§ime Tomaž Erjavec
§odgovornost

Pretvorba v TEI P5.
§odgovornost

Jezikoslovno označevanje.
§navedba izdaje
§izdaja V1.0
§obseg
§mera

enota = texts
518 prispevkov
§mera

enota = besede
280.778 besed
§navedba objave
§distributer CLARIN.SI
§kraj objave http://hdl.handle.net/11356/1242
§datum 2019-09-14
§dostopnost
§anonimni blok

To delo je licencirano z Creative Commons Attribution 4.0 licence.
§anonimni blok

This work is licenced under the Creative Commons Attribution 4.0 licence.
§opis vira

Izvorne datoteke HTML z ŠUSS: Odgovori na jezikovna vprašanja

§opis označevanja
§uredniška načela
§korekcijska vodila

Oznake v izvornih datotekah XHTML so bile ročno popravljene, da datoteke validirajo in so bolj konsistentne.

§navedba

Navednice in hi[@class="lezece"] so bile pretvorjene v elemete q, pri čemer imajo slednje @rend="italic".

§segmentacija

Besedila so razdeljena v razdelke div[@type="article"], ki ustrezajo eni datoteki XHTML izvirnika. Vsak od teh vsebuje naslov (element head), opcijski podpis (element byline), seznam ključnih besed (element list[@type="keywords"]), in niz podrejenih razdelkov. Prvi tak razdelek je vprašanje (element div[@type="question"]), drugi odgovor (div[@type="answer"]), temu pa lahko sledi serija komentarjev, ki jih je napisala oseba, ki je postavla vprašanje (element div[@type="comment"]) in nadaljnih odgovorov (div[@type="answer"]). Razdelki nato vsebujejo odstavke, sezname and tabele. V tej različici korpusa so ti elementi nadalje segmentirani v stavke, ti pa v besede, ločila and presledke.

§listPrefixDef
§prefixDef

identifikator = mte

Zasebni naslovi URI s to predpono kažejo na element fs, ki definirajo slovenske oblikoskladenjske oznake JOS.

§podatki o aplikaciji

Oblikoskladenjsko označevanje in lematizacija s programom ReLDI Tagger, izšolanimi za slovenščino in dostopnim na https://github.com/clarinsi/reldi-tagger.

§aplikacija

identifikator = reldi-tagger
§napis ReLDI tagger
§načela označevanja
§imenski prostor

ime = http://www.tei-c.org/ns/1.0
§uporaba oznake

ime elementa = div pojavitev = 1847
razdelek
§uporaba oznake

ime elementa = head pojavitev = 518
naslov
§uporaba oznake

ime elementa = byline pojavitev = 142
vrstica avtorstva
§uporaba oznake

ime elementa = milestone pojavitev = 29
mejnik
§uporaba oznake

ime elementa = p pojavitev = 4844
odstavek
§uporaba oznake

ime elementa = list pojavitev = 589
seznam
§uporaba oznake

ime elementa = item pojavitev = 3442
postavka
§uporaba oznake

ime elementa = table pojavitev = 24
tabela
§uporaba oznake

ime elementa = row pojavitev = 214
vrstica
§uporaba oznake

ime elementa = cell pojavitev = 574
celica
§uporaba oznake

ime elementa = s pojavitev = 13677
povedna enota
§uporaba oznake

ime elementa = w pojavitev = 279218
beseda
§uporaba oznake

ime elementa = pc pojavitev = 86153
ločilo
§uporaba oznake

ime elementa = c pojavitev = 275667
znak


Datum: 2019-09-14

Avtorske pravice za besedilo te izdaje določa licenca Creative Commons Priznanje avtorstva 4.0.