kolofon TEI

§opis datoteke
§navedba naslova
§naslov Marija Grginič. Porajajoča se pismenost. (2005) [Gigafida]
§navedba izdaje
§izdaja 2.0
§obseg
§mera
enota = besede količina = 56242
56.242 besed
§navedba objave
§založba
Univerza v Ljubljani, Center za jezikovne vire in tehnologije
§identifikacijska številka
tip = GIGAFIDA
GF8820131
§identifikacijska številka
tip = FIDA
F0013588
§identifikacijska številka
tip = COBISS
https://plus.cobiss.si/opac7/bib/222697728
§dostopnost

Avtorske pravice za to izdajo urejata Pogodba o zbiranju in uporabi besedilnega korpusa v okviru projekta Sporazumevanje v slovenskem jeziku, dostopna na URL www.slovenscina.eu/korpusi/pogodba/, in Pogodba o zbiranju in uporabi besedilnega korpusa v okviru projekta Nadgradnja korpusov Gigafida, Kres, ccGigafida in ccKres, dostopna na www.cjvt.si/gigafida/publikacije/pogodba.

§datum 2018-12-27
§opis vira
§bibliografska enota
§naslov Porajajoča se pismenost
§avtor Marija Grginič
§datum 2005
§založba
Izolit
§opomba
tip = sourceLang
sl
§opomba

1. ID=222697728 M V6 13.10.2005 NUK::VESNA_M

Updated: 15.12.2005 PEFLJ::VANDA Copied: 15.12.2005 PEFLJ::VANDA

001 ac - popravljen zapis ba - tekstovno gradivo, tiskano cm -

monografska publikacija d0 - ni hierarhičnega odnosa g2 - podnivo 2

(zapis CIP) t2.01 - Znanstvena monografija

010 a961-6279-91-2

100 bd - monografska publikacija, zaključena ob izidu ali v enem

koledarskem letu c2005 ek - odrasli, zahtevno (neleposlovje) hslv

- slovenski

1010 aslv - slovenski deng - angleški

102 asvn - Slovenija

105 br2 - znanstveno delo e1 - publikacija ima kazalo

2000 aPorajajoča se pismenost fMarija Grginič

210 aDomžale cIzolit d2005

215 a163 str. d24 cm

2251 a#Zbirka #Zrenja fIzolit

320 aBibliografija

320 aAbstract

320 aKazalo

6061 aPredšolski otroci xPismenost 2NUK

675 a37.014.22 c37.014 - Izobraževalna politika s37 vdo 4. izd. b37

700 13314211 aGrginič bMarija 723554 4070 - avtor 83-117 - Univerza

v Ljubljani, Pedagoška fakulteta

7020133793507 aKranjc bSimona 713060 f1968- 4901 - pisec recenzij

83-114.16 - Univerza v Ljubljani, Filozofska fakulteta, Oddelek za

slovanske jezike in književnosti

7020132690915 aPečjak bSonja 706835 4901 - pisec recenzij 4901 -

pisec recenzij 83-114.13 - Univerza v Ljubljani, Filozofska

fakulteta, Oddelek za psihologijo

7020133687267 aSaksida bIgor 712453 4901 - pisec recenzij 4080 -

avtor dodatnega besedila 83-117 - Univerza v Ljubljani, Pedagoška

fakulteta

70201317626467 aMaltarić bBojana 4926 - lektor 83-114.16 - Univerza

v Ljubljani, Filozofska fakulteta, Oddelek za slovanske jezike in

književnosti

9020132690915 5z aPecjak bSonja

9020132690915 aPejak bSonja

9020033687267 aIS

9020133687267 aSak. bI. 5z

90201317626467 5z 9slv aMaltarič bBojana

90201317626467 5z aMaltarić bBarbara

§opis označevanja
§opis projekta

Projekt "Nadgradnja korpusov Gigafida, Kres, ccGigafida in ccKres".

§opis projekta

Projekt "Sporazumevanje v slovenskem jeziku".

§uredniška načela
§interpretacija

Odstavki imajo pripisano avtomatsko oceno ali so bližnji duplikati katerega od ostalih odstavkov v korpusu ali ne.

Besedila in odstavki imajo pripisano avtomatsko določeno stopnjo tehnične in jezikovne standardnosti.

Besedne oblike imajo pripisano avtomatsko določeno lemo in oblikoskladenjsko oznako.

§standardne vrednosti

@xml:lang vsebuje ISO 639 dvo- ali tročrkovno kodo jezika.

catRef/@target poda zvrst besedila po taksonomiji, ki je določena v kolofonu korpusa. Formalna razvezava prefiksa vrednosti se ravno tako nahaja v kolofonu korpusa.

p/fs/f[@name='neardup'] določa ali je odstavek bližnji duplikat (vrednost 'dup') nekega drugega odstavka ali ne (vrednost 'nodup'). Če je več kot 95 % odstavkov nekega besedila bližnjih duplikatov, je besedilo označeno kot duplikat (torej text/fs/f[@name='neardup'] = 'dup') sicer pa kot 'nodup'.

p/fs/f[@name='std_tech_n'] poda tehnično, p/fs/f[@name='std_ling_n'] pa jezikovno standardnost odstavka. Tehnična standardnost zadeva uporabo presledkov in ločil, medtem ko jezikovna standardnost zadeva uporabo nestandardne ortografije. Vrednosti se gibljeta med 1.0 (popolnoma standardno) in 3.0 (povsem nestandardno). Tudi besedila so označena s svojo standardnosti (torej text/fs/f[@name='std_techl_n'] in p/fs/f[@name='std_ling_n']), ki je povprečje standardnosti njihovih odstavkov.

Oblikoskladenjske oznake sledijo oblikoskladenjskim specifikacijam MULTEXT-East različica 6 za slovenski jezik, cf. http://nl.ijs.si/ME/V6/msd/ in https://github.com/clarinsi/mte-msd. Formalna razvezava prefiksa vrednosti se nahaja v kolofonu korpusa.

§načela označevanja
§imenski prostor
ime = http://www.tei-c.org/ns/1.0
§uporaba oznake
ime elementa = p pojavitev = 1329
odstavek
§uporaba oznake
ime elementa = s pojavitev = 3384
povedna enota
§uporaba oznake
ime elementa = pc pojavitev = 13811
ločilo
§uporaba oznake
ime elementa = w pojavitev = 56242
beseda
§uporaba oznake
ime elementa = c pojavitev = 55083
znak
§podatki o aplikaciji
§aplikacija
identifikator = Onion
§opis
Onion deduplicator z dolžino n-gramov 9 in mejo vsebine duplikatov 0.5 je bil uporabljen za označevanje nivoja bližnjih duplikatov odstavkov.
§aplikacija
identifikator = janes-standardictor
§opis
janes-standardictor je bil uporabljem za določanje tehnične in jezikovne ravni standardnosti odstavkov.
§aplikacija
identifikator = MetaTagger
§opis
MetaTagger je bil uporabljen, da določi katero oblikoskladenjsko oznako in lemo pripisati pojavnicam v besedilu, pri čemer je kot vhod dobil oznaki in lemi označevalnikov Obeliks in ReLDI.
§aplikacija
identifikator = Amebis_pretvornik
§napis [ZDRUZEVANJE] 1:1
§napis [IME] D:\FIDAPLUS\KORPUS\VNOS\2_ZDR\PORAJAC.ZDR
§napis [1] **********
§napis [IZVOR] D:\FidaPLUS\korpus\Vhod\ZALOZBE\Izolit\PORAJAC.doc
§napis [DATUM] 19.7.2006
§napis [IZVOR_RTF] D:\FidaPLUS\korpus\Vhod\ZALOZBE\Izolit\PORAJAC.rtf
§napis [PRETVORBA] RTF
§napis [KONEC] **********
§opis značilnosti besedila
§klasifikacija besedila
§sklic na kategorijo
cilj = ssj:SSJ.T.K.S
§sklic na kategorijo
cilj = dedup:nodup
§klasifikacijska koda
shema = https://github.com/clarinsi/janes-standardictor
1.52 1.32
§opis sprememb
§sprememba
kdaj = 2018-12-27
Tomaž Erjavec<ime>: Naredil korpus v formatu TEI.