goo300k

Dept. of Knowledge Technologies, JSI

kolofon TEI

§opis datoteke
§navedba naslova
§naslov

Referenčni korpus starejše slovenščine goo300k
§nosilec raziskave
§ime Tomaž Erjavec
§naslov

Odsek za tehnologije znanja

Institut "Jožef Stefan"

Jamova cesta 39

1000 Ljubljana

§navedba odgovornosti
§ime Maja Žorga Dulmin
§odgovornost

Vodenje jezikoslovnega označevanja.
§navedba odgovornosti
§ime Darja Fišer
§odgovornost

Jezikoslovno označevanje, priprava pripomočkov za označevalce.
§navedba odgovornosti
§ime Tina Benčina
§ime Katja Cingerle
§ime Metod Čepar (ZRC SAZU)
§ime Alenka Jelovšek (ZRC SAZU)
§ime Urška Kamenšek
§ime Nina Mikulin
§ime Zala Šmid
§odgovornost

Jezikoslovno označevanje.
§navedba odgovornosti
§ime

Erich Prunč (Univerza Karla Franca v Gradcu)
§odgovornost

Vodja projekta za digitalno knjižnico AHLib (besedila s signaturo "FPG").
§navedba odgovornosti
§ime Alenka Kavčič Čolić (NUK)
§odgovornost

Vodja projekta EU IMPACT na NUK.
§navedba odgovornosti
§ime Ines Vodopivec, Maša Kodrič, Daša Pokorn (NUK)
§odgovornost

Korekcije OCR, prelom v PAGE XML (besedila s signaturo "NUK" in "FPGN").
§navedba odgovornosti
§ime Miran Hladnik (FF UNI LJ)
§odgovornost

Vodja projekta "Slovenska leposlovna klasika" na Wikiviru (besedila s signaturo "WIKI").
§navedba odgovornosti
§ime Domen Kermc
§odgovornost

Vodja korekcije prepisov in pretvorba zapisa Wiki v TEI (besedila s signaturo "WIKI").
§navedba odgovornosti
§ime Matija Ogrin (ZRC SAZU)
§odgovornost

Vodja projekta Google Award na ZRC SAZU.
§navedba odgovornosti
§ime Kozma Ahačič (ZRC SAZU)
§odgovornost

Odgovorna oseba za korekcije OCR in označevanje pri ZRC SAZU.
§navedba odgovornosti
§ime Metod Čepar, Alenka Jelovšek (ZRC SAZU)
§odgovornost

Korekcije OCR (besedila s signaturo "ZRC").
§navedba izdaje
§izdaja 1.0
§obseg 1100 strani<termin>, 293919
§termin

besed
§navedba objave
§distributer
§naslov

Odsek za tehnologije znanja

Institut "Jožef Stefan"

Jamova cesta 39

1000 Ljubljana

§kraj objave http://nl.ijs.si/imp
§dostopnost

Avtorske pravice za to izdajo ureja licenca Creative Commons Priznanje avtorstva 3.0.

Dovoljeno vam je tako rekoč vse, pod naslednjimi pogoji:

  • Priznanje avtorstva. Pri uporabi dela morate navesti izvirne avtorje digitalnega vira, v znanstvenih publikacijah pa citirati ustrezno publikacijo, ki opisuje delo na digitalnem viru. Seznam publikacij je dostopen na strani http://nl.ijs.si/imp.

§datum 2014-01-10
§opis vira
§seznam bibliografskih enot
§bibliografska enota

ustreza = goo168-ZRC_00001-1584
naslov

tip = reg
Biblija (vzorec)
avtor Dalmatin, Jurij
datum 1584
§bibliografska enota

ustreza = goo168-ZRC_00002-1695
naslov

tip = reg
Sveti priročnik (vzorec)
avtor Janez Svetokriški
datum 1695
§bibliografska enota

ustreza = goo18B-NUK_13105-1768
naslov

tip = reg
Mali katekizem
avtor Canisius, Petrus; Parhamer, Ignaz; Pohlin, Marko
datum 1768
§bibliografska enota

ustreza = goo18B-NUK_13130-1769
naslov

tip = reg
Marianske Kempensar
avtor Sailer, Sebastian; Pohlin, Marko
datum 1769
§bibliografska enota

ustreza = goo18B-NUK_10187-1777
naslov

tip = reg
Branja in evangeliji
avtor Pohlin, Marko
datum 1777
§bibliografska enota

ustreza = goo168-ZRC_00003-1784
naslov

tip = reg
Sveto pismo nove zaveze (vzorec)
avtor Japelj, Jurij
datum 1784
§bibliografska enota

ustreza = goo18B-NUK_13067-1789
naslov

tip = reg
Večna pratika od gospodarstva
avtor Breznik, Anton
datum 1789
§bibliografska enota

ustreza = goo18B-NUKR10214-1790
naslov

tip = reg
Županova Micka in Ta veseli dan ali Matiček se ženi
avtor Linhart, Anton Tomaž
datum 1790
§bibliografska enota

ustreza = goo18B-NUK_10224-1794
naslov

tip = reg
Pridige za vse nedelje v letu
avtor Japelj, Jurij
datum 1794
§bibliografska enota

ustreza = goo18B-NUKR10221-1799
naslov

tip = reg
Kuharske bukve
avtor Vodnik, Valentin
datum 1799
§bibliografska enota

ustreza = ioo19A-NUK_10029-1800
naslov

tip = reg
Kolemonov žegen
datum 1800
§bibliografska enota

ustreza = ioo19A-NUK_07541-1810
naslov

tip = reg
Praemium za male otročičke
avtor Alvian, Fecit Franciscus
datum 1810
§bibliografska enota

ustreza = goo19A-NUK_10220-1811
naslov

tip = reg
Začetki francoske gramatike
avtor Lhomond, Charles Francois; Vodnik, Valentin
datum 1811
§bibliografska enota

ustreza = goo19A-FPGN04488-1830
naslov

tip = reg
Zgodbe Svetega pisma za mlade ljudi
avtor Schmid, Christoph von
datum 1830
§bibliografska enota

ustreza = goo19A-FPGN04554-1836
naslov

tip = reg
Sedem novih pripovedi za otroke
avtor Schmid, Christoph von
datum 1836
§bibliografska enota

ustreza = goo19A-FPGN04557-1841
naslov

tip = reg
Genovefa
avtor Schmid, Christoph von
datum 1841
§bibliografska enota

ustreza = goo19A-NUKP14041-1843
naslov

tip = reg
Kmetijske in rokodelske novice
datum 1843
§bibliografska enota

ustreza = goo19A-NUKP14041-1844
naslov

tip = reg
Kmetijske in rokodelske novice
datum 1844
§bibliografska enota

ustreza = ioo19A-NUKP14041-1845
naslov

tip = orig
Kmetijske in rokodelske novice
naslov

tip = reg
Kmetijske in rokodelske novice
datum 1845
§bibliografska enota

ustreza = ioo19A-NUKP14041-1846
naslov

tip = orig
Kmetijske in rokodelske novice
naslov

tip = reg
Kmetijske in rokodelske novice
datum 1846
§bibliografska enota

ustreza = goo19A-FPG_00008-1847
naslov

tip = orig
Čujte, čujte, kaj žganje dela!
naslov

tip = reg
Čujte, čujte, kaj žganje dela
avtor Zschokke, Heinrich
datum 1847
§bibliografska enota

ustreza = ioo19A-NUKP14041-1847
naslov

tip = orig
Kmetijske in rokodelske novice
naslov

tip = reg
Kmetijske in rokodelske novice
datum 1847
§bibliografska enota

ustreza = goo19A-FPG_00009-1848
naslov

tip = orig
Zlata Vas
naslov

tip = reg
Zlata Vas
avtor Zschokke, Heinrich
datum 1848
§bibliografska enota

ustreza = goo19A-FPG_04401-1848
naslov

tip = orig
Divica Orleanska
naslov

tip = reg
Devica Orleanska
avtor Schiller, Friedrich
datum 1848
§bibliografska enota

ustreza = ioo19A-NUKP14041-1848
naslov

tip = orig
Kmetijske in rokodelske novice
naslov

tip = reg
Kmetijske in rokodelske novice
datum 1848
§bibliografska enota

ustreza = ioo19A-FPGN06523-1849
naslov

tip = orig
Robinson mlajši
naslov

tip = reg
Robinson mlajši
avtor Campe, Joachim Heinrich
datum 1849
§bibliografska enota

ustreza = ioo19A-NUKP14041-1849
naslov

tip = orig
Novice kmetijskih, rokodelnih in narodskih reči
naslov

tip = reg
Novice kmetijskih, rokodelskih in narodnih stvari
datum 1849
§bibliografska enota

ustreza = goo19B-FPG_00012-1850
naslov

tip = orig
Nove kuharske bukve ali nauk, nar boljši in nar imenitnejši jedila brez posebnih stroškov perpraviti
naslov

tip = reg
Nove kuharske bukve
avtor N.N.
datum 1850
§bibliografska enota

ustreza = goo19B-FPG_04260-1850
naslov

tip = orig
Zlata Vas
naslov

tip = reg
Zlata Vas
avtor Zschokke, Heinrich
datum 1850
§bibliografska enota

ustreza = goo19B-FPGN00016-1850
naslov

tip = orig
Gosp. Krištofa Šmida korarja avgustanskiga, zgodbe S. Pisma za mlade ljudi
naslov

tip = reg
Zgodbe Svetega pisma za mlade ljudi
avtor Schmid, Christoph von
datum 1850
§bibliografska enota

ustreza = goo19B-FPG_00017-1851
naslov

tip = orig
Hirlanda bretanjska vojvodnja ali zmaga čednosti in nedolžnosti
naslov

tip = reg
Hirlanda, bretanska vojvodinja
avtor Schmid, Christoph von
datum 1851
§bibliografska enota

ustreza = goo19B-NUKP14041-1851
naslov

tip = orig
Novice kmetijskih, rokodelnih in narodskih reči
naslov

tip = reg
Novice kmetijskih, rokodelskih in narodnih stvari
datum 1851
§bibliografska enota

ustreza = goo19B-FPG_00018-1852
naslov

tip = orig
Tine in Jerica
naslov

tip = reg
Tine in Jerica
avtor Jais, Aegidius
datum 1852
§bibliografska enota

ustreza = goo19B-FPG_00020-1852
naslov

tip = orig
Peter in Pavl, ali Bóg ubózih sirót najboljši oče
naslov

tip = reg
Peter in Pavl
avtor N.N.
datum 1852
§bibliografska enota

ustreza = goo19B-FPG_00021-1853
naslov

tip = orig
Divji hunci pred mestom Meziborom
naslov

tip = reg
Divji huni pred mestom Mezibor
avtor Wilhelm, J.
datum 1853
§bibliografska enota

ustreza = goo19B-FPG_00026-1853
naslov

tip = orig
Dve povesti iz pisem Kristofa Šmida
naslov

tip = reg
Dve povesti iz pisem Kristofa Šmida
avtor Schmid, Christoph von
datum 1853
§bibliografska enota

ustreza = goo19B-FPGN00023-1853
naslov

tip = orig
Blagomir puščavnik
naslov

tip = reg
Puščavnik Blagomir
avtor Bauberger, Wilhelm
datum 1853
§bibliografska enota

ustreza = goo19B-FPGN04375-1853
naslov

tip = orig
Stric Tomaž ali Živlenje zamorcov v Ameriki
naslov

tip = reg
Stric Tomaž
avtor Beecher-Stowe, Harriet Elisabeth
datum 1853
§bibliografska enota

ustreza = goo19B-FPG_00030-1854
naslov

tip = orig
Oče naš
naslov

tip = reg
Oče naš
avtor Anibas, Georg
datum 1854
§bibliografska enota

ustreza = goo19B-FPG_00031-1854
naslov

tip = orig
Jezus prijatel otrok, ali pustite priti k meni otročiče
naslov

tip = reg
Jezus, prijatelj otrok
avtor Jais, Aegidius
datum 1854
§bibliografska enota

ustreza = goo19B-FPG_00040-1855
naslov

tip = orig
Roza Jelodvorska
naslov

tip = reg
Roza Jelodvorska
avtor Schmid, Christoph von
datum 1855
§bibliografska enota

ustreza = goo19B-NUKP14041-1855
naslov

tip = orig
Novice gospodarskih, obertnijskih in narodskih stvari
naslov

tip = reg
Novice gospodarskih, obrtniških in narodnih stvari
datum 1855
§bibliografska enota

ustreza = goo19B-FPG_00045-1856
naslov

tip = orig
Domače živinozdravstvo v boleznih konj, govedja, ovac, prešičev, koz in psov, ali nauk, kako mora kmetovavec svojo živino rediti, ji streči, jo kermiti in ozdravljati
naslov

tip = reg
Domače živinozdravstvo
avtor Rohlwes, Johann Nikolaus
datum 1856
§bibliografska enota

ustreza = goo19B-NUKP14041-1856
naslov

tip = orig
Novice gospodarskih, obertnijskih in narodskih stvari
naslov

tip = reg
Novice gospodarskih, obrtniških in narodnih stvari
datum 1856
§bibliografska enota

ustreza = goo19B-FPG_00047-1857
naslov

tip = orig
Marija, dobra mati pobožnih otrok
naslov

tip = reg
Marija, dobra mati pobožnih otrok
avtor Donin, Ludwig
datum 1857
§bibliografska enota

ustreza = goo19B-FPG_00049-1857
naslov

tip = reg
Sveta grofinja Genofefa
avtor Schmid, Christoph von
datum 1857
§bibliografska enota

ustreza = goo19B-NUKP14041-1857
naslov

tip = orig
Novice gospodarskih, obertnijskih in narodskih stvari
naslov

tip = reg
Novice gospodarskih, obrtniških in narodnih stvari
datum 1857
§bibliografska enota

ustreza = goo19B-FPG_00061-1861
naslov

tip = orig
Maria Stuart
naslov

tip = reg
Maria Stuart
avtor Schiller, Friedrich
datum 1861
§bibliografska enota

ustreza = goo19B-FPG_00063-1862
naslov

tip = orig
Viljem Tell
naslov

tip = reg
Viljem Tell
avtor Schiller, Friedrich
datum 1862
§bibliografska enota

ustreza = goo19B-FPG_00066-1863
naslov

tip = orig
Kitica Andersenovih pravljic
naslov

tip = reg
Kitica Andersenovih pravljic
avtor Andersen, Hans Christian
datum 1863
§bibliografska enota

ustreza = goo19B-FPG_00070-1864
naslov

tip = orig
Čas je zlato
naslov

tip = reg
Čas je zlato
avtor Hoffmann, Franz
datum 1864
§bibliografska enota

ustreza = goo19B-FPG_00082-1866
naslov

tip = orig
Valenštajn
naslov

tip = reg
Valenštajn
avtor Schiller, Friedrich
datum 1866
§bibliografska enota

ustreza = goo19B-FPGN00080-1866
naslov

tip = orig
Nemški Pavliha v slovenski obleki
naslov

tip = reg
Nemški Pavliha v slovenski obleki
avtor N.N.
datum 1866
§bibliografska enota

ustreza = goo19B-FPGN00084-1866
naslov

tip = orig
Sveti večer
naslov

tip = reg
Sveti večer
avtor Schmid, Christoph von
datum 1866
§bibliografska enota

ustreza = goo19B-FPG_00086-1867
naslov

tip = orig
Mlinar in njegova hči
naslov

tip = reg
Mlinar in njegova hči
avtor Raupach, Ernst
datum 1867
§bibliografska enota

ustreza = goo19B-FPG_06328-1867
naslov

tip = orig
Ultra!
naslov

tip = reg
Ultra
avtor Schamberger, František Ferdinand
datum 1867
§bibliografska enota

ustreza = goo19B-FPGN00085-1867
naslov

tip = orig
Rudninoslovje ali mineralogija za niže gimnazije in realke
naslov

tip = reg
Rudninoslovje
avtor Fellöcker, Sigmund
datum 1867
§bibliografska enota

ustreza = goo19B-FPGN00088-1867
naslov

tip = orig
Fabiola ali cerkev v katakombah
naslov

tip = reg
Fabiola ali cerkev v katakombah
avtor Wiseman, Nicholas Patrick Stephen
datum 1867
§bibliografska enota

ustreza = goo19B-FPG_00093-1869
naslov

tip = orig
Astronomija
naslov

tip = reg
Astronomija
avtor Schödler, Friedrich Karl Ludwig
datum 1869
§bibliografska enota

ustreza = goo19B-FPG_00094-1869
naslov

tip = orig
Kemija
naslov

tip = reg
Kemija
avtor Schödler, Friedrich Karl Ludwig
datum 1869
§bibliografska enota

ustreza = goo19B-FPG_00095-1869
naslov

tip = orig
Fizika
naslov

tip = reg
Fizika
avtor Schödler, Friedrich Karl Ludwig
datum 1869
§bibliografska enota

ustreza = goo19B-FPG_00106-1871
naslov

tip = orig
Mineralogija in geognozija
naslov

tip = reg
Mineralogija in geognozija
avtor Schödler, Friedrich Karl Ludwig
datum 1871
§bibliografska enota

ustreza = goo19B-FPG_00110-1872
naslov

tip = orig
Krištofa Šmida sto malih pripovedek za mladost
naslov

tip = reg
Krištofa Šmida sto malih pripovedek za mladost
avtor Schmid, Christoph von
datum 1872
§bibliografska enota

ustreza = goo19B-FPG_00125-1875
naslov

tip = orig
Botanika
naslov

tip = reg
Botanika
avtor Schödler, Friedrich Karl Ludwig
datum 1875
§bibliografska enota

ustreza = goo19B-FPG_00128-1875
naslov

tip = orig
Stelja in gnoj
naslov

tip = reg
Stelja in gnoj
avtor Trientl, Adolf
datum 1875
§bibliografska enota

ustreza = goo19B-FPG_04640-1875
naslov

tip = orig
Zoologija
naslov

tip = reg
Zoologija
avtor Schödler, Friedrich Karl Ludwig
datum 1875
§bibliografska enota

ustreza = goo19B-FPG_00155-1880
naslov

tip = orig
Ljudevit Hrastar. Golobček
naslov

tip = reg
Ljudevit Hrastar. Golobček
avtor Schmid, Christoph von
datum 1880
§bibliografska enota

ustreza = goo19B-FPG_02738-1881
naslov

tip = orig
Répoštev, duh v Kerkonoških goráh
naslov

tip = reg
Duh Repoštev
avtor Musäus, Johann Karl August
datum 1881
§bibliografska enota

ustreza = goo19B-FPG_04299-1883
naslov

tip = orig
Spisi Krištofa Šmida
naslov

tip = reg
Spisi Krištofa Šmida
avtor Schmid, Christoph von
datum 1883
§bibliografska enota

ustreza = goo19B-FPG_07725-1883
naslov

tip = orig
Deborah
naslov

tip = reg
Deborah
avtor Mosenthal, Salomon Hermann
datum 1883
§bibliografska enota

ustreza = goo19B-FPG_00188-1884
naslov

tip = orig
Ferdinand
naslov

tip = reg
Ferdinand
avtor Schmid, Christoph von
datum 1884
§bibliografska enota

ustreza = goo19B-FPG_00192-1885
naslov

tip = orig
Oče naš
naslov

tip = reg
Oče naš [drugi pregledani natis]
avtor Anibas, Georg
datum 1885
§bibliografska enota

ustreza = goo19B-FPG_00195-1885
naslov

tip = orig
Aritmetika za učiteljišča
naslov

tip = reg
Aritmetika za učiteljišča
avtor Močnik, Franc
datum 1885
§bibliografska enota

ustreza = goo19B-FPG_00202-1886
naslov

tip = orig
Andrej Hofer, junaški vodja Tirolcev leta 1809
naslov

tip = reg
Andrej Hofer, junaški vodja Tirolcev
avtor Seeberg, A.
datum 1886
§bibliografska enota

ustreza = goo19B-FPG_00203-1886
naslov

tip = orig
Zlatorog
naslov

tip = reg
Zlatorog
avtor Baumbach, Rudolf
datum 1886
§bibliografska enota

ustreza = goo19B-FPG_05783-1886
naslov

tip = orig
Kakeršno delo, takšno plačilo
naslov

tip = reg
Kakršno delo, takšno plačilo
avtor Kümmel, Max
datum 1886
§bibliografska enota

ustreza = goo19B-FPG_00211-1887
naslov

tip = orig
Izidor, pobožni kmet
naslov

tip = reg
Izidor, pobožni kmet
avtor Huber, Josef
datum 1887
§bibliografska enota

ustreza = goo19B-FPG_00212-1887
naslov

tip = orig
Pripovedke za mladino
naslov

tip = reg
Pripovedke za mladino
avtor Grimm, Jakob in Wilhelm
datum 1887
§bibliografska enota

ustreza = goo19B-FPG_00214-1887
naslov

tip = orig
Občno vzgojeslovje
naslov

tip = reg
Občno vzgojeslovje
avtor Mich, Josef
datum 1887
§bibliografska enota

ustreza = goo19B-FPG_00234-1891
naslov

tip = orig
Tiun-Lin
naslov

tip = reg
Tiun-Lin
avtor Marquardt, Paul
datum 1891
§bibliografska enota

ustreza = goo19B-FPG_00235-1891
naslov

tip = orig
Iz biologičnega trtorejskega poskušališča od Hermana Goethe-ja v Badenu pri Dunaju
naslov

tip = reg
Iz biologičnega trtorejskega poskušališča
avtor Goethe, Hermann
datum 1891
§bibliografska enota

ustreza = goo19B-FPG_00237-1891
naslov

tip = orig
Revček Andrejček
naslov

tip = reg
Revček Andrejček
avtor Morre, Carl
datum 1891
§bibliografska enota

ustreza = goo19B-FPG_00261-1896
naslov

tip = orig
Zeleni listi
naslov

tip = reg
Zeleni listi
avtor Wiedemann, Franz
datum 1896
§bibliografska enota

ustreza = goo19B-FPG_00265-1897
naslov

tip = orig
Katoliški molitvenik za bolnike v desetih jezikih za uporabo dušnim pastirjem zlasti v bolnišnicah, kakor tudi vsem prijateljem bolnikov in bolnikom samim
naslov

tip = reg
Katoliški molitvenik za bolnike
avtor Anderl, Adalbert
datum 1897
§bibliografska enota

ustreza = goo19B-FPG_02747-1898
naslov

tip = orig
Lohengrin
naslov

tip = reg
Lohengrin
avtor Wagner, Richard
datum 1898
§bibliografska enota

ustreza = goo19B-FPG_04194-1898
naslov

tip = orig
Gozdovnik. I.
naslov

tip = reg
Gozdovnik I
avtor May, Karl
datum 1898
§bibliografska enota

ustreza = goo19B-FPG_04233-1898
naslov

tip = orig
Šola v boju proti pijančevanju
naslov

tip = reg
Šola v boju proti pijančevanju
avtor Krauss, Victor von
datum 1898
§bibliografska enota

ustreza = goo19B-FPG_07908-1898
naslov

tip = orig
Gozdovnik. II.
naslov

tip = reg
Gozdovnik II
avtor May, Karl
datum 1898
§bibliografska enota

ustreza = goo19B-FPG_06534-1899
naslov

tip = orig
Ljubíte svoje sovražnike!
naslov

tip = reg
Ljubite svoje sovražnike
avtor Spillmann, Joseph
datum 1899
§opis označevanja
§opis projekta

Raziskovalna nagrada Google ‘Language Models for Historical Slovene’ (2011–2012).

§opis projekta

Projekt EU IMPACT ‘Improving Access to Text’ (2010–2011).

Narodna in univerzitetna knjižnica in Institut "Jožef Stefan": Izdelava referenčnih besedil starejše slovenščine (za signature "NUK" and "FPGN").

§opis projekta

AHLib Avstrijska akademija znanosti, Institut "Jožef Stefan": izbira knjig, zagotovitev skenogramov (za signature "FPG").

§načela vzorčenja

Korpus je bil vzorčen v dveh korakih. Najprej so bila izbrana celotna besedila iz zbirke knjig in časopisov, ki je bila na voljo. V drugem koraku so bile naključno (vendar v okviru določenih mejnih vrednosti) vzorčene posamezne strani iz te zbirke, dokler ni bilo zbranih 1100 strani.

§uredniška načela
§korekcijska vodila

Transkripcije so bile ročno popravljene, da so ustrezne faksimilu. Napake v izvirniku niso bile popravljene, so pa označene z oznako "Xt".

§navedba

Navednice so del besedila, besedilo znotraj navednic ni posebej označeno.

§segmentacija

Besedila so razdeljena v "anonimne bloke", ki so tipizirani v odstavke, naslove, postavke seznama, itd. Ti bloki so nato (avtomatsko) segmentirani na stavke, ti pa na besede, ločila in presledke.

§interpretacija

Jezikoslovne oznake besed vsebujejo normalizirano obliko besede (male črke in brez naglasnih znamenj na samoglasnikih), posodobljeno obliko besede, posodobljeno lemo in "grobo" oblikoslovno oznako. Zastarele besede imajo pripisane tudi najbližje sodobne ustreznice in vir teh ustreznic. Anotacije so bile pripisane najprej avtomatsko, nato pa ročno pregledane in popravljene.

§standardne vrednosti

Dvočrkovne kode jezikov sledijo ISO 639 in so definirane v elementu uporabe jezikov. Izjema je koda IANA "sl-bohoric", ki označuje besedila napisana v bohoričici.

"Grobe" oblikoslovne oznake sledijo priporočilom za oblikoskladenjsko označevanje IMP, c.f. http://nl.ijs.si/imp/msd

§načela označevanja
§imenski prostor

ime = http://www.tei-c.org/ns/1.0
§uporaba oznake

ime elementa = facsimile pojavitev = 89
faksimile
§uporaba oznake

ime elementa = surface pojavitev = 1100
površina
§uporaba oznake

ime elementa = graphic pojavitev = 4400
slikovno gradivo
§uporaba oznake

ime elementa = text pojavitev = 89
besedilo
§uporaba oznake

ime elementa = body pojavitev = 89
telo besedila
§uporaba oznake

ime elementa = div pojavitev = 1100
razdelek
opis

Vsak razdelek predstavlja eno stran.
§uporaba oznake

ime elementa = lb pojavitev = 21124
prelom vrstice
§uporaba oznake

ime elementa = ab pojavitev = 8397
anonimni blok
§uporaba oznake

ime elementa = gap pojavitev = 586
vrzel
§uporaba oznake

ime elementa = s pojavitev = 22065
povedna enota
§uporaba oznake

ime elementa = w pojavitev = 402650
beseda
opis

Jezikoslovno označena besedna pojavnica. Atributi so @lemma (osnovna oblika) in @ana (oblikoskladenjska oznaka IMP).
§uporaba oznake

ime elementa = pc pojavitev = 64867
ločilo
§uporaba oznake

ime elementa = c pojavitev = 295145
znak
opis

Element vsebuje samo znak za presledek in označuje (ne)stičnost besed oz. ločil.
§uporaba oznake

ime elementa = choice pojavitev = 106998
izbira
opis

Označuje izbiro med izvorno in posodobljeno obliko besede.
§uporaba oznake

ime elementa = orig pojavitev = 106998
izvorna oblika
opis

Izvorna oblika besede.
§uporaba oznake

ime elementa = reg pojavitev = 106998
regularizirano
opis

Posodobljena oblika besede.
§uporaba oznake

ime elementa = desc pojavitev = 9178
opis
opis

Za posamezno stran faksimila poda kratek opis, za zastarele besede pa razlago besede in vir te razlage.
§uporaba oznake

ime elementa = gloss pojavitev = 8078
razlaga
opis

Razlaga zastarele besede.
§uporaba oznake

ime elementa = bibl pojavitev = 8078
bibliografska enota
opis

Vir razlage za zastarelo besedo.
§načela klasifikacije
§taksonomija

identifikator = Text.taxonomy
§kategorija

identifikator = Text.medium
opis kategorije
termin

prenosnik
kategorija

identifikator = Text.manuscript
opis kategorije
termin

rokopis
kategorija

identifikator = Text.book
opis kategorije
termin

knjiga
kategorija

identifikator = Text.magazine
opis kategorije
termin

revija
kategorija

identifikator = Text.newspaper
opis kategorije
termin

časopis
§kategorija

identifikator = Text.type
opis kategorije
termin

zvrst besedila
kategorija

identifikator = Text.fiction
opis kategorije
termin

umetnostna
kategorija

identifikator = Text.prose
opis kategorije
termin

proza
kategorija

identifikator = Text.drama
opis kategorije
termin

gledališka igra
kategorija

identifikator = Text.poetry
opis kategorije
termin

poezija
kategorija

identifikator = Text.nonfiction
opis kategorije
termin

neumetnostno
kategorija

identifikator = Text.religious
opis kategorije
termin

nabožno
§kategorija

identifikator = Text.status
opis kategorije
termin

izvirnik/prevod
kategorija

identifikator = Text.original
opis kategorije
termin

izvirnik
kategorija

identifikator = Text.translation
opis kategorije
termin

prevod
§načela sistema lastnosti
§knjižnica lastnosti

§lastnost

ime = besedna_vrsta identifikator = S0-sl ustreza = N0-en
simbol

vrednost = samostalnik
§lastnost

ime = vrsta identifikator = S1.o-sl ustreza = N1.c-en
simbol

vrednost = občno_ime
§lastnost

ime = vrsta identifikator = S1.l-sl ustreza = N1.p-en
simbol

vrednost = lastno_ime
§lastnost

ime = spol identifikator = S2.m-sl ustreza = N2.m-en
simbol

vrednost = moški
§lastnost

ime = spol identifikator = S2.z-sl ustreza = N2.f-en
simbol

vrednost = ženski
§lastnost

ime = spol identifikator = S2.s-sl ustreza = N2.n-en
simbol

vrednost = srednji
§lastnost

ime = besedna_vrsta identifikator = G0-sl ustreza = V0-en
simbol

vrednost = glagol
§lastnost

ime = vrsta identifikator = G1.g-sl ustreza = V1.m-en
simbol

vrednost = glavni
§lastnost

ime = vrsta identifikator = G1.p-sl ustreza = V1.a-en
simbol

vrednost = pomožni
§lastnost

ime = vid identifikator = G2.d-sl ustreza = V2.e-en
simbol

vrednost = dovršni
§lastnost

ime = vid identifikator = G2.n-sl ustreza = V2.p-en
simbol

vrednost = nedovršni
§lastnost

ime = vid identifikator = G2.v-sl ustreza = V2.b-en
simbol

vrednost = dvovidski
§lastnost

ime = besedna_vrsta identifikator = P0-sl ustreza = A0-en
simbol

vrednost = pridevnik
§lastnost

ime = vrsta identifikator = P1.p-sl ustreza = A1.g-en
simbol

vrednost = splošni
§lastnost

ime = vrsta identifikator = P1.s-sl ustreza = A1.s-en
simbol

vrednost = svojilni
§lastnost

ime = vrsta identifikator = P1.d-sl ustreza = A1.p-en
simbol

vrednost = deležniški
§lastnost

ime = stopnja identifikator = P2.n-sl ustreza = A2.p-en
simbol

vrednost = nedoločeno
§lastnost

ime = stopnja identifikator = P2.p-sl ustreza = A2.c-en
simbol

vrednost = primernik
§lastnost

ime = stopnja identifikator = P2.s-sl ustreza = A2.s-en
simbol

vrednost = presežnik
§lastnost

ime = besedna_vrsta identifikator = R0-sl ustreza = R0-en
simbol

vrednost = prislov
§lastnost

ime = vrsta identifikator = R1.s-sl ustreza = R1.g-en
simbol

vrednost = splošni
§lastnost

ime = vrsta identifikator = R1.d-sl ustreza = R1.r-en
simbol

vrednost = deležje
§lastnost

ime = stopnja identifikator = R2.n-sl ustreza = R2.p-en
simbol

vrednost = nedoločeno
§lastnost

ime = stopnja identifikator = R2.r-sl ustreza = R2.c-en
simbol

vrednost = primernik
§lastnost

ime = stopnja identifikator = R2.s-sl ustreza = R2.s-en
simbol

vrednost = presežnik
§lastnost

ime = besedna_vrsta identifikator = Z0-sl ustreza = P0-en
simbol

vrednost = zaimek
§lastnost

ime = besedna_vrsta identifikator = K0-sl ustreza = M0-en
simbol

vrednost = števnik
§lastnost

ime = zapis identifikator = K1.a-sl ustreza = M1.d-en
simbol

vrednost = arabski
§lastnost

ime = zapis identifikator = K1.r-sl ustreza = M1.r-en
simbol

vrednost = rimski
§lastnost

ime = zapis identifikator = K1.b-sl ustreza = M1.l-en
simbol

vrednost = besedni
§lastnost

ime = besedna_vrsta identifikator = D0-sl ustreza = S0-en
simbol

vrednost = predlog
§lastnost

ime = besedna_vrsta identifikator = V0-sl ustreza = C0-en
simbol

vrednost = veznik
§lastnost

ime = besedna_vrsta identifikator = L0-sl ustreza = Q0-en
simbol

vrednost = členek
§lastnost

ime = besedna_vrsta identifikator = M0-sl ustreza = I0-en
simbol

vrednost = medmet
§lastnost

ime = besedna_vrsta identifikator = O0-sl ustreza = Y0-en
simbol

vrednost = okrajšava
§lastnost

ime = besedna_vrsta identifikator = N0-sl ustreza = X0-en
simbol

vrednost = neuvrščeno
§lastnost

ime = vrsta identifikator = N1.j-sl ustreza = X1.f-en
simbol

vrednost = tujejezično
§lastnost

ime = vrsta identifikator = N1.t-sl ustreza = X1.t-en
simbol

vrednost = tipkarska
§lastnost

ime = vrsta identifikator = N1.p-sl ustreza = X1.p-en
simbol

vrednost = program
§knjižnica vrednosti lastnosti

§struktura lastnosti

identifikator = Som ustreza = Ncm
besedna_vrsta = samostalnik, vrsta = občno_ime, spol = moški
§struktura lastnosti

identifikator = Soz ustreza = Ncf
besedna_vrsta = samostalnik, vrsta = občno_ime, spol = ženski
§struktura lastnosti

identifikator = Sos ustreza = Ncn
besedna_vrsta = samostalnik, vrsta = občno_ime, spol = srednji
§struktura lastnosti

identifikator = Slm ustreza = Npm
besedna_vrsta = samostalnik, vrsta = lastno_ime, spol = moški
§struktura lastnosti

identifikator = Slz ustreza = Npf
besedna_vrsta = samostalnik, vrsta = lastno_ime, spol = ženski
§struktura lastnosti

identifikator = Sls ustreza = Npn
besedna_vrsta = samostalnik, vrsta = lastno_ime, spol = srednji
§struktura lastnosti

identifikator = Gp ustreza = Va
besedna_vrsta = glagol, vrsta = pomožni
§struktura lastnosti

identifikator = Ggd ustreza = Vme
besedna_vrsta = glagol, vrsta = glavni, vid = dovršni
§struktura lastnosti

identifikator = Ggn ustreza = Vmp
besedna_vrsta = glagol, vrsta = glavni, vid = nedovršni
§struktura lastnosti

identifikator = Ggv ustreza = Vmb
besedna_vrsta = glagol, vrsta = glavni, vid = dvovidski
§struktura lastnosti

identifikator = Ppn ustreza = Agp
besedna_vrsta = pridevnik, vrsta = splošni, stopnja = nedoločeno
§struktura lastnosti

identifikator = Ppp ustreza = Agc
besedna_vrsta = pridevnik, vrsta = splošni, stopnja = primernik
§struktura lastnosti

identifikator = Pps ustreza = Ags
besedna_vrsta = pridevnik, vrsta = splošni, stopnja = presežnik
§struktura lastnosti

identifikator = Pdn ustreza = App
besedna_vrsta = pridevnik, vrsta = deležniški, stopnja = nedoločeno
§struktura lastnosti

identifikator = Psn ustreza = Asp
besedna_vrsta = pridevnik, vrsta = svojilni, stopnja = nedoločeno
§struktura lastnosti

identifikator = Rsn ustreza = Rgp
besedna_vrsta = prislov, vrsta = splošni, stopnja = nedoločeno
§struktura lastnosti

identifikator = Rsr ustreza = Rgc
besedna_vrsta = prislov, vrsta = splošni, stopnja = primernik
§struktura lastnosti

identifikator = Rss ustreza = Rgs
besedna_vrsta = prislov, vrsta = splošni, stopnja = presežnik
§struktura lastnosti

identifikator = Rd ustreza = Rr
besedna_vrsta = prislov, vrsta = deležje
§struktura lastnosti

identifikator = Z ustreza = P
besedna_vrsta = zaimek
§struktura lastnosti

identifikator = Ka ustreza = Md
besedna_vrsta = števnik, zapis = arabski
§struktura lastnosti

identifikator = Kr ustreza = Mr
besedna_vrsta = števnik, zapis = rimski
§struktura lastnosti

identifikator = Kb ustreza = Ml
besedna_vrsta = števnik, zapis = besedni
§struktura lastnosti

identifikator = D ustreza = S
besedna_vrsta = predlog
§struktura lastnosti

identifikator = V ustreza = C
besedna_vrsta = veznik
§struktura lastnosti

identifikator = L ustreza = Q
besedna_vrsta = členek
§struktura lastnosti

identifikator = M ustreza = I
besedna_vrsta = medmet
§struktura lastnosti

identifikator = O ustreza = Y
besedna_vrsta = okrajšava
§struktura lastnosti

identifikator = N ustreza = X
besedna_vrsta = neuvrščeno
§struktura lastnosti

identifikator = Nj ustreza = Xf
besedna_vrsta = neuvrščeno, vrsta = tujejezično
§struktura lastnosti

identifikator = Nt ustreza = Xt
besedna_vrsta = neuvrščeno, vrsta = tipkarska
§struktura lastnosti

identifikator = Np ustreza = Xp
besedna_vrsta = neuvrščeno, vrsta = program
§opis značilnosti besedila
§uporaba jezikov
§jezik

identifikator = sl
§termin

slovenščina
§jezik

identifikator = sl-bohoric
§termin

slovenščina v bohoričici
§jezik

identifikator = sl-dajnko
§termin

slovenščina v dajnčici
§jezik

identifikator = sl-metelko
§termin

slovenščina v metelščici
§jezik

identifikator = de
§termin

nemščina
§jezik

identifikator = la
§termin

latinščina
§jezik

identifikator = en
§termin

angleščina
§opis sprememb
§sprememba Tomaž Erjavec<ime>: Corpus merge & driver file.
§datum 2014-01-10


Datum: 2014-01-10

Avtorske pravice za besedilo te izdaje določa licenca Creative Commons Priznanje avtorstva 3.0.