{"id":5936,"date":"2017-11-21T07:30:27","date_gmt":"2017-11-21T06:30:27","guid":{"rendered":"http:\/\/nl.ijs.si\/janes\/?page_id=5936"},"modified":"2025-05-03T20:03:52","modified_gmt":"2025-05-03T18:03:52","slug":"rocno-oznaceni-korpusi","status":"publish","type":"page","link":"https:\/\/nl.ijs.si\/janes\/viri\/rocno-oznaceni-korpusi\/","title":{"rendered":"Ro\u010dno ozna\u010deni korpusi"},"content":{"rendered":"<h2><span id=\"Rocno_oznaceni_korpusi\">Ro\u010dno ozna\u010deni korpusi<\/span><\/h2>\n<p>Ro\u010dno ozna\u010deni korpusi Janes so opisani v v poglavju monografije projekta:<\/p>\n<ul>\n<li>\u010cIBEJ, Jaka, ARHAR HOLDT, \u0160pela, ERJAVEC, Toma\u017e, FI\u0160ER, Darja. Ro\u010dno ozna\u010deni korpusi Janes za u\u010denje jezikovnotehnolo\u0161kih orodij in jezikoslovne raziskave. V: FI\u0160ER, Darja (ur.). <em>Viri, orodja in metode za analizo spletne sloven\u0161\u010dine. Znanstvena zalo\u017eba Filozofske fakultete Univerze v Ljubljani. <\/em>2018. DOI <a href=\"https:\/\/doi.org\/10.4312\/9789610600701\">10.4312\/9789610600701<\/a><\/li>\n<\/ul>\n<p>Ro\u010dno ozna\u010devanje ve\u010dine korpusov se je izvajalo v orodju <a href=\"https:\/\/webanno.github.io\/webanno\/\">WebAnno<\/a>. Postopek je opisan v naslednjem prispevku:<\/p>\n<ul>\n<li>ERJAVEC, Toma\u017e, ARHAR HOLDT, \u0160pela, \u010cIBEJ, Jaka, DOBROVOLJC, Kaja, FI\u0160ER, Darja, LASKOWSKI, Cyprian, ZUPAN, Katja. Annotating CLARIN.SI TEI corpora with WebAnno.\u00a0<i>Proceedings of the CLARIN Annual Conference<\/i>, 2016, pp. 1-5. [<a href=\"https:\/\/www.clarin.eu\/sites\/default\/files\/erjavec-etal-CLARIN2016_paper_17.pdf\">pdf<\/a>] [COBISS.SI-ID\u00a0<a class=\"red\" href=\"https:\/\/plus.cobiss.net\/cobiss\/si\/sl\/bib\/62797922\" target=\"_blank\" rel=\"noopener\">62797922<\/a>]<\/li>\n<\/ul>\n<h3><span id=\"Korpusi_za_solanje_jezikovnotehnoloskih_orodij\">Korpusi za \u0161olanje jezikovnotehnolo\u0161kih orodij<\/span><\/h3>\n<p>V sklopu projekta so bili ro\u010dno ozna\u010deni trije korpusi: Janes-Norm, Janes-Tag in Janes-Syn, ki pokrivajo razli\u010dne ravni ozna\u010devanja in katerih glavni namen je \u0161olanje in evalvacija orodij za procesiranje nestandardne sloven\u0161\u010dine, kot jo najdemo v ra\u010dunalni\u0161ko posredovani komunikaciji. Delo na korpusih Janes-Norm in Janes-Tag je opisano v naslednjih\u00a0publikacijah:<\/p>\n<ul>\n<li>\u010cIBEJ, Jaka, FI\u0160ER, Darja, ERJAVEC, Toma\u017e. Normalisation, tokenisation and sentence segmentation of Slovene tweets.\u00a0<em>Proceedings of the Workshop on\u00a0<\/em><i>Normalisation and Analysis of Social Media Texts (NormSoMe)<\/i>. 2016, pp. 5-10. [<a href=\"http:\/\/www.lrec-conf.org\/proceedings\/lrec2016\/workshops\/LREC2016Workshop-NormSoMe_Proceedings.pdf\">pdf<\/a>] [COBISS.SI-ID\u00a0<a class=\"red\" href=\"https:\/\/plus.cobiss.net\/cobiss\/si\/sl\/bib\/60917346\" target=\"_blank\" rel=\"noopener\">60917346<\/a>]<\/li>\n<li>\u010cIBEJ, Jaka, ARHAR HOLDT, \u0160pela, ERJAVEC, Toma\u017e, FI\u0160ER, Darja. Razvoj u\u010dne mno\u017eice za izbolj\u0161ano ozna\u010devanje spletnih besedil.\u00a0<i>Proceedings of the Conference on Language Technologies &amp; Digital Humanities, September 29th \u2013 October 1st, 2016, Ljubljana, Slovenia<\/i>, pp. 40-46, [<a href=\"http:\/\/www.sdjt.si\/wp\/wp-content\/uploads\/2016\/09\/JTDH-2016_Cibej-et-al_Razvoj-ucne-mnozice.pdf\">pdf<\/a>] [COBISS.SI-ID\u00a0<a class=\"red\" href=\"https:\/\/plus.cobiss.net\/cobiss\/si\/sl\/bib\/62529890\" target=\"_blank\" rel=\"noopener\">62529890<\/a>]<\/li>\n<li>ERJAVEC, Toma\u017e, \u010cIBEJ, Jaka, ARHAR HOLDT, \u0160pela, LJUBE\u0160I\u0106, Nikola, FI\u0160ER, Darja. Gold-standard datasets for annotation of Slovene computer-mediated communication. Proceedings of RASLAN 2016: Recent Advances in Slavonic Natural Language Processing. Brno: Tribun EU, 2016, pp. 29-40. [<a href=\"https:\/\/nlp.fi.muni.cz\/raslan\/raslan16.pdf\" target=\"_blank\" rel=\"noopener\">pdf<\/a>] [COBISS.SI-ID\u00a0<a class=\"red\" href=\"https:\/\/plus.cobiss.net\/cobiss\/si\/sl\/bib\/62994530\" target=\"_blank\" rel=\"noopener\">62994530<\/a>]<\/li>\n<\/ul>\n<p>Za ozna\u010devanje Janes-Norm in Janes-Tag so bile napisane naslednje jezikoslovne in tehni\u010dne smernice:<\/p>\n<ul>\n<li><em>Smernice za ozna\u010devanje ra\u010dunalni\u0161ko posredovane komunikacije: tokenizacija, stav\u010dna segmentacija, normalizacija, lematizacija in oblikoskladenjsko ozna\u010devanje, v1.0.<\/em>\u00a0[<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2014\/09\/Janes-smernice-v1.0.pdf\">pdf<\/a>] [<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2014\/09\/Janes-smernice-v1.0.docx\">docx<\/a>]<\/li>\n<li><em>Navodila za ozna\u010devanje ra\u010dunalni\u0161ko posredovane komunikacije v WebAnno, v1.0<\/em>. [<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2014\/09\/Janes-webnno-v1.0.pdf\">pdf]\u00a0<\/a>[<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2014\/09\/Janes-webnno-v1.0.docx\">docx<\/a>]<\/li>\n<\/ul>\n<h4><span id=\"Janes-Norm\">Janes-Norm<\/span><\/h4>\n<p>Janes-Norm je ro\u010dno ozna\u010deni korpus ra\u010dunalni\u0161ko posredovane komunikacije. Razli\u010dica 3.0 vsebuje okoli 280.000 pojavnic oz. 20.00 besedil in pokriva tokenizacijo (vklju\u010dno z ohranjanjem sti\u010dnosti), razdelitev na stavke oz. povedi ter standardizacijo besednih oblik.<\/p>\n<p>Korpus Janes-Norm je prosto in odprto dostopen pod licenco\u00a0<a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">CC BY-SA 4.0<\/a>:<\/p>\n<ul>\n<li><a href=\"https:\/\/www.clarin.si\/ske\/#dashboard?corpname=janes_norm30\">Iskanje po korpusu v konkordan\u010dniku noSkE<\/a><\/li>\n<li>Prevzem korpusa z repozitorija CLARIN.SI:\n<ul>\n<li>CMC training corpus Janes-Norm 1.2 (2016): <a href=\"http:\/\/hdl.handle.net\/11356\/1084\">http:\/\/hdl.handle.net\/11356\/1084<\/a><\/li>\n<li>CMC training corpus Janes-Norm 3.0 (2022): <a href=\"http:\/\/hdl.handle.net\/11356\/1732\">http:\/\/hdl.handle.net\/11356\/1732 <\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h4><span id=\"Janes-Tag\">Janes-Tag<\/span><\/h4>\n<p>Janes-Tag je ro\u010dno ozna\u010deni korpus ra\u010dunalni\u0161ko posredovane komunikacije. Razli\u010dica 3.0 vsebuje okoli 190.000 pojavnic oz. 15.000 besedil in pokriva poleg ravni iz Janes-Norm \u0161e ro\u010dno preverjeno oblikoskladensjko ozna\u010devanje, lematizacijo in imenske entitete.<\/p>\n<p>Za ozna\u010devanje imenskih entitet v Janes-Tag so bile napisane naslednje smernice v slovenskem in angle\u0161kem jeziku:<\/p>\n<ul>\n<li><em>Smernice za ozna\u010devanje imenskih entitet v slovenskem jeziku V1.1.\u00a0<\/em>[<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2017\/09\/SlovenianNER-slv-v1.1.pdf\">pdf<\/a>] [<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2017\/09\/SlovenianNER-slv-v1.1.docx\">docx<\/a>]<\/li>\n<li><em>Annotation guidelines for Slovenian named entities V1.1.<\/em>\u00a0[<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2017\/09\/SlovenianNER-eng-v1.1.pdf\">pdf<\/a>] [<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2017\/09\/SlovenianNER-eng-v1.1.docx\">docx<\/a>]<\/li>\n<\/ul>\n<p>Korpus Janes-Tag je prosto in odprto dostopen pod licenco\u00a0<a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">CC BY-SA 4.0<\/a>:<\/p>\n<ul>\n<li><a href=\"https:\/\/www.clarin.si\/ske\/#dashboard?corpname=janes_tag30\">Iskanje po korpusu v konkordan\u010dniku noSkE<\/a>\n<ul>\n<li>Namig za iskanje: \u010de v korpusu \u017eelimo najti vse medmete, v polje CQL vpi\u0161emo\u00a0<a href=\"https:\/\/www.clarin.si\/noske\/run.cgi\/first?corpname=janes_tag&amp;reload=&amp;iquery=&amp;queryselector=cqlrow&amp;lemma=&amp;phrase=&amp;word=&amp;char=&amp;cql=%5Btag%3D%22M%22%5D&amp;default_attr=tag&amp;fc_lemword_window_type=both&amp;fc_lemword_wsize=5&amp;fc_lemword=&amp;fc_lemword_type=all&amp;fsca_text.id=&amp;fsca_text.source=\">[tag=\u201dM\u201d]<\/a>.<\/li>\n<\/ul>\n<\/li>\n<li><a href=\"http:\/\/hdl.handle.net\/11356\/1123\">Prevzem korpusa z repozitorija CLARIN.SI<\/a>\n<ul>\n<li>CMC training corpus Janes-Tag 2.0 (2017): <a href=\"http:\/\/hdl.handle.net\/11356\/1123\">http:\/\/hdl.handle.net\/11356\/1123<\/a><\/li>\n<li>CMC training corpus Janes-Tag 3.0 (2022): <a href=\"http:\/\/hdl.handle.net\/11356\/1732\">http:\/\/hdl.handle.net\/11356\/1732<\/a><\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h4><span id=\"Janes-Syn\">Janes-Syn<\/span><\/h4>\n<p>Janes-Syn je ro\u010dno ozna\u010deni korpus ra\u010dunalni\u0161ko posredovane komunikacije, ki vsebuje okoli 4.000 pojavnic oz. 170 besedil in pokriva poleg ravni iz Janes-Tag \u0161e odvisnostno skladnjo nad normaliziranimi pojavnicami. Delo na korpusu Janes-Syn je opisano v naslednji\u00a0publikaciji:<\/p>\n<ul>\n<li>ARHAR HOLDT, \u0160pela, FI\u0160ER, Darja, ERJAVEC, Toma\u017e, KREK, Simon. Syntactic annotation of Slovene CMC : first steps.\u00a0<i>Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities, 27-28 September 2016, Ljubljana, Slovenia<\/i>, 2016, pp. 3-6. [<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2016\/09\/CMC-2016_Arhar_et_al_Syntactic-Annotation-of-Slovene-CMC.pdf\">pdf<\/a>] [COBISS.SI-ID\u00a0<a class=\"red\" href=\"https:\/\/plus.cobiss.net\/cobiss\/si\/sl\/bib\/62120546\" target=\"_blank\" rel=\"noopener\">62120546<\/a>]<\/li>\n<\/ul>\n<p>Za ozna\u010devanje Janes-Syn so bile napisane naslednje smernice:<\/p>\n<ul>\n<li><em>Smernice za ozna\u010devanje z odvisnostnim sistemom JOS:nestandardna sloven\u0161\u010dina v1.0<\/em>\u00a0[<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2014\/09\/Janes-skladnja-v1.0.pdf\">pdf<\/a>] [<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2014\/09\/Janes-skladnja-v1.0.docx\">docx<\/a>]<br \/>\n(Smernice so pisane za program za ro\u010dno ozna\u010devanje in pregledovanje odvisnostne skladnje, ki je bil razvit v okviru projekta \u201c<a href=\"http:\/\/www.slovenscina.eu\/\">Sporazumevanje v slovenskem jeziku<\/a>\u201d [izvorna koda])<\/li>\n<\/ul>\n<p>Korpus Janes-Syn je prosto in odprto dostopen pod licenco\u00a0<a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">CC BY-SA 4.0<\/a>:<\/p>\n<ul>\n<li><a href=\"https:\/\/www.clarin.si\/ske\/#dashboard?corpname=janes_syn\">Iskanje po korpusu v konkordan\u010dniku noSkE<\/a><\/li>\n<li><a href=\"http:\/\/hdl.handle.net\/11356\/1086\">Prevzem korpusa z repozitorija CLARIN.SI<\/a><\/li>\n<\/ul>\n<h3><span id=\"Korpusi_za_jezikoslovne_raziskave\">Korpusi za jezikoslovne raziskave<\/span><\/h3>\n<h4><span id=\"Janes-Kratko\">Janes-Kratko<\/span><\/h4>\n<p>Janes-Kratko je korpus tvitov, ki je ro\u010dno ozna\u010den z na\u010dini kraj\u0161anja po izdelani tipologiji. Vsebuje 777 tvitov oz. okoli 20.000 pojavnic. Delo na korpusu Janes-Kratko in analiza strategij kraj\u0161anja sta opisana v naslednji\u00a0publikaciji:<\/p>\n<ul>\n<li>GOLI, Teja, OSRAJNIK, Eneja, FI\u0160ER, Darja. Analiza kraj\u0161anja slovenskih sporo\u010dil na dru\u017ebenem omre\u017eju Twitter.\u00a0<i>Proceedings of the Conference on Language Technologies &amp; Digital Humanities, Ljubljana, Slovenia<\/i>. 2016, pp. 77-82, [<a href=\"http:\/\/www.sdjt.si\/wp\/wp-content\/uploads\/2016\/09\/JTDH-2016_Goli-et-al_Analiza-krajsanja-slovenskih-sporocil.pdf\">pdf<\/a>] [COBISS.SI-ID\u00a0<a class=\"red\" href=\"https:\/\/plus.cobiss.net\/cobiss\/si\/sl\/bib\/62584930\" target=\"_blank\" rel=\"noopener\">62584930<\/a>]<\/li>\n<\/ul>\n<p>Za korpus Janes-Kratko je bila izdelana tipologija kraj\u0161anja:<\/p>\n<ul>\n<li><em>Strategije kraj\u0161anja tvitov: Tipologija oznak v1.0\u00a0<\/em>[<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2014\/09\/Janes-kratko-v1.0.pdf\">pdf<\/a>] [<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2014\/09\/Janes-kratko-v1.0.docx\">docx<\/a>]<\/li>\n<\/ul>\n<p>Korpus Janes-Kratko je prosto in odprto dostopen pod licenco\u00a0<a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">CC BY-SA 4.0<\/a>:<\/p>\n<ul>\n<li><a href=\"https:\/\/www.clarin.si\/ske\/#dashboard?corpname=janes_kratko\">Iskanje po korpusu v konkordan\u010dniku noSkE<\/a><\/li>\n<li><a href=\"http:\/\/hdl.handle.net\/11356\/1087\">Prevzem korpusa z repozitorija CLARIN.SI<\/a><\/li>\n<\/ul>\n<h4><span id=\"Janes-Vejica\">Janes-Vejica<\/span><\/h4>\n<p>Janes-Vejica je korpus tvitov, v katerih je v skladu z izdelano tipologijo ro\u010dno ozna\u010dena nestandardna (ne)raba vejice. Delo na korpusu Janes-Vejica in tipologija za ozna\u010devanje sta opisani v naslednji publikaciji:<\/p>\n<ul>\n<li>POPI\u010c, Damjan, FI\u0160ER, Darja, ZUPAN, Katja, LOGAR, Polona. Raba vejice v uporabni\u0161kih spletnih vsebinah.\u00a0<i>Proceedings of the Conference on Language Technologies &amp; Digital Humanities, September 29th \u2013 October 1st, 2016 Faculty of Arts, University of Ljubljana, Ljubljana, Slovenia<\/i>, 2016, str. 106-110. [<a href=\"http:\/\/www.sdjt.si\/wp\/wp-content\/uploads\/2016\/09\/JTDH-2016_Popic-et-al_Raba-vejice-v-uporabniskih-spletnih-vsebinah.pdf\">pdf<\/a>]<\/li>\n<\/ul>\n<p>Za ozna\u010devanje korpusa so bile izdelane naslednje\u00a0smernice:<\/p>\n<ul>\n<li>Smernice za ozna\u010devanje\u00a0nestandardne rabe vejice v ra\u010dunalni\u0161ko posredovani komunikaciji, v1.0 [<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2014\/09\/Janes-vejica-v1.0.pdf\">pdf<\/a>] [<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2014\/09\/Janes-vejica-v1.0.docx\">docx<\/a>]<\/li>\n<\/ul>\n<p>Korpus Janes-Vejica je prosto in odprto dostopen pod licenco\u00a0<a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">CC BY-SA 4.0<\/a>:<\/p>\n<ul>\n<li><a href=\"https:\/\/www.clarin.si\/ske\/#dashboard?corpname=janes_vejica\">Iskanje po korpusu v konkordan\u010dniku noSkE<\/a><\/li>\n<li><a href=\"http:\/\/hdl.handle.net\/11356\/1088\">Prevzem korpusa z repozitorija CLARIN.SI<\/a><\/li>\n<\/ul>\n<h4><span id=\"Janes-Preklop\">Janes-Preklop<\/span><\/h4>\n<p>Janes-Preklop je korpus tvitov, v katerih so v skladu z izdelano tipologijo ro\u010dno ozna\u010dena preklapljanja jezikovnega koda. Delo na korpusu Janes-Preklop in tipologija za ozna\u010devanje sta opisani v naslednji publikaciji:<\/p>\n<ul>\n<li>REHER, \u0160pela.\u00a0<em>Sloven\u0161\u010dina na prepihu: kodno preklapljanje v objavah slovenskih uporabnikov Twitterja.<\/em>\u00a0Magistrsko delo. 2017. Filozofska fakulteta Univerze v Ljubljani. [<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2017\/09\/Magistrsko-delo_%C5%A0pela-Reher_final.pdf\">pdf<\/a>]<\/li>\n<\/ul>\n<p>Za ozna\u010devanje korpusa so bile izdelane naslednje\u00a0smernice:<\/p>\n<ul>\n<li>\n<div>Smernice za ozna\u010devanje kodnega preklapljanja v korpusu slovenskih tvitov JANES [<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2014\/09\/Janes-preklop-tipologija.pdf\">pdf<\/a>] [<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2014\/09\/Janes-preklop-tipologija.docx\">docx<\/a>]<\/div>\n<\/li>\n<\/ul>\n<p>Korpus Janes-Preklop je prosto in odprto dostopen pod licenco\u00a0<a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">CC BY-SA 4.0<\/a>:<\/p>\n<ul>\n<li><a href=\"https:\/\/www.clarin.si\/ske\/#dashboard?corpname=janes_preklop\">Iskanje po korpusu v konkordan\u010dniku noSkE<\/a><\/li>\n<li><a href=\"http:\/\/hdl.handle.net\/11356\/1154\">Prevzem korpusa z repozitorija CLARIN.SI<\/a><\/li>\n<\/ul>\n<h4><span id=\"Janes-Preklop\">Janes-Geo<\/span><\/h4>\n<p>Korpus Janes-Geo\u00a0je bil vzor\u010den iz avtomatsko normaliziranega, oblikoskladenjsko ozna\u010denega in lematiziranega korpusa Janes-Tweet-Geo 0.3.4, ki je podkorpus korpusa Janes-Tweet 0.3. Iz korpusa je bilo naklju\u010dno vzor\u010deno po najve\u010d 500 jezikovno nestandardnih (L3+L2) tvitov zasebnih uporabnikov iz 9 regij: Ljubljana, Maribor, Primorska, Rovtarska, Gorenjska, Dolenjska, \u0160tajerska, Koro\u0161ka in Panonska. V vzorcu so bile nato ro\u010dno ozna\u010dene vse nestandardne jezikovne prvine v skladu z izdelano tipologijo, v procesu ozna\u010devanja pa so bili nerelevantni tviti izbrisani. Korpus je bil med drugim predstavljen v naslednjem prispevku:<\/p>\n<ul>\n<li>\u010cIBEJ, Jaka. 2016. Framework for an Analysis of Slovene Regional Language Variants on Twitter.\u00a0<em>Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities<\/em>. Ljubljana, Slovenia: 17\u201321.\u00a0[<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2016\/09\/CMC-2016_Cibej_Framework-Analysis-of-Slovene-Regional-Language-Variants-Twitter.pdf\">pdf<\/a>]<\/li>\n<\/ul>\n<p>Za ozna\u010devanje korpusa so bile izdelane naslednje\u00a0smernice:<\/p>\n<ul>\n<li>\n<div>Smernice za ozna\u010devanje nestandardnih jezikovnih prvin v slovenskih tvitih [<a href=\"http:\/\/nl.ijs.si\/janes\/wp-content\/uploads\/2018\/01\/JANES_Geo_smernice_1.0.pdf\">pdf<\/a>]<\/div>\n<\/li>\n<\/ul>\n<p>Korpus Janes-Geo je prosto in odprto dostopen pod licenco\u00a0<a href=\"https:\/\/creativecommons.org\/licenses\/by-sa\/4.0\/\">CC BY-SA 4.0<\/a>:<\/p>\n<ul>\n<li>Prevzem korpusa z repozitorija CLARIN.SI<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Ro\u010dno ozna\u010deni korpusi Ro\u010dno ozna\u010deni korpusi Janes so opisani v v poglavju monografije projekta: \u010cIBEJ, Jaka, ARHAR HOLDT, \u0160pela, ERJAVEC, Toma\u017e, FI\u0160ER, Darja. Ro\u010dno ozna\u010deni korpusi Janes za u\u010denje jezikovnotehnolo\u0161kih orodij in jezikoslovne raziskave. V: FI\u0160ER, Darja (ur.). Viri, orodja in metode za analizo spletne sloven\u0161\u010dine. Znanstvena zalo\u017eba Filozofske fakultete Univerze v Ljubljani. 2018. DOI [&hellip;]<\/p>\n","protected":false},"author":20,"featured_media":0,"parent":2359,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-5936","page","type-page","status-publish","hentry","has-post-title","has-post-date","has-post-category","has-post-tag","has-post-comment","has-post-author",""],"builder_content":"","_links":{"self":[{"href":"https:\/\/nl.ijs.si\/janes\/wp-json\/wp\/v2\/pages\/5936","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/nl.ijs.si\/janes\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/nl.ijs.si\/janes\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/nl.ijs.si\/janes\/wp-json\/wp\/v2\/users\/20"}],"replies":[{"embeddable":true,"href":"https:\/\/nl.ijs.si\/janes\/wp-json\/wp\/v2\/comments?post=5936"}],"version-history":[{"count":26,"href":"https:\/\/nl.ijs.si\/janes\/wp-json\/wp\/v2\/pages\/5936\/revisions"}],"predecessor-version":[{"id":6240,"href":"https:\/\/nl.ijs.si\/janes\/wp-json\/wp\/v2\/pages\/5936\/revisions\/6240"}],"up":[{"embeddable":true,"href":"https:\/\/nl.ijs.si\/janes\/wp-json\/wp\/v2\/pages\/2359"}],"wp:attachment":[{"href":"https:\/\/nl.ijs.si\/janes\/wp-json\/wp\/v2\/media?parent=5936"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}