{"id":2,"date":"2015-12-30T00:10:03","date_gmt":"2015-12-29T23:10:03","guid":{"rendered":"http:\/\/nl.ijs.si\/kas\/?page_id=2"},"modified":"2026-04-09T11:00:43","modified_gmt":"2026-04-09T09:00:43","slug":"korpus-akademske-slovenscine","status":"publish","type":"page","link":"https:\/\/nl.ijs.si\/kas\/","title":{"rendered":"Nacionalni projekt <a href=\"http:\/\/www.sicris.si\/search\/prj.aspx?lang=eng&#038;id=9966&#038;opt=1\">J6-7094<\/a>:<br>&#8220;Slovenska znanstvena besedila: viri in opis&#8221;"},"content":{"rendered":"<p style=\"text-align: justify;\">Razvoj in uporaba slovenskega znanstvenega jezika v visokem \u0161olstvu ter znanosti je zadnja leta eno osrednjih vpra\u0161anj slovenske jezikovne politike. Problem je izpostavljen tudi v <a href=\"http:\/\/pisrs.si\/Pis.web\/pregledPredpisa?id=RESO91\">Resoluciji o Nacionalnem programu za jezikovno politiko 2014\u20132018<\/a>, na vpliv, ki ga imata znanje in razvoj znanstvenega jezika na vitalnost posameznega jezika, pa opozarja tudi ve\u010d evropskih \u0161tudij. Zaradi tega je nujno izdelati sodobne referen\u010dne jezikovne vire, ki bodo pomagali opolnomo\u010diti slovenski znanstveni jezik, in na njih izvesti raziskave tega segmenta sloven\u0161\u010dine.<\/p>\n<p style=\"text-align: justify;\">Slovenske univerze so vzpostavile repozitorije svojih publikacij, ki vsebujejo raznorodna besedila, od diplomskih do doktorskih del na njihovih fakultetah kot znanstvene in strokovne prispevke, leta 2013 pa je bil vzpostavljeni tudi <a href=\"http:\/\/openscience.si\/\">Nacionalni portal odprte znanosti<\/a>, ki agregira vsebine iz univerzitetnih repozitorijev. Portal ponuja dostop do prek 123.000 slovenskih objav s \u0161irokega nabora strokovnih podro\u010dij. Ta dela so izjemno dragocen, a zaenkrat \u0161e neizkori\u0161\u010den vir podatkov o znanstveni sloven\u0161\u010dini, kot tudi bogat vir terminolo\u0161kih podatkov.<\/p>\n<p style=\"text-align: justify;\">V projektu smo izdelali korpus slovenske znanstvene sloven\u0161\u010dine, ki vsebuje diplomska, magistrska in doktorska dela prevzeta s portala odprte znanosti. Besedila so zajeta iz formata PDF, kar zahteva razvoj metod za \u010di\u0161\u010denje besedil, lu\u0161\u010denje strukture dokumentov ter pretvorbo v enovit in standardiziran zapis XML. Korpus je jezikoslovno ozna\u010den z na novo razvitimi orodji.<\/p>\n<p style=\"text-align: justify;\">Korpus je slu\u017eil kot osnova za nove metode avtomatiziranega lu\u0161\u010denja slovenske terminologije. Izlu\u0161\u010deni terminolo\u0161ki kandidati bodo objavljeni prek prosto dostopnega spletnega slovarskega vmesnika, ki bo omogo\u010dal tako pregledovanje kot urejanje zbirk, kar bo slovenskim znanstvenim skupnostim z najrazli\u010dnej\u0161ih podro\u010dij omogo\u010dilo vklju\u010ditev v upravljanje s terminologijo svojega podro\u010dja.<\/p>\n<p style=\"text-align: justify;\">Pomemben segment projekta je bila tudi prva empiri\u010dno zasnovana raziskava slovenskega znanstvenega jezika, ki je temeljila na zbranem korpusu. Opis znanstvene sloven\u0161\u010dine smo dopolnili z izvedbo anket in poglobljenih intervjujev, s katerimi smo pridobili podatke o tistih delih znanstvenega pisanja v sloven\u0161\u010dini, s katerimi imajo pisci (zlasti doktorski \u0161tudenti in mlaj\u0161i doktorji znanosti) najve\u010d te\u017eav.<\/p>\n<p style=\"text-align: justify;\">Rezultati projekta so dostopni v najve\u010dji mo\u017eni meri: izdelani viri in orodja so prosto in javno dostopni \u0161ir\u0161i raziskovalni skupnosti, s \u010dimer bodo pripomogli k napredku korpusnega jezikoslovja, digitalne humanistike in jezikovnih tehnologij za sloven\u0161\u010dino. Viri so arhivirani v repozitoriju raziskovalne infrastrukture <a href=\"http:\/\/www.clarin.si\/\" target=\"_blank\" rel=\"noopener noreferrer\">CLARIN.SI<\/a>, ki je prevzela tudi vzdr\u017eevanje korpusa po zaklju\u010dku projekta. Celotni korpus, kot tudi njegovi trije podkorpusi so dostopni za analizo prek konkordan\u010dnikov in za prenos z repozitorija CLARIN.SI:<\/p>\n<ul>\n<li>Korpus KAS: <a href=\"http:\/\/hdl.handle.net\/11356\/1244\">http:\/\/hdl.handle.net\/11356\/1244<\/a><\/li>\n<li>Korpus KAS-dr: <a href=\"http:\/\/hdl.handle.net\/11356\/1265\">http:\/\/hdl.handle.net\/11356\/1265<\/a><\/li>\n<li>Korpus KAS-mag: <a href=\"http:\/\/hdl.handle.net\/11356\/1266\">http:\/\/hdl.handle.net\/11356\/1266<\/a><\/li>\n<li>Korpus KAS-dipl: <a href=\"http:\/\/hdl.handle.net\/11356\/1267\">http:\/\/hdl.handle.net\/11356\/1267<\/a><\/li>\n<\/ul>\n<p style=\"text-align: justify;\">Pri projektu so <a href=\"partnerji\/\" target=\"_blank\" rel=\"noopener noreferrer\">sodelovali raziskovalci s \u0161tirih znanstvenoraziskovalnih ustanov<\/a>, ki so si za uresni\u010ditev zastavljenih ciljev prizadevali z razli\u010dnimi, a komplementarnimi znanji. Cilji projekta so torej bili: okrepitev slovenskega znanstvenega jezika, bolj\u0161a opremljenost slovenskega jezika za delovanje v informacijski dru\u017ebi in zagotavljanje ve\u010dje odprtosti znanstvenih rezultatov.<\/p>\n<!--themify_builder_content-->\n<div id=\"themify_builder_content-2\" data-postid=\"2\" class=\"themify_builder_content themify_builder_content-2 themify_builder tf_clear\">\n    <\/div>\n<!--\/themify_builder_content-->","protected":false},"excerpt":{"rendered":"<p>Razvoj in uporaba slovenskega znanstvenega jezika v visokem \u0161olstvu ter znanosti je zadnja leta eno osrednjih vpra\u0161anj slovenske jezikovne politike. Problem je izpostavljen tudi v Resoluciji o Nacionalnem programu za jezikovno politiko 2014\u20132018, na vpliv, ki ga imata znanje in razvoj znanstvenega jezika na vitalnost posameznega jezika, pa opozarja tudi ve\u010d evropskih \u0161tudij. Zaradi tega [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-2","page","type-page","status-publish","hentry","has-post-title","has-post-date","has-post-category","has-post-tag","has-post-comment","has-post-author",""],"builder_content":"","_links":{"self":[{"href":"https:\/\/nl.ijs.si\/kas\/wp-json\/wp\/v2\/pages\/2","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/nl.ijs.si\/kas\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/nl.ijs.si\/kas\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/nl.ijs.si\/kas\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/nl.ijs.si\/kas\/wp-json\/wp\/v2\/comments?post=2"}],"version-history":[{"count":27,"href":"https:\/\/nl.ijs.si\/kas\/wp-json\/wp\/v2\/pages\/2\/revisions"}],"predecessor-version":[{"id":567,"href":"https:\/\/nl.ijs.si\/kas\/wp-json\/wp\/v2\/pages\/2\/revisions\/567"}],"wp:attachment":[{"href":"https:\/\/nl.ijs.si\/kas\/wp-json\/wp\/v2\/media?parent=2"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}