Bibliografija projekta

2017

Prispevki v revijah

  • Beißwenger, M., Chanier, T., Erjavec, T., Fišer, D., Herold, A., Ljubešić, N., Lüngen, H., Poudat, C., Stemle, E., Storrer, A., Wigham, C. 2017. Closing a Gap in the Language Resources Landscape: Groundwork and Best Practices from Projects on Computer-mediated Communication in four European Countries. Selected papers from the CLARIN Annual Conference 2016. Aix-en-Provence, Francija. [pdf]

Prispevki na mednarodnih konferencah

  • Ljubešić, N., Erjavec, T., Fišer, D. 2017. Adapting a State-of-theArt Tagger for South Slavic Languages to Non-Standard Text. Proceedings of the 6th Workshop on Balto-Slavic Natural Language Processing, 60-68. Valencija, Španija. [pdf]
  • Verhoeven, B., Škrjanec, I., Pollak, S. 2017. Gender Profiling for Slovene Twitter Communication: The Influence of Gender Marking, Content and Style. Proceedings of the 6th Workshop on Balto-Slavic Natural Language Processing, 119-125. Valencija, Španija. [pdf]
  • Gorjanc, V., Fišer, D. 2017. Twitter and power relations: The case of Slovenian equal marriage referendum campaign. Interdisciplinary Conference on Hate speech: Definitions, Interpretations and Practices. Nikozija, Grčija. [pdf]

Poglavja v monografskih publikacijah

  • Fišer, D., Erjavec, T., Ljubešić, N. 2017. The compilation, processing and analysis of the Janes corpus of Slovene user-generated content. Wigham, C.R. &  Ledegen, G. (ur.). Corpus de communication médiée par les réseaux: construction, structuration, analyse. Collection Humanités Numériques. Paris: L’Harmattan. [draft]

2016

Prispevki v revijah

  • Arhar Holdt, Š., Dobrovoljc, K. 2016. Vrednost korpusa Janes za slovensko normativistiko. Slovenščina 2.0, 4 (2): 1–37. [pdf]
  • Fišer, D., Erjavec, T., Ljubešić, N. 2016. JANES v0.4: Korpus slovenskih spletnih uporabniških vsebin. Slovenščina 2.0, 4 (2): 67–99. [pdf]
  • Erjavec, T., Čibej, J., Fišer, D. 2016. Omogočanje dostopa do korpusov slovenskih spletnih besedil v luči pravnih omejitev. Slovenščina 2.0, 4 (2): 189–219. [pdf]
  • Sobočan, A. M., Pollak, S. 2016. Manifestacije moralne panike v medijskih podobah novele družinske zakonodaje. Časopis za kritiko znanosti, ISSN 0351-4285, 2016, letn. 44, št. 266, str. 163-187.

Prispevki na mednarodnih konferencah

  • Erjavec, T., Čibej, J., Arhar Holdt, Š., Ljubešić, N. Fišer, D. 2016. Gold-Standard Datasets for Annotation of Slovene Computer-Mediated Communication. Proceedings of the Tenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2016. Brno, Češka. [pdf]
  • Fišer, D., Ljubešić, N. 2016. Detecting Semantic Shifts in Slovene Twitterese. Proceedings of the Tenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2016. Brno, Češka. [pdf]
  • Erjavec, T., Arhar Holdt, Š., Čibej, J., Dobrovoljc, K., Fišer, D., Laskowski, C., Zupan, K. 2016. Annotating CLARIN.SI TEI corpora with WebAnno. Proceedings of the CLARIN Annual Conference 2016. Aix-en-Provence, Francija. [pdf]
  • Beißwenger, M., Chanier, T., Chiari, I., Erjavec, T., Fišer, D., Herold, A., Ljubešić, N., Lüngen, H., Poudat, C., Stemle, E., Storrer, A., Wigham, C. 2016. Integrating corpora of computer-mediated communication into the language resources landscape: Initiatives and best practices from French, German, Italian and Slovenian projects. Proceedings of the CLARIN Annual Conference 2016. Aix-en-Provence, Francija. [pdf]
  • Čibej, J., Arhar Holdt, Š., Erjavec, T., Fišer, D. 2016. Razvoj učne množice za izboljšano označevanje spletnih besedil. Proceedings of the Language Technologies and Digital Humanities Conference. Ljubljana, Slovenia: 40–46. [pdf]
  • Fišer, D., Smailović, J., Erjavec, T., Mozetič, I., Grčar, M. 2016. Sentiment Annotation of Slovene User-Generated Content. Proceedings of the Language Technologies and Digital Humanities Conference. Ljubljana, Slovenia: 65–70. [pdf]
  • Gantar, P., Škrjanec, I., Fišer, D., Erjavec, T. 2016. Slovar tviterščine. Proceedings of the Language Technologies and Digital Humanities Conference. Ljubljana, Slovenia: 71–76. [pdf]
  • Goli, T., Osrajnik, O., Fišer, D. 2016. Analiza krajšanja slovenskih sporočil na družbenem omrežju Twitter. Proceedings of the Language Technologies and Digital Humanities Conference. Ljubljana, Slovenia: 77–82. [pdf]
  • Ljubešić, N., Fišer, D. 2016. Private or Corporate? Predicting User Types on Twitter. Proceedings 2016 The 2nd Workshop on Noisy User-generated Text (W-NUT). Osaka, Japonska. [pdf]
  • Ljubešić, N., Fišer, D. 2016. A Global Analysis of Emoji Usage.  Proceedings of the 10th Web as Corpus Workshop. Berlin, Nemčija. [pdf]
  • Ljubešić, N., Erjavec, T., Fišer, D., Samardžić, T., Miličević, M., Klubička, F., Petkovski, F. 2016. Easily Accessible Language Technologies for Slovene, Croatian and Serbian. Proceedings of the Language Technologies and Digital Humanities Conference. Ljubljana, Slovenia: 120–124. [pdf]
  • Popič, D., Fišer, D., Zupan, K., Logar, P. 2016. Raba vejice v uporabniških spletnih vsebinah. Proceedings of the Language Technologies and Digital Humanities Conference. Ljubljana, Slovenia: 149–153. [pdf]
  • Ljubešić, N., Zupan, K., Fišer, D., Erjavec, T. 2016. Normalising Slovene data: historical texts vs. user-generated content. Proceedings of the 13th Conference on Natural Language Processing (KONVENS 2016). Bochum, Germany: 146–155. [pdf]
  • Arhar Holdt, Š., Fišer, D., Erjavec, T., Krek, S. 2016. Syntactic Annotation of Slovene CMC: First Steps. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 3–6. [pdf]
  • Čibej, J. 2016. Framework for an Analysis of Slovene Regional Language Variants on Twitter. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 17–21. [pdf]
  • Fišer, D., Erjavec, T. 2016. Analysis of Sentiment Labeling of Slovene User-Generated Content. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 22–25. [pdf]
  • Ljubešić, N., Fišer, D. 2016. Slovene Twitter Analytics. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 39–43. [pdf]
  • Marko, D. 2016. The Use of Alphanumeric Symbols in Slovene Tweets. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 48–53. [pdf]
  • Škrjanec, I., Pollak, S. 2016. Topic Ontologies of the Slovene Blogosphere: A Gender Perspective. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 62–65. [pdf]
  • Zwitter Vitez, A., Fišer, D. 2016. Linguistic Analysis of Emotions in Online News Comments – an Example of the Eurovision Song Contest. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 74–76. [pdf]
  • Pesek, G., Škrjanec, I., Marko., D. 2016. Alternative Endings of Slovene Verbs in Third Person Plural: A Corpus Approach. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 77–81. [pdf]
  • Čibej, J., Fišer, D., Erjavec, T. 2016. Normalisation, Tokenisation and Sentence Segmentation of Slovene Tweets. Proceedings of Normalisation and Analysis of Social Media Texts (NormSoMe) 2016, Language Resources and Evaluation Conference (LREC 2016). Portorož, Slovenia: 5–10. [pdf]
  • Ljubešić, N., Erjavec, T. 2016. Corpus vs. Lexicon Supervision in Morphosyntactic Tagging: The Case of Slovene. Proceedings of Language Resources and Evaluation Conference (LREC) 2016. Portorož, Slovenia, 1527–1531. [pdf]
  • Ljubešić, N., Erjavec, T., Fišer, D. 2016. Corpus-Based Diacritic Restoration for South Slavic Languages. Proceedings of Language Resources and Evaluation Conference (LREC) 2016. Portorož, Slovenia, 3612–3616. [pdf]

Strokovne publikacije

  • Arhar Holdt, Š. 2016. Spletna slovenščina pod drobnogledom dijakov in študentov. Slovenščina 2.0, 4(1). [pdf]
  • Čibej, J., Marko, D. 2016. Poletna šola korpusnega jezikoslovja v Lancastru. Slovenščina 2.0, 4(1). [pdf]
  • Čibej, J., Škrjanec, I. 2016. Seminarja o metodah korpusnega in eksperimentalnega jezikoslovja v Beogradu in Zagrebu. Slovenščina 2.0, 4(1). [pdf]
  • Fišer, D. (ur.) 2016. 1. poletna šola spletne slovenščine Janes za študente. Učna gradiva. 1.izd. Ljubljana: Znanstvena založba Filozofske fakultete Univerze v Ljubljani. [pdf]
  • Fišer, D. (ur.). 2016. 2. poletni raziskovalni tabor slovenščine Janes za srednješolce. Učna gradiva. 1. izd. Ljubljana: Znanstvena založba Filozofske fakultete Univerze v Ljubljani. [pdf]
  • Marko, D., Škrjanec, I., Čibej, J. 2016. 28. poletna šola jezika, logike in informatike ESSLLI  2016. Slovenščina 2.0, 4(2). [pdf]

2015

Prispevki na mednarodnih konferencah

  • Fišer, D., Ljubešić, N., Erjavec, T. 2015. The JANES corpus of Slovene user generated content: construction and annotation. International Research Days: Social Media and CMC Corpora for the eehumanities: Book of Abstracts. 23.-24. October 2015, Rennes, Francija: 11. [pdf]
  • Ljubešić, N., Fišer, D., Erjavec, T., Čibej, J., Marko, D., Pollak, S., Škrjanec, I. 2015. Predicting the level of text standardness in user-generated content. 1oth International Conference  on Recent Advances in Natural Language Processing: Proceedings of RANLP 2015 Conference, 7-9 September 2015, Hissar, Bulgaria. Hissar: 371–378. [pdf]
  • Čibej, J., Fišer, D., Kosem, I. 2015. The role of crowdsourcing in lexicography.  Electronic lexicography in the 21st century: linking lexical data in the digital age: proceedings of eLex 2015 Conference, 11-13 August 2015, Herstmonceux Castle, United Kingdom. Ljubljana: Trojina, Institute for Applied Slovene Studies, Brighton: Lexical Computing, 2015, 70–83. [pdf]
  • Zwitter Vitez, A., Fišer, D. 2015. From mouth to keyboard: the place of non-canonical written and spoken structures in lexicography. Electronic lexicography in the 21st century: linking lexical data in the digital age: proceedings of eLex 2015 Conference, 11-13 August 2015, Herstmonceux Castle, United Kingdom. Ljubljana: Trojina, Institute for Applied Slovene Studies, Brighton: Lexical Computing, 2015, 250–267. [pdf]

Prispevki na domačih konferencah

  • Zwitter Vitez, A., Fišer, D. 2015. Elementi interakcije v govorjenih in spletnih besedilih. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 87–90. [pdf]
  • Vintar, Š. 2015. Terminologija v spletnih forumih. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 69–74. [pdf]
  • Škrjanec, I., Popič, D., Fišer, D. 2015. Arheologija začetnice pri stvarnih lastnih imenih. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 80–86. [pdf]
  • Rebernik, T. 2015. Slovenščina pod palcem interneta: vezajne in dvozačetniške e-tvorjenke. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 63–68. [pdf]
  • Pollak, S. 2015. Identifikacija spletno specifičnih kolokacij pogostega besedišča. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 57–56. [pdf]
  • Osrajnik, E., Fišer, D., Popič, D. 2015. Primerjava rabe ekspresivnih ločil v tvitih slovenskih uporabnikov in uporabnic. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 50–74. [pdf]
  • Justin, M., Hirci, N., Gantar, P. 2015. Rana ura, slovenskih fantov grob: analiza frazeoloških prenovitev v spletni slovenščini. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 33–37. [pdf]
  • Goli, T., Popič, D., Fišer, D. 2015. Velika in mala dilema pri imenih industrijskih izdelkov in znamk pri uradnih in zasebnih računih na družbenem omrežju Twitter. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 27–32. [pdf]
  • Erjavec, T., Fišer, D., Ljubešić, N. 2015. Razvoj korpusa slovenskih spletnih uporabniških vsebin Janes. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 20–26. [pdf]
  • Čibej, J., Ljubešić, N. 2015. »S kje pa si?« – Metapodatki o regionalni pripadnosti uporabnikov družbenega omrežja Twitter. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 10–14. [pdf]
  • Arhar Holdt, Š., Dobrovoljc, K. 2015. Zveze samostalnika z nesklonljivim levim prilastkom v korpusih Janes in Kres. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 4–9. [pdf]

Poglavja v monografskih publikacijah

  • Zwitter Vitez, A., Fišer, D. 2015. Novi mediji in govorjena slovenščina: zaznavanje, kodifikacija, analiza. Smolej, M. (ur.). OBDOBJA 34: Slovnica in slovar – aktualni jezikovni opis. Ljubljana: Znanstvena založba Filozofske fakultete, 881–890. [pdf]
  • Popič, D., Fišer, D. 2015. Vejica je mrtva, živela vejica. Smolej, M. (ur.). OBDOBJA 34: Slovnica in slovar – aktualni jezikovni opis. Ljubljana: Znanstvena založba Filozofske fakultete, 609–618. [pdf]
  • Pollak, S. 2015. Luščenje kolokacij iz korpusa uporabniških spletnih vsebin. Smolej, M. (ur.). OBDOBJA 34: Slovnica in slovar – aktualni jezikovni opis. Ljubljana: Znanstvena založba Filozofske fakultete, 601–607. [pdf]
  • Fišer, D., Erjavec, T., Ljubešić, N., Miličević, M. 2015. Comparing the nonstandard language of Slovene, Croatian and Serbian tweets. Smolej, M. (ur.). OBDOBJA 34: Slovnica in slovar – aktualni jezikovni opis. Ljubljana: Znanstvena založba Filozofske fakultete, 225–231. [pdf]
  • Fišer, D., Erjavec, T., Čibej, J., Ljubešić, N. 2015. Gradnja in analiza korpusa spletne slovenščine JANES. Smolej, M. (ur.). OBDOBJA 34: Slovnica in slovar – aktualni jezikovni opis. Ljubljana: Znanstvena založba Filozofske fakultete, 217–223. [pdf]
  • Erjavec, T., Čibej, J., Fišer, D. 2015. Pravna podlaga za zagotavljanje prostega dostopa korpusov spletnih besedil. Smolej, M. (ur.). OBDOBJA 34: Slovnica in slovar – aktualni jezikovni opis. Ljubljana: Znanstvena založba Filozofske fakultete, 193–199. [pdf]

Strokovne publikacije

  • Fišer, D. (ur.). 2015. Poletni raziskovalni tabor slovenščine Janes za srednješolce. Učna gradiva. 1. izd. Ljubljana: Znanstvena založba Filozofske fakultete Univerze v Ljubljani. [pdf]
  • Fišer, D. 2015. Raziskovalni tabor spletne slovenščine za srednješolce Janes. Slovenščina 2.0 (3/1), 59–61. [pdf]
  • Čibej, J. 2015. Delavnice JANES Ekspres za promocijo korpusnih in spletnih virov za slovenščino. Slovenščina 2.0, 3 (2), 63–66. [pdf]

2014

  • Fišer, D., T. Erjavec, A. Zwitter Vitez, N. Ljubešić. 2014. JANES se predstavi: metode, orodja in viri za nestandardno pisno spletno slovenščino. Zbornik Devete konference Jezikovne tehnologije. Ljubljana: Institut Jožef Stefan. [pdf]

Povezane publikacije projektne ekipe

  • Erjavec, T., D. Fišer. 2013. Jezik slovenskih tvitov: korpusna raziskava. Družbena funkcijskost jezika: (vidiki, merila, opredelitve), Obdobja 32. Ljubljana: Znanstvena založba Filozofske fakultete, 109–116. [pdf]
  • Erjavec, T., N. Ljubešić. 2014. The slWaC 2.0 Corpus of the Slovene Web. Zbornik Devete konference Jezikovne tehnologije. Ljubljana: Institut Jožef Stefan. [pdf]
  • Ljubešić, N., T. Erjavec, D. Fišer. 2014. Standardizing tweets with character-level machine translation. Computational linguistics and intelligent text processing: 15th International Conference, CICLing 2014, Kathmandu, Nepal, April 6-12, 2014: proceedings: part II, (Lecture notes in computer science, 8404). Heidelberg: Springer, 8404, 164–175. [pdf]
Scroll Up