Bibliografija projekta

2017

Monografija

  • Fišer, D., Beißwenger, M. (ur). 2017. Investigating Computer-Mediated Communication: Corpus-Based Approaches to Language in the Digital World. Ljubljana: University Press, Faculty of Arts. [pdf]

Prispevki v revijah

  • Beißwenger, M., Chanier, T., Erjavec, T., Fišer, D., Herold, A., Ljubešić, N., Lüngen, H., Poudat, C., Stemle, E., Storrer, A., Wigham, C. 2017. Closing a Gap in the Language Resources Landscape: Groundwork and Best Practices from Projects on Computer-mediated Communication in four European Countries. Selected papers from the CLARIN Annual Conference 2016. Aix-en-Provence, Francija. [pdf]

Prispevki na mednarodnih konferencah

  • Miličević, M., Ljubešić, N., Fišer, D. 2017. (Ne)standardni jezik Tvitera. Konferenca Jezici i kulture u vremenu i prostoru 7, November 2017, Novi Sad, Srbija.
  • Beißwenger, M., Wigham, C., Etienne, C., Suárez, H.G., Herzberg, L., Fišer, D., Hinrichs, E., Horsmann, T., Karlova-Bourbonus, N., Lemnitzen, L., Longhi, J., Lüngen, H., Ho-Dac, L.-M., Parisse, C., Poudat, C., Schmidt, T., Stemle, E., Storrer, A., Zesch, T. 2017. Connecting Resources: Which Issues Have to be Solved to Integrate CMC Corpora from Heterogeneou sSources and for Di erent Languages? Proceedings of the 5th Conference on CMC and Social Media Corpora for the Humanities (cmccorpora 17), oktober 2017, Eurac Research, Italija, 61-64. [pdf]
  • Kuzman, T., Fišer, D. 2017. Corpus-Based Analysis of Demonyms in Slovene Twitter. Proceedings of the 5th Conference on CMC and Social Media Corpora for the Humanities (cmccorpora 17), oktober 2017, Eurac Research, Italija, 61-64. [pdf]
  • Popič, D., Fišer, D. 2017. Fear and Loathing on Twitter: Attitudes towards Language. Proceedings of the 5th Conference on CMC and Social Media Corpora for the Humanities (cmccorpora 17), oktober 2017, Eurac Research, Italija, 61-64. [pdf]
  • Ljubešić, N., Erjavec, T., Fišer, D. 2017. Adapting a State-of-the-Art Tagger for South Slavic Languages to Non-Standard Text. Proceedings of the 6th Workshop on Balto-Slavic Natural Language Processing, 60-68. Valencija, Španija. [pdf]
  • Verhoeven, B., Škrjanec, I., Pollak, S. 2017. Gender Profiling for Slovene Twitter Communication: The Influence of Gender Marking, Content and Style. Proceedings of the 6th Workshop on Balto-Slavic Natural Language Processing, 119-125. Valencija, Španija. [pdf]
  • Gorjanc, V., Fišer, D. 2017. Twitter and power relations: The case of Slovenian equal marriage referendum campaign. Interdisciplinary Conference on Hate speech: Definitions, Interpretations and Practices. Nikozija, Grčija. [pdf]

Poglavja v monografskih publikacijah

  • Miličević, M., Ljubešić, N., Fišer, D. 2017. Birds of a feather don’t quite tweet together: An analysis of spelling variation in Slovene, Croatian and Serbian Twitterese. Fišer, D. & Beißwenger, M. (ur.). Investigating Computer-Mediated Communication: Corpus-Based Approaches to Language in the Digital World, 14-43. Ljubljana: University Press, Faculty of Arts. [pdf]
  • Fišer, D., Erjavec, T., Ljubešić, N. 2017. The compilation, processing and analysis of the Janes corpus of Slovene user-generated content. Wigham, C.R. &  Ledegen, G. (ur.). Corpus de communication médiée par les réseaux: construction, structuration, analyse. Collection Humanités Numériques. Paris: L’Harmattan. [draft]

Magistrska dela

  • Reher, Š. 2017. Slovenščina na prepihu: kodno preklapljanje v objavah slovenskih uporabnikov Twitterja. Magistrsko delo. Filozofska fakulteta Univerze v Ljubljani. [pdf]
  • Škrjanec, I. 2017. Gender-based analysis of Slovene user-generated content. Master thesis. Jožef Stefan Postgraduate School. [pdf]

2016

Prispevki v revijah

  • Arhar Holdt, Š., Dobrovoljc, K. 2016. Vrednost korpusa Janes za slovensko normativistiko. Slovenščina 2.0, 4 (2): 1–37. [pdf]
  • Fišer, D., Erjavec, T., Ljubešić, N. 2016. JANES v0.4: Korpus slovenskih spletnih uporabniških vsebin. Slovenščina 2.0, 4 (2): 67–99. [pdf]
  • Erjavec, T., Čibej, J., Fišer, D. 2016. Omogočanje dostopa do korpusov slovenskih spletnih besedil v luči pravnih omejitev. Slovenščina 2.0, 4 (2): 189–219. [pdf]
  • Sobočan, A. M., Pollak, S. 2016. Manifestacije moralne panike v medijskih podobah novele družinske zakonodaje. Časopis za kritiko znanosti, ISSN 0351-4285, 2016, letn. 44, št. 266, str. 163-187.

Prispevki na mednarodnih konferencah

  • Erjavec, T., Čibej, J., Arhar Holdt, Š., Ljubešić, N. Fišer, D. 2016. Gold-Standard Datasets for Annotation of Slovene Computer-Mediated Communication. Proceedings of the Tenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2016. Brno, Češka. [pdf]
  • Fišer, D., Ljubešić, N. 2016. Detecting Semantic Shifts in Slovene Twitterese. Proceedings of the Tenth Workshop on Recent Advances in Slavonic Natural Languages Processing, RASLAN 2016. Brno, Češka. [pdf]
  • Erjavec, T., Arhar Holdt, Š., Čibej, J., Dobrovoljc, K., Fišer, D., Laskowski, C., Zupan, K. 2016. Annotating CLARIN.SI TEI corpora with WebAnno. Proceedings of the CLARIN Annual Conference 2016. Aix-en-Provence, Francija. [pdf]
  • Beißwenger, M., Chanier, T., Chiari, I., Erjavec, T., Fišer, D., Herold, A., Ljubešić, N., Lüngen, H., Poudat, C., Stemle, E., Storrer, A., Wigham, C. 2016. Integrating corpora of computer-mediated communication into the language resources landscape: Initiatives and best practices from French, German, Italian and Slovenian projects. Proceedings of the CLARIN Annual Conference 2016. Aix-en-Provence, Francija. [pdf]
  • Čibej, J., Arhar Holdt, Š., Erjavec, T., Fišer, D. 2016. Razvoj učne množice za izboljšano označevanje spletnih besedil. Proceedings of the Language Technologies and Digital Humanities Conference. Ljubljana, Slovenia: 40–46. [pdf]
  • Fišer, D., Smailović, J., Erjavec, T., Mozetič, I., Grčar, M. 2016. Sentiment Annotation of Slovene User-Generated Content. Proceedings of the Language Technologies and Digital Humanities Conference. Ljubljana, Slovenia: 65–70. [pdf]
  • Gantar, P., Škrjanec, I., Fišer, D., Erjavec, T. 2016. Slovar tviterščine. Proceedings of the Language Technologies and Digital Humanities Conference. Ljubljana, Slovenia: 71–76. [pdf]
  • Goli, T., Osrajnik, O., Fišer, D. 2016. Analiza krajšanja slovenskih sporočil na družbenem omrežju Twitter. Proceedings of the Language Technologies and Digital Humanities Conference. Ljubljana, Slovenia: 77–82. [pdf]
  • Ljubešić, N., Fišer, D. 2016. Private or Corporate? Predicting User Types on Twitter. Proceedings 2016 The 2nd Workshop on Noisy User-generated Text (W-NUT). Osaka, Japonska. [pdf]
  • Ljubešić, N., Fišer, D. 2016. A Global Analysis of Emoji Usage.  Proceedings of the 10th Web as Corpus Workshop. Berlin, Nemčija. [pdf]
  • Ljubešić, N., Erjavec, T., Fišer, D., Samardžić, T., Miličević, M., Klubička, F., Petkovski, F. 2016. Easily Accessible Language Technologies for Slovene, Croatian and Serbian. Proceedings of the Language Technologies and Digital Humanities Conference. Ljubljana, Slovenia: 120–124. [pdf]
  • Popič, D., Fišer, D., Zupan, K., Logar, P. 2016. Raba vejice v uporabniških spletnih vsebinah. Proceedings of the Language Technologies and Digital Humanities Conference. Ljubljana, Slovenia: 149–153. [pdf]
  • Ljubešić, N., Zupan, K., Fišer, D., Erjavec, T. 2016. Normalising Slovene data: historical texts vs. user-generated content. Proceedings of the 13th Conference on Natural Language Processing (KONVENS 2016). Bochum, Germany: 146–155. [pdf]
  • Arhar Holdt, Š., Fišer, D., Erjavec, T., Krek, S. 2016. Syntactic Annotation of Slovene CMC: First Steps. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 3–6. [pdf]
  • Čibej, J. 2016. Framework for an Analysis of Slovene Regional Language Variants on Twitter. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 17–21. [pdf]
  • Fišer, D., Erjavec, T. 2016. Analysis of Sentiment Labeling of Slovene User-Generated Content. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 22–25. [pdf]
  • Ljubešić, N., Fišer, D. 2016. Slovene Twitter Analytics. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 39–43. [pdf]
  • Marko, D. 2016. The Use of Alphanumeric Symbols in Slovene Tweets. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 48–53. [pdf]
  • Škrjanec, I., Pollak, S. 2016. Topic Ontologies of the Slovene Blogosphere: A Gender Perspective. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 62–65. [pdf]
  • Zwitter Vitez, A., Fišer, D. 2016. Linguistic Analysis of Emotions in Online News Comments – an Example of the Eurovision Song Contest. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 74–76. [pdf]
  • Pesek, G., Škrjanec, I., Marko., D. 2016. Alternative Endings of Slovene Verbs in Third Person Plural: A Corpus Approach. Proceedings of the 4th Conference on CMC and Social Media Corpora for the Humanities. Ljubljana, Slovenia: 77–81. [pdf]
  • Čibej, J., Fišer, D., Erjavec, T. 2016. Normalisation, Tokenisation and Sentence Segmentation of Slovene Tweets. Proceedings of Normalisation and Analysis of Social Media Texts (NormSoMe) 2016, Language Resources and Evaluation Conference (LREC 2016). Portorož, Slovenia: 5–10. [pdf]
  • Ljubešić, N., Erjavec, T. 2016. Corpus vs. Lexicon Supervision in Morphosyntactic Tagging: The Case of Slovene. Proceedings of Language Resources and Evaluation Conference (LREC) 2016. Portorož, Slovenia, 1527–1531. [pdf]
  • Ljubešić, N., Erjavec, T., Fišer, D. 2016. Corpus-Based Diacritic Restoration for South Slavic Languages. Proceedings of Language Resources and Evaluation Conference (LREC) 2016. Portorož, Slovenia, 3612–3616. [pdf]

Strokovne publikacije

  • Arhar Holdt, Š. 2016. Spletna slovenščina pod drobnogledom dijakov in študentov. Slovenščina 2.0, 4(1). [pdf]
  • Čibej, J., Marko, D. 2016. Poletna šola korpusnega jezikoslovja v Lancastru. Slovenščina 2.0, 4(1). [pdf]
  • Čibej, J., Škrjanec, I. 2016. Seminarja o metodah korpusnega in eksperimentalnega jezikoslovja v Beogradu in Zagrebu. Slovenščina 2.0, 4(1). [pdf]
  • Fišer, D. (ur.) 2016. 1. poletna šola spletne slovenščine Janes za študente. Učna gradiva. 1.izd. Ljubljana: Znanstvena založba Filozofske fakultete Univerze v Ljubljani. [pdf]
  • Fišer, D. (ur.). 2016. 2. poletni raziskovalni tabor slovenščine Janes za srednješolce. Učna gradiva. 1. izd. Ljubljana: Znanstvena založba Filozofske fakultete Univerze v Ljubljani. [pdf]
  • Marko, D., Škrjanec, I., Čibej, J. 2016. 28. poletna šola jezika, logike in informatike ESSLLI  2016. Slovenščina 2.0, 4(2). [pdf]

2015

Prispevki na mednarodnih konferencah

  • Fišer, D., Ljubešić, N., Erjavec, T. 2015. The JANES corpus of Slovene user generated content: construction and annotation. International Research Days: Social Media and CMC Corpora for the eehumanities: Book of Abstracts. 23.-24. October 2015, Rennes, Francija: 11. [pdf]
  • Ljubešić, N., Fišer, D., Erjavec, T., Čibej, J., Marko, D., Pollak, S., Škrjanec, I. 2015. Predicting the level of text standardness in user-generated content. 1oth International Conference  on Recent Advances in Natural Language Processing: Proceedings of RANLP 2015 Conference, 7-9 September 2015, Hissar, Bulgaria. Hissar: 371–378. [pdf]
  • Čibej, J., Fišer, D., Kosem, I. 2015. The role of crowdsourcing in lexicography.  Electronic lexicography in the 21st century: linking lexical data in the digital age: proceedings of eLex 2015 Conference, 11-13 August 2015, Herstmonceux Castle, United Kingdom. Ljubljana: Trojina, Institute for Applied Slovene Studies, Brighton: Lexical Computing, 2015, 70–83. [pdf]
  • Zwitter Vitez, A., Fišer, D. 2015. From mouth to keyboard: the place of non-canonical written and spoken structures in lexicography. Electronic lexicography in the 21st century: linking lexical data in the digital age: proceedings of eLex 2015 Conference, 11-13 August 2015, Herstmonceux Castle, United Kingdom. Ljubljana: Trojina, Institute for Applied Slovene Studies, Brighton: Lexical Computing, 2015, 250–267. [pdf]

Prispevki na domačih konferencah

  • Zwitter Vitez, A., Fišer, D. 2015. Elementi interakcije v govorjenih in spletnih besedilih. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 87–90. [pdf]
  • Vintar, Š. 2015. Terminologija v spletnih forumih. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 69–74. [pdf]
  • Škrjanec, I., Popič, D., Fišer, D. 2015. Arheologija začetnice pri stvarnih lastnih imenih. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 80–86. [pdf]
  • Rebernik, T. 2015. Slovenščina pod palcem interneta: vezajne in dvozačetniške e-tvorjenke. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 63–68. [pdf]
  • Pollak, S. 2015. Identifikacija spletno specifičnih kolokacij pogostega besedišča. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 57–56. [pdf]
  • Osrajnik, E., Fišer, D., Popič, D. 2015. Primerjava rabe ekspresivnih ločil v tvitih slovenskih uporabnikov in uporabnic. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 50–74. [pdf]
  • Justin, M., Hirci, N., Gantar, P. 2015. Rana ura, slovenskih fantov grob: analiza frazeoloških prenovitev v spletni slovenščini. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 33–37. [pdf]
  • Goli, T., Popič, D., Fišer, D. 2015. Velika in mala dilema pri imenih industrijskih izdelkov in znamk pri uradnih in zasebnih računih na družbenem omrežju Twitter. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 27–32. [pdf]
  • Erjavec, T., Fišer, D., Ljubešić, N. 2015. Razvoj korpusa slovenskih spletnih uporabniških vsebin Janes. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 20–26. [pdf]
  • Čibej, J., Ljubešić, N. 2015. »S kje pa si?« – Metapodatki o regionalni pripadnosti uporabnikov družbenega omrežja Twitter. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 10–14. [pdf]
  • Arhar Holdt, Š., Dobrovoljc, K. 2015. Zveze samostalnika z nesklonljivim levim prilastkom v korpusih Janes in Kres. Fišer, D. (ur.). Zbornik konference Slovenščina na spletu in v novih medijih. Ljubljana: Znanstvena založba Filozofske fakultete, 4–9. [pdf]

Poglavja v monografskih publikacijah

  • Zwitter Vitez, A., Fišer, D. 2015. Novi mediji in govorjena slovenščina: zaznavanje, kodifikacija, analiza. Smolej, M. (ur.). OBDOBJA 34: Slovnica in slovar – aktualni jezikovni opis. Ljubljana: Znanstvena založba Filozofske fakultete, 881–890. [pdf]
  • Popič, D., Fišer, D. 2015. Vejica je mrtva, živela vejica. Smolej, M. (ur.). OBDOBJA 34: Slovnica in slovar – aktualni jezikovni opis. Ljubljana: Znanstvena založba Filozofske fakultete, 609–618. [pdf]
  • Pollak, S. 2015. Luščenje kolokacij iz korpusa uporabniških spletnih vsebin. Smolej, M. (ur.). OBDOBJA 34: Slovnica in slovar – aktualni jezikovni opis. Ljubljana: Znanstvena založba Filozofske fakultete, 601–607. [pdf]
  • Fišer, D., Erjavec, T., Ljubešić, N., Miličević, M. 2015. Comparing the nonstandard language of Slovene, Croatian and Serbian tweets. Smolej, M. (ur.). OBDOBJA 34: Slovnica in slovar – aktualni jezikovni opis. Ljubljana: Znanstvena založba Filozofske fakultete, 225–231. [pdf]
  • Fišer, D., Erjavec, T., Čibej, J., Ljubešić, N. 2015. Gradnja in analiza korpusa spletne slovenščine JANES. Smolej, M. (ur.). OBDOBJA 34: Slovnica in slovar – aktualni jezikovni opis. Ljubljana: Znanstvena založba Filozofske fakultete, 217–223. [pdf]
  • Erjavec, T., Čibej, J., Fišer, D. 2015. Pravna podlaga za zagotavljanje prostega dostopa korpusov spletnih besedil. Smolej, M. (ur.). OBDOBJA 34: Slovnica in slovar – aktualni jezikovni opis. Ljubljana: Znanstvena založba Filozofske fakultete, 193–199. [pdf]

Strokovne publikacije

  • Fišer, D. (ur.). 2015. Poletni raziskovalni tabor slovenščine Janes za srednješolce. Učna gradiva. 1. izd. Ljubljana: Znanstvena založba Filozofske fakultete Univerze v Ljubljani. [pdf]
  • Fišer, D. 2015. Raziskovalni tabor spletne slovenščine za srednješolce Janes. Slovenščina 2.0 (3/1), 59–61. [pdf]
  • Čibej, J. 2015. Delavnice JANES Ekspres za promocijo korpusnih in spletnih virov za slovenščino. Slovenščina 2.0, 3 (2), 63–66. [pdf]

2014

  • Fišer, D., T. Erjavec, A. Zwitter Vitez, N. Ljubešić. 2014. JANES se predstavi: metode, orodja in viri za nestandardno pisno spletno slovenščino. Zbornik Devete konference Jezikovne tehnologije. Ljubljana: Institut Jožef Stefan. [pdf]

Povezane publikacije projektne ekipe

  • Erjavec, T., D. Fišer. 2013. Jezik slovenskih tvitov: korpusna raziskava. Družbena funkcijskost jezika: (vidiki, merila, opredelitve), Obdobja 32. Ljubljana: Znanstvena založba Filozofske fakultete, 109–116. [pdf]
  • Erjavec, T., N. Ljubešić. 2014. The slWaC 2.0 Corpus of the Slovene Web. Zbornik Devete konference Jezikovne tehnologije. Ljubljana: Institut Jožef Stefan. [pdf]
  • Ljubešić, N., T. Erjavec, D. Fišer. 2014. Standardizing tweets with character-level machine translation. Computational linguistics and intelligent text processing: 15th International Conference, CICLing 2014, Kathmandu, Nepal, April 6-12, 2014: proceedings: part II, (Lecture notes in computer science, 8404). Heidelberg: Springer, 8404, 164–175. [pdf]
Scroll Up