JANES – Jezikoslovna analiza nestandardne slovenščine je nacionalni raziskovalni projekt (J6―6842), ki ga je od 1. 7. 2014 do 1. 2. 2018 financirala Javna agencija za raziskovalno dejavnost Republike Slovenije. Pri projektu, ki ga je vodila Darja Fišer, so sodelovali raziskovalci s Filozofske fakultete Univerze v Ljubljani in Instituta “Jožef Stefan”.

Cilj projekta je bil zgraditi obsežen korpus spletne slovenščine (iz tvitov, besedil forumov, komentarjev na novice, blogov in pogovornih strani na Wikipediji), s pomočjo katerega smo omogočili empirično podprte jezikoslovne analize nestandardne spletne slovenščineizboljšanje jezikovnotehnoloških orodij za obdelavo besedil, napisanih v nestandardnem jeziku, in izdelali slovarček spletne slovenščine.

Rezultati projekta so prosto dostopni pod licenco Creative Commons, priznanje avtorstva 4.0 in lako olajšajo proučevanje sodobne slovenščine ter omogočijo razvoj robustnih jezikovnotehnoloških aplikacij za slovenščino, ki so nujne za ohranjanje polne funkcionalnosti slovenščine v digitalni dobi. Razvita metodologija je uporabna tudi za sorodne jezike.

Projekt je bil razdeljen na tri vsebinske sklope:

  1. Gradnja korpusa spletne slovenščine
  2. Korpusna analiza spletne slovenščine
  3. Razvoj virov in orodij za procesiranje spletne slovenščine