JANES – Jezikoslovna analiza nestandardne slovenščine je nacionalni raziskovalni projekt (J6―6842), ki ga od 1. 7. 2014 do 30. 6. 2017 financira Javna agencija za raziskovalno dejavnost Republike Slovenije. Pri projektu, ki ga vodi Darja Fišer, sodeluje 8 raziskovalcev s Filozofske fakultete Univerze v Ljubljani in Instituta “Jožef Stefan”.

Cilj projekta je zgraditi obsežen korpus spletne slovenščine (iz besedil forumov, blogov, komentarjev na novice in tvitov), s pomočjo katerega bomo omogočili empirično podprto jezikoslovno analizo nestandardne spletne slovenščine, izboljšali jezikovnotehnološka orodja za obdelavo besedil, napisanih v nestandardnem jeziku, in izdelali slovarček spletne slovenščine.

Rezultati projekta bodo prosto dostopni pod licenco Creative Commons, priznanje avtorstva 4.0 in bodo olajšali proučevanje sodobne slovenščine ter omogočili razvoj robustnih jezikovnotehnoloških aplikacij za slovenščino, ki so nujne za ohranjanje polne funkcionalnosti slovenščine v digitalni dobi. Razvita metodologija bo uporabna tudi za sorodne jezike.

Projekt je razdeljen na tri vsebinske sklope:

  1. Gradnja korpusa spletne slovenščine
  2. Korpusna analiza spletne slovenščine
  3. Razvoj virov in orodij za procesiranje spletne slovenščine