TWEET

kolofon TEI

§opis datoteke
§navedba naslova
§naslov

tip = main
Korpus Tweet-sl
§naslov

Slovenska sporočila na omrežju Twitter
§navedba odgovornosti
§ime Matija Rijavec
§odgovornost Zagotovitev sporočil s strežnika sitweet.com.
§navedba odgovornosti
§ime Tomaž Erjavec
§odgovornost Pretvorba v TEI P5, vključitev v konkordančnike.
§obseg 367,510 tweetov
§navedba objave
§distributer nl.ijs.si
§dostopnost

Korpus je dostopen preko konkordančnikov na nl.ijs.si

§opis vira

Korpus Tweet-sl vsebuje slovenska sporočila na socialnem omrežju Twitter od 2009-08-30 do 2011-02-16. Sporočila so bila zbrana na agregatorju sitweet.com.

§opis označevanja
§opis projekta

Korpus je bil narejen, da omogoči korpusne študije nad jezikom socilanih omrežij.

§načela označevanja
§imenski prostor

ime = http://www.tei-c.org/ns/1.0
§uporaba oznake

ime elementa = corpus pojavitev = 1
corpus
§uporaba oznake

ime elementa = u pojavitev = 367510
govorna izjava
§uporaba oznake

ime elementa = w pojavitev = 5021853
beseda
§uporaba oznake

ime elementa = pc pojavitev = 1269967
ločilo
§uporaba oznake

ime elementa = c pojavitev = 5158460
znak
§podatki o aplikaciji
§aplikacija

identifikator = ToTrTaLe
§napis

Jezikoslovna analiza: s, w, pc, c
§opis sprememb
§sprememba
§datum 2012-12-21
§ime Tomaž Erjavec
§napis Minor fixes in header.
§sprememba
§datum 2012-08-13
§ime Tomaž Erjavec
§napis Conversion of TWEET SQL database dump to TEI P5 and automatic linguistic analysis.


Datum: 2012-12-21

Avtorske pravice za besedilo te izdaje določa licenca Creative Commons Priznanje avtorstva 3.0.