hrwac
kolofon TEI
§
opis datoteke
§
navedba naslova
§
naslov
Korpus hrWaC (hrvaški splet)
§
navedba odgovornosti
§
ime
Nikola Ljubešić
§
navedba odgovornosti
§
ime
Tomaž Erjavec (IJS)
§
navedba izdaje
§
izdaja
V2.2
§
obseg
§
termin
700 milijonov pojavnic, 3.611.090 besedil
§
navedba objave
§
datum
2016-06-13
§
kraj objave
http://nlp.ffzg.hr/resources/corpora/hrwac/
§
dostopnost
§
opis vira
§
opis označevanja
§
uredniška načela
§
segmentacija
§
interpretacija
§
načela vzorčenja
This version of the corpus is paragraph deduplicated.
§
opis značilnosti besedila
§
uporaba jezikov
§
jezik
identifikator
=
hr
§
termin
hrvaščina
§
opis sprememb
§
sprememba
§
datum
2016-06-13
Tomaž Erjavec
<
ime
>
: Introduced new CMC MSDs (Xe, Xw, Xh, Xa) and corrected some wrong Adverb MSDs.
§
sprememba
§
datum
2016-05-11
Tomaž Erjavec
<
ime
>
: Made teiHeader and vertical file.