§opis vira |
Korpus slWaC vsebuje besedila zajeta z HTML strani, ki so bile pajkane (pretežno)
z domene .si.
Korpus je razširjena različica korpusa slWaC, ki je opisan v :
Nikola Ljubešić and
Tomaž Erjavec:
hrWaC and slWac: Compiling Web Corpora for Croatian and Slovene.
Text, Speech and Dialogue 2011. Lecture Notes in Computer Science vol. 9743, 395-402
Springer.
|