Raèunalniški korpusi
Kaj je raèunalniški korpus?
(raèunalniški) korpus:
urejena zbirka besedil, hranjena in obdelana na raèunalniku.
Tipologija
- Kriteriji:
- kolièina; kakovost (avtentiènost);
enostavnost (ASCII); dokumentiranost.
- Razredi:
-
- referenèni
(osnova: jezikovni standard)
Brown, BNC, Bank of English (100M)
- govorni & govorjen
(avtentiènost)
Map-Task (HCRC): 18 ur, dialog
- podjezikovni
(omejeni in specializirani)
ATC0 (Texas Instruments): 70 ur, stolp-zrak
- vzorèni
(zgodovinski / pravni razlogi)
Brown
- spremljevalni
(jezik v spreminjanju)
periodika (Internet)
- primerljiv
(prevajanje)
ECI/MCI: 27 jezikov, 92M
- vzporedni
(prevajanje)
Hansard: kanadski parlament
Rast
- Referenèni: Brown (1M) '64 ... LOB (1M) '74 ... BNC, BoE (100M) '95
- Drugi 'angleški': Sussane, Hansard, ...
- Jeziki EU:
nemški, francoski, španski, švedski, ...
- Vzhodno-evropski jeziki: estonski, romunski, èeški, ruski, ...
- Iniciative EU: ECI/MCI, Eagles, Relator, ELRA
ElsNet, Copernicus
- Slovenija:
Jože Toporišiè, urednik:
Besedila slovenskega jezika.
Ljubljana : Filozofska fakulteta, 1975.
MULTEXT-East Korpus
[nazaj]
et, 1 december 1996.