Panel "Skrb za informacijsko izrazje"
XIII POSVETOVANJE SEKCIJE ZA RAZISKOVANJE INFORMACIJSKIH SISTEMOV
PRI ZVEZI EKONOMISTOV SLOVENIJE
Grimšče pri Bledu
4. februar 2000
Srečanje je organizirala mag. Katarina Puc, ki je tudi napisala
poročilo o panelu.
Tomaž Erjavec
Institut Jožef Stefan
Odsek za inteligentne sisteme
Podteza: Ker izdelava kvalitetnih in dostopnih slovarjev za
slovenščino ne more dohajati potreb, je rešitev v čim boljšji izrabi
obstoječih besedil, prevodov in slovarjev, ter v izkoriščanju teh
virov pri izdelavi novih slovarjev. Z uporabo jezikovnih tehnologij
lahko besedila nekega področja zajamemo, obdelamo in nato
predstavljamo in uporabljamo v različne namene: kot mrežno
bibliografijo, za iskanje besed in besedih zvez v kontekstu,
prevajaljstvo itd.
Tehnologija lahko prispeva k boljšemu izrazju s tem, da pomaga pri
objavljanju in razširjanju izrazja in povezovanju jezikovnega
bogastva.
Moto: ob knjigi Internet; namesto papirja, XML.
Par primerov:
- terminološki slovarčki
- iskanje po korpusu
- združevanje slovarja in korpusa
Tehnologija obstaja, viri obstajajo.
Kje so ovire:
- računalniški zapis
(originali različni in spreminjajoči, ob tem zahtevnost standardizacije)
- razvitost jezikovnih tehnologij za slovenščino
(pomanjkanje pravil in programov)
- cena / vložek dela
zbiranje, označevanje, urejanje, plasma, vzdrževanje
- avtorske pravice
nad besedili (Gradnik), oznakami (ZRC), slovarji (SSKJ),
način distribucije (ELRA); IPR, Š.
Terminologija za računalništvo in informatiko: dinamično prodročje;
glavni problem je sprotno prevajanja iz angleškega jezika,
npr.
'ogonek'
ali
'datamart'.
- Vloga društev:
- podpora vlade in EU (?)
- komercializacija : $$$
(licence nad viri in orodji, založniki,
EU, multinacionalke, Microsoft)
Pirati
Klasični pristop gradnje korpusa (npr. pri
korpusu FIDA):
- cilj, financiranje, projektna skupina
- ureditev avtorskih pravic: načini in pogoji dostopa
- pridobitev (digitalnih) izvirnikov
- konverzija v enoten standariziran zapis
- urejanje, označevanje, povezovanje
- pretvorba v ciljne formate
- uporaba: konkordance,
izdelava terminoloških geslovnikov,
povezovanje in združevanje z ostalimi viri,...
'Slovenski korpus računalništva in informatike'
Potencialni viri:
- zborniki področja
- lokalizacijske datoteke
- revije
Tomaž Erjavec,
2000-02-09