Panel "Skrb za informacijsko izrazje"

XIII POSVETOVANJE SEKCIJE ZA RAZISKOVANJE INFORMACIJSKIH SISTEMOV PRI ZVEZI EKONOMISTOV SLOVENIJE

Grimšče pri Bledu
4. februar 2000


Srečanje je organizirala mag. Katarina Puc, ki je tudi napisala poročilo o panelu.



Tomaž Erjavec
Institut Jožef Stefan
Odsek za inteligentne sisteme

Podteza: Ker izdelava kvalitetnih in dostopnih slovarjev za slovenščino ne more dohajati potreb, je rešitev v čim boljšji izrabi obstoječih besedil, prevodov in slovarjev, ter v izkoriščanju teh virov pri izdelavi novih slovarjev. Z uporabo jezikovnih tehnologij lahko besedila nekega področja zajamemo, obdelamo in nato predstavljamo in uporabljamo v različne namene: kot mrežno bibliografijo, za iskanje besed in besedih zvez v kontekstu, prevajaljstvo itd.

Tehnologija lahko prispeva k boljšemu izrazju s tem, da pomaga pri objavljanju in razširjanju izrazja in povezovanju jezikovnega bogastva.

Moto: ob knjigi Internet; namesto papirja, XML.

Par primerov:

  1. terminološki slovarčki
  2. iskanje po korpusu
  3. združevanje slovarja in korpusa

Tehnologija obstaja, viri obstajajo.

Kje so ovire:

Terminologija za računalništvo in informatiko: dinamično prodročje; glavni problem je sprotno prevajanja iz angleškega jezika, npr. 'ogonek' ali 'datamart'.

Klasični pristop gradnje korpusa (npr. pri korpusu FIDA):

  1. cilj, financiranje, projektna skupina
  2. ureditev avtorskih pravic: načini in pogoji dostopa
  3. pridobitev (digitalnih) izvirnikov
  4. konverzija v enoten standariziran zapis
  5. urejanje, označevanje, povezovanje
  6. pretvorba v ciljne formate
  7. uporaba: konkordance, izdelava terminoloških geslovnikov, povezovanje in združevanje z ostalimi viri,...

'Slovenski korpus računalništva in informatike'

Potencialni viri:


Tomaž Erjavec, 2000-02-09