(in English)

jaSlo: Japonsko-slovenski viri za učenje japonščine

Na tej strani najdete pripomočke za učenje japonščine kot drugega oz. tujega jezka, ki so bili narejeni v sodelovanju Oddelka za azijske študije na Univerzi v Ljubljani in Odseka za tehnologije znanja Instituta "Jožef Stefan":

  1. japonsko-slovenski slovar jaSlo
  2. slovensko-japonski slovar sloJa
  3. korpusi:
    1. vzporedni korpus jaSlo
    2. spletni korpus jpWaC-L
    3. korpusne oznake
  4. literatura
  5. zahvala
  6. povezave

Japonsko-slovenski slovar jaSlo

Slovar jaSlo za slovenske učence japonsščine vsebuje skoraj 10.000 vnosov. Več informacij o strukturi, vsebini in obliki slovarja najdete v kolofonu.

preko maske v jeziku: slovenščina 日本語 English

Slovensko-japonski slovar sloJa

Slovensko-japonski spletni slovar za slovensko govoreče je bil narejen iz podatkov slovarja jaSlo 3.1 tako, da smo ga strojno obrnili v grob slovensko-japonski slovar, iz gesel najprej avtomatsko in nato ročno izločili dvojnike in neprimerne iztočnice, gesla dopolnili s slovenskimi besednimi vrstami in stopnjo težavnosti po lestvici SEJO, kot jo navaja Jedrno besedišče slovenščine, nato pa gesla ročno uredili z orodjem Lexonomy.

Geslom z več prevodnicami smo dodali namige o pomenu posameznih japonskih prevodnic, delno tudi primere rabe v obeh jezikih, ki smo jih pridobili iz vzporednega korpusa jaSlo, in jih ročno priredili za slovarsko rabo. Ročno smo japonskim sinonimom iz različnih registrov dodali tudi pragmatične oznake (spoštljivo, ponižno, vljudno ipd.) in opombe o omejitvah pri rabi besed, ki so namenjene uporabnikom slovarja, ki se učijo japonščine kot tujega jezika.

Slovar je za brskanje dostopen na https://www.lexonomy.eu/#/sloJa, za prevzem pa v repozitoriju CLARIN.SI pod licenco CC-BY 4.0 na http://hdl.handle.net/11356/1898.

Korpusi japonskega jezika

Vzporedni korpus jaSlo

Japonsko-slovenski vzporedni korpus jaSlo z okoli pol milijona besed po jeziku (130 virov) je stavčno poravnan in vsebuje japonska besedila in njihove prevode v slovenščino ali obratno oziroma prevode v japonščino in slovenščino iz tretjih jezikov.

Korpus je dostopen prek konkordančnika CLARIN.SI noSketch Engine:

Spletni korpus jpWaC-L

V spletnem korpusu japonskega jezika jpWaC-L (z več kot 300 milijonov besed) so stavki in besede označeni s težavnostnimi stopnjami. Nadalje je korpous razdeljen na 5 podkorpusov, od katerih vsak vsebuje samo stavke določene težavnostne stopnje, od 4 (najlažje) do 0 (najtežje).

Težavnostne stopnje besed so vzete iz besedišča, ki ga je prijazno prispevala prof. Yoshiko Kawamura, Tokyo International University. Težavnostne stopnje besed so povzete po stopnjah težavnosti v seznamu besedišča za izpit iz japonščine kot tujega jezika (Japan Foundation & Association of International Education Japan. Japanese Language Proficiency Test: Test Content Specifications, Revised Edition. Tokyo: Bonjinsha 2004). Težavnostne stopnje stavkov so izračunane s pomočjo raznih hevristik, ki za osnovo vzamejo težavnostno stopnjo besed, dolžino stavka, itd. (glej Hmeljak et al. 2010)

Korpus je dostopen za prevzem z repozitorija CLARIN.SI prek stalnega naslova URL hdl.handle.net/11356/1047, kot tudi za analizo prek CLARIN.SI of noSketch Engine, tudi razdeljen na posamezne težavnostne stopnje:

Korpusne oznake

Slovenski deli korpusov so bili oblikoskladenjsko označeni in lematizirani s programom ToTaLe, japonski pa s programom ChaSen. Oznake programa ChaSen, ki so izvorno zapisane v japonščini, so bile pretvorjene v oznake, ki temeljijo na angleškem jeziku. V konkordančnikih so oznake ChaSen-jp (v japonskem jeziku) zapisane v atribut "ctag", ChaSen-en pa v atributu "tag". Spodnja tabela poda preslikavo (dostopna je tudi kot tabelarična datoteka):

nChaSen-jp
ctag
ChaSen-en
tag
ExpandedExamples
1名詞NNoun
2名詞-一般N.gNoun(general)ソナタ,年上,耳,好き
3名詞-固有名詞N.PropNoun(proper)
4名詞-固有名詞-一般N.Prop.gNoun(proper.general)イスラム教,光が丘…
5名詞-固有名詞-人名N.Prop.nNoun(proper.name)
6名詞-固有名詞-人名-一般N.Prop.n.gNoun(proper.name.general)お市の方(おいちのかた),太安万侶(おおのやすまろ)
7名詞-固有名詞-人名-姓N.Prop.n.sNoun(proper.name.surname)山田
8名詞-固有名詞-人名-名N.Prop.n.fNoun(proper.name.firstname)紀子,ひろし
9名詞-固有名詞-組織N.Prop.oNoun(proper.organization)NHK, 愛知銀行,パレスホテル…
10名詞-固有名詞-地域N.Prop.pNoun(proper.place)
11名詞-固有名詞-地域-一般N.Prop.p.gNoun(proper.place.general)京都,アジア
12名詞-固有名詞-地域-国N.Prop.p.cNoun(proper.place.country)日本,オーストリア
13名詞-代名詞N.PronNoun(pronoun)
14名詞-代名詞-一般N.Pron.gNoun(pronoun.general)私,誰,奴ら,あそこ,あちこち,それ
15名詞-代名詞-縮約N.Pron.shNoun(pronoun.shorten)あたしゃ,そりゃ,そりゃあ,私しゃ
16名詞-副詞可能N.AdvNoun(adverbal)いつか,あまり,9月,いちばん,きのう,この先
17名詞-サ変接続N.VsNoun(verbal)見学する,我慢する…
18名詞-形容動詞語幹N.AnaNoun(adjective -na)あいまい,安全,黄色,気の毒,気がかり,楽天的
19名詞-数N.NumNoun(numeral)何,四,億,1
20名詞-非自立N.bndNoun(bound)
21名詞-非自立-一般N.bnd.gNoun(bound.general)作,きらい,ため,どころ,こと
22名詞-非自立-副詞可能N.bnd.AdvNoun(bound.adverb)っきり,折り,うち,あいだ,あたり,あまり
23名詞-非自立-助動詞語幹N.bnd.AuxNoun(bound.auxiliary)よう,様, やう,よ
24名詞-非自立-形容動詞語幹N.bnd.AnaNoun(bound.adjective -na)みたい,ふう
25名詞-特殊-N.specNoun(special)
26名詞-特殊-助動詞語幹N.spec.AuxNoun(special.auxiliary)そ,そう
27名詞-接尾N.SuffNoun(suffix)
28名詞-接尾-一般N.Suff.gNoun(suffix.general)OFF,あまり,ごころ,がわり,印
29名詞-接尾-人名N.Suff.nNoun(suffix.name)さん,氏,君
30名詞-接尾-地域N.Suff.pNoun(suffix.place)駅,区
31名詞-接尾-サ変接続N.Suff.VsNoun(suffix.verbal)化,話,分け
32名詞-接尾-助動詞語幹N.Suff.AuxNoun(suffix.auxiliary)そ,そう
33名詞-接尾-形容動詞語幹N.Suff.AnaNoun(suffix.adjective -na)がち,好き,同然,薄(うす),気(げ),的
34名詞-接尾-副詞可能N.Suff.AdvNoun(suffix.adverb)いっぱい,ころ,時
35名詞-接尾-助数詞N.Suff.msrNoun(suffix.measure)人,条,ミリバール
36名詞-接尾-特殊N.Suff.specNoun(suffix.specific)方,たて
37名詞-接続詞的N.ConjNoun(conjunction)兼,対,VS
38名詞-動詞非自立的N.V.bndNoun(verbal.bound)ごらん,御覧,ご覧,ちょ,ちょうだい,頂戴
39名詞-引用文字列N.PhrNoun(phrase)いわく
40名詞-ナイ形容詞語幹N.naiNoun(+nai)味気,申し訳,まちがい
41接頭詞PrefPrefix
42接頭詞-名詞接続Pref.NPrefix(+noun)いま,ふた¸まっ無,両,好(こう)…
43接頭詞-動詞接続Pref.VPrefix(+verb)引き,御
44接頭詞-形容詞接続Pref.AiPrefix(+adjective -i)お,バカ, 超,真っ…
45接頭詞-数接続Pref.NumPrefix(+numeral)No.,およそ,総, 約
46動詞VVerb
47動詞-自立V.freeVerb(free)つける,書く…
48動詞-非自立V.bndVerb(bound)始める,もらう,願える,らっしゃる…
49動詞-接尾V.SuffVerb(suffix)がかる,がる,さす,させる,しめる,す,せる,られる,れる
50形容詞AiAdjective –i
51形容詞-自立Ai.freeAdjective –i(free)近い, 苦い
52形容詞-非自立Ai.bndAdjective -i(bound)イイ,いい,難い,づらい,にくい,欲しい,やすい,良い,よい
53形容詞-接尾Ai.SuffAdjective -i(suffix)くさい,臭い(くさい),たらしい,ったらしい,っぽい,深い(ぶかい),ぽい
54副詞AdvAdverb
55副詞-一般Adv.gAdverb(general)力一杯,余り,要は,由来
56副詞-助詞類接続Adv.PAdverb(+particle)余りに,当然,度々,あんなに
57連体詞AdnAdnominal あの,あんな,おなじ,おおきな
58接続詞ConjConjunction例えば,それなのに,したら,あるいは,おなじく
59助詞PParticle
60助詞-格助詞P.cParticle(case)
61助詞-格助詞-一般P.c.gParticle(case.general)から,が,で,と,に,にて,の,へ,より,を,ん
62助詞-格助詞-引用P.c.rParticle(case.reported)と, っと
63助詞-格助詞-連語P.c.PhrParticle(case.phrase)という,って,について,をもって, に対して…
64助詞-接続助詞P.ConjParticle(conjunction)および,けれども,が
65助詞-係助詞P.bindParticle(binding)こそ,さえ,しか,すら,ぞ,は,も,や
66助詞-副助詞P.Advpartice(adverbial)だけ,ばかり
67助詞-間投助詞P.indParticle(indirect)(松島)や
68助詞-並立助詞P.coordParticle(coordinate)たり,だの,だり,と,とか,なり,や,やら
69助詞-終助詞P.finParticle(sentencefinal)かしら,さ,なあ
70助詞-副助詞/並立助詞/終助詞P.advcoordfinParticle(adverbial/coordinate/sentencefinal)
71助詞-連体化P.prenomParticle(pronominal)
72助詞-副詞化P.advzerParticle(adverbializer)と,に
73助詞-特殊P.specParticle(special)かな,けむ,に,にゃ,ん
74助動詞AuxAuxiliaryまい,たり,たい,っす, じゃん
75感動詞InterjPhrase/Interjectionご苦労さま
76記号SymSymbol? : ; ※ A B c
77記号-一般Sym.gSymbol(general)
78記号-句点Sym.pSymbol(period)
79記号-読点Sym.cSymbol(dotincenter)
80記号-空白Sym.wSymbol(whitespace)
81記号-アルファベットSym.aSymbol(alphabet)
82記号-括弧開Sym.boSymbol(bracketopen)
83記号-括弧閉Sym.bcSymbol(bracketclose)
84その他OtherOther
85その他-間投Other.indirOther(indirect)
86フィラーFillFillerあ,うん,そうですね,まあ,あの,なんか
87非言語音NssNonspeechsound
88語断片FrgmFragment
89未知語UnknownUnknown

Literatura

  1. HMELJAK SANGAWA, Kristina, ERJAVEC, Tomaž. The Japanese-Slovene dictionary jaSlo: its developments, enhancement and use. Studia Kognitiva, 2010, no. 10, str. 211-224. [PDF]
  2. HMELJAK SANGAWA, Kristina, ERJAVEC, Tomaž, KAWAMURA, Yoshiko. Automated Collection of Japanese Word Usage Examples from a Parallel and a Monolingual Corpus. V: eLexicography in the 21st century : new challenges, new applications: proceedings of eLex 2009, Louvain-la-Neuve, 22 - 24 October 2009, (Cahiers du Cental, 7). Louvain: Presses Universitaires de Louvain, 2010, str. 137-147. [PDF]
  3. HMELJAK SANGAWA, Kristina, ERJAVEC, Tomaž. A low cost approach to building a Japanese-Slovene parallel corpus. 電子情報通信学会技術研究報告 - IEICE Technical Report (Denshi Jōhō Tsūshin Gakkai gijutsu kenkyū hōkoku), 2008, vol. 108, no. 50, pp. 7-10.
  4. KAWAMURA, Yoshiko, HMELJAK SANGAWA, Kristina, ERJAVEC, Tomaž. Web kôpasu o katsuyô shita reberubetsu reibun kensaku shisutemu no kaihatsu to hyôka. V: OKOMURA, Minako (ur.), MIWA, Sei (ur.). Dai 14kai Yôroppa Nihongo kyôiku shimpojiumu hôkoku-happyô rombunshû, (Yôroppa Nihongo kyôiku, 14). [Berlin]: Yôroppa nihongo kyôshikai: =Association of Japanese Language Teachers in Europe, 2009, str. 231-238
  5. SRDANOVIĆ, Irena, ERJAVEC, Tomaž, KILGARRIFF, Adam. A web corpus and word sketches for Japanese. Shizen gengo shori, 2008, vol. 15, no. 2, str. 137-159. [PDF]
  6. HMELJAK SANGAWA, Kristina, ERJAVEC, Tomaž. Gakushoushayou nihongo jisho no tame no taizaku reibun kakutoko. V: The Fourteenth Annual Meeting of The Association for Natural Language Processing, 21 March 2008, University of Tokyo. Proceedings of the Workshop on Natural Language Processing for Education. [S. l.]: The Association for Natural Language Processing, 2008, str. 19-22.
  7. HMELJAK SANGAWA, Kristina, ERJAVEC, Tomaž. Črpanje primerov za japonsko-slovenski slovar iz vzporednega korpusa. V: ERJAVEC, Tomaž (ur.), ŽGANEC GROS, Jerneja (ur.). Zbornik Šeste konference Jezikovne tehnologije, 16. do 17. oktober 2008, : zbornik 11. mednarodne multikonference Informacijska družba - IS 2008, zvezek C : proceedings of the 11th International Multiconference Information Society - IS 2008, volume C, (Informacijska družba). Ljubljana: Institut Jožef Stefan, 2008, str. 33-36
  8. ERJAVEC, Tomaž, HMELJAK SANGAWA, Kristina, SRDANOVIĆ, Irena. jaSlo, A Japanese-Slovene Learners' Dictionary: Methods for Dictionary Enhancement. In Proceedings of the 12th EURALEX International Congress. Turin, Italy, 2006. [PDF]
  9. ERJAVEC, Tomaž, HMELJAK SANGAWA, Kristina, SRDANOVIĆ, Irena, VAHČIČ, Anton Ml. Making an XML-based Japanese-Slovene Learners' Dictionary. In Proceedings of Fourth International Conference on Language Resources and Evaluation, LREC'04, 26-28 May 2004. Lisbon.
  10. ERJAVEC, Tomaž, HMELJAK SANGAWA, Kristina, SRDANOVIĆ, Irena. XML zapis japonsko-slovenskega slovarja. V Zborniku 12. Mednarodne elektrotehnične in računalniške konference ERK 2003, 25-26 September 2003, Ljubljana, str. 471-474.
  11. HMELJAK SANGAWA, Kristina. Slovar japonskega jezika za študente japonščine. V Zborniku Konference o jezikovnih tehnologijah, SDJT'02, 14-15 October 2002, Ljubljana: Inštitut Jožef Stefan, 2002, str. 102-105.

Zahvala

Delo Kristine Hmeljak Sangawa na slovarju je od marca do julija 2005 podprla Japonska fundacija s štipendijo Programa za učenje japonskega jezika, delo Tomaža Erjavca na spletnem korpusu in prilagoditvi slovarja za vključitev v sistem Reading Tutor pa novembra 2008 štipendija JSPS. Urejanje slovensko-japonskega slovarja sloJa je podprl CLARIN.SI.

Povezave


Zadnja sprememba 2024-09-20, et