Serbian Language Integration in Prolexbase Multilingual Dictionary | Integracija srpskog jezika u višejezični rečnik Prolexbase |
INFOtheca, Scientific paper [pdf] | INFOteka, Naučni rad [pdf] [WikiData] |
ID: 1.2018.2.2 Number: 2 Volume: 18 Year: 2018 UDC: 811.163.41’322.2 [tmx] [bow] |
Cvetana Krstev Institution: University of Belgrade, Faculty of Philology Mail: cvetana@matf.bg.ac.rs | Cvetana Krstev Institucija: Univerzitet u Beogradu, Filološki fakultet E-pošta: cvetana@matf.bg.ac.rs |
Deni Morel Institution: University of Tours, France Mail: denis.maurel@univ-tours.fr | Deni Morel Institucija: Univerzitet u Turu, Francuska E-pošta: denis.maurel@univ-tours.fr |
Duško Vitas Institution: University of Belgrade Faculty of Mathematics, Serbia Mail: vitas@matf.bg.ac.rs | Duško Vitas Institucija: Univerzitet u Beogradu Matematički fakultet, Srbija E-pošta: vitas@matf.bg.ac.rs |
Abstract In this paper we present the multilingual dictionary of proper names Prolexbase, particularly the Serbian volume. We also present the complexity of proper names in the Serbian language, especially those related to their translation: their orthography, derivation, inflection and dialect variations. We describe the model of the Prolexbase, with the emphasize on the solutions that had to be made to include the Serbian language in the database (the use of two alphabets, several levels of derivations, the existence of multiple forms). At the end, we give some figures that corroborate the presence of the Serbian language in the Prolexbase. | Apstrakt Ovaj rad predstavlja višejezični rečnik vlastitih imena Prolexbase, posebno njegov srpski deo. Predstavljena je kompleksnost vlastitih imena u srpskom jeziku, posebno odlike koje se tiču njihovog prevođenja: pravopis, derivacija, flektivne promene i dijalekatske varijacije. Opisuje se model baze \textit{Prolex}, sa posebnim osvrtom na rešenja neophodna za integraciju u nju srpskog jezika (korišćenje dva pisma, više nivoa derivacije, postojanje višestrukih oblika). Na kraju se daju neki brojčani podaci koji pokazuju srpski jezik u bazi Prolex. |
Keywords: proper names, multilingual database, ontology of proper names, LMF format, Serbian language, Prolexbase | Ključne reči: paralelizovani korpus, domenski korpus, terminologija, terminološka jedinica, menadžment |
Pages: 29-52 | Strane: 32-56 |
Publishing place: Publisher: Publishing year: | Mesto izdanja: Izdavač: Godina izdanja: |
Translator: | Prevodilac: |