En/De/Fr/It- (first 9 out of 13 sentences)
[pdf] |
Srpski - (prvih 9 od 13 rečenica)
[pdf]
|
n1 | Nikola Janković | n1 | Nikola Janković |
n2 | Filološki fakultet, Univerzitet u Beogradu | n2 | Filološki fakultet, Univerzitet u Beogradu |
n3 | nikolajankovickv@gmail.com | n3 | nikolajankovickv@gmail.com |
n4 | METHODOLOGY FOR CREATING A MULTILINGUAL PARALLEL CORPUS BASED ON ONLINE DIGITAL USER MANUALS: THE HILTI USER MANUALS CORPUS | n4 | METODOLOGIJA IZRADE VIŠEJEZIČNOG PARALELNOG KORPUSA NA OSNOVU ONLAJN DIGITALNIH UPUTSTAVA ZA UPOTREBU: KORPUS HILTI UPUTSTAVA |
n5 | This paper presents a methodology for creating an extensive multilingual parallel corpus of user manuals, specifically based on digital user manuals of the company Hilti. | n5 | U radu je predstavljena metodologija izrade opsežnog višejezičnog paralelnog korpusa uputstava za upotrebu na osnovu digitalnih uputstava za upotrebu uređaja kompanije Hilti. |
n6 | The goal of this paper is to enhance research resources in the fields of machine translation, translation theory, as well as translation teaching and other types of translation research. | n6 | Cilj ovog rada je doprinos boljim resursima za istraživanja vezanim za mašinsko prevođenje, teoriju prevođenja, ali i za nastavu prevođenja i druge vrste lingvističkih istraživanja. |
n7 | The starting point of the methodology was the uniform HTML structure of the user manuals for all languages on the official Hilti online database of user manuals. | n7 | Polazna tačka metodologije bilo je korišćenje uniformne strukture HTML uputstava za svaki jezik na zvaničnoj Hilti onlajn bazi uputstava. |
n8 | Further steps involved identifying HTML elements which contain the relevant segments of texts, their consistent numeration for each language, identifying and cleaning incorrectly parallelized texts, and storing the processed texts in TMX format, so that English is the source language in each file. | n8 | Dalji koraci su obuhvatali identifikovanje HTML elemenata koji sadrže relevantne delove teksta, njihovu doslednu numeraciju za svaki jezik, identifikovanje i čišćenje pogrešno paralelizovanih tekstova i čuvanje obrađenih tekstova u TMX formatu, tako da je engleski izvorni jezik u svakom fajlu. |
n9 | On average, for each user manual there are around 20 target languages, and the entire corpus contains around 7 million words. | n9 | U proseku, za svako uputstvo postoji oko 20 ciljnih jezika, a sam korpus sadrži oko 7 miliona reči. |