En/De/Fr/It- (first 9 out of 13 sentences)
[pdf] |
Srpski - (prvih 9 od 13 rečenica)
[pdf]
|
n1 | Anđelka Zečević, Anastazia Žunić, Kristina Milojević | n1 | Anđelka Zečević, Anastazia Žunić, Kristina Milojević |
n2 | Mathematical Institute, Serbian Academy of Sciences and Arts | n2 | Matematički institut Srpske akademije nauka i umetnosti |
n3 | {andjelkaz, anastazia.zunic, kristinam}@mi.sanu.ac.rs | n3 | {andjelkaz, anastazia.zunic, kristinam}@mi.sanu.ac.rs |
n4 | OLD ТEXTS, NEW ТECHNOLOGIES: DIGITIZATION OF DOCUMENTS IN SERBIAN | n4 | STARI TEKSTOVI, NOVE TEHNOLOGIJE: DIGITALIZACIJA DOKUMENATA NA SRPSKOM JEZIKU |
n5 | Numerous tools and platforms are emerging in the digital humanities, intending to advance and enrich work with digitized documents. | n5 | U svetu digitalne humanistike pojavljuju se mnogobrojni alati i platforme koje imaju za cilj da unaprede i obogate rad sa digitalizovanom građom. |
n6 | At the core of these tools are complex machine learning algorithms for image and text processing, trained on appropriately prepared document repositories. Their most common functionalities include image quality enhancement, document layout analysis, optical character recognition, and text post-correction. | n6 | U osnovi ovih alata su kompleksni algoritmi mašinskog učenja za obradu slika i teksta obučavani nad podesno pripremljenim repozitorijumima dokumenata, dok su njihove najčešće funkcionalnosti unapređivanje kvaliteta slika, prostorna analiza dokumenata, optičko prepoznavanje karaktera i korekcija raščitanog sadržaja. |
n7 | Newer tools also offer support for standardizing orthography, convenient and more comprehensive document retrieval, toponyms extraction, topic recognition, and document summary generation. | n7 | Noviji alati nude podršku i za standardizovanje ortografije, lakše i sveobuhvatnije pretraživanje dokumenata, izdvajanje toponima, prepoznavanje tema u sadržajima i generisanje sažetaka dokumenata. |
n8 | This work will present experiences collected using modern open-source tools for digitizing documents in Serbian. | n8 | U ovom radu biće predstavljena iskustva u korišćenju modernih alata u otvorenom pristupu za digitalizaciju dokumenata na srpskom jeziku. |
n9 | The tools in question are Calamari-OCR, docTr, LayoutParser, Kraken, Tesseract, OCR4All, and others, designed to address individual steps in the digitization process or the complete end-to-end pipeline. | n9 | U pitanju su alati Calamari-OCR, docTr, LayoutParser, Kraken, Tesseract, OCR4All i drugi, dizajnirani za pojedinačne korake procesa digitalizacije ili potpun proces prateći paradigmu sa-kraja-na-kraj. |