Bibliša: Aligned Collection Search Tool

[ Log In ] [ Register ]

 [About]



En/De/Fr/It- (first 9 out of 13 sentences) [pdf] Srpski - (prvih 9 od 13 rečenica) [pdf]
n1Anđelka Zečević, Anastazia Žunić, Kristina Milojevićn1Anđelka Zečević, Anastazia Žunić, Kristina Milojević
n2Mathematical Institute, Serbian Academy of Sciences and Artsn2Matematički institut Srpske akademije nauka i umetnosti
n3{andjelkaz, anastazia.zunic, kristinam}@mi.sanu.ac.rsn3{andjelkaz, anastazia.zunic, kristinam}@mi.sanu.ac.rs
n4OLD ТEXTS, NEW ТECHNOLOGIES: DIGITIZATION OF DOCUMENTS IN SERBIANn4STARI TEKSTOVI, NOVE TEHNOLOGIJE: DIGITALIZACIJA DOKUMENATA NA SRPSKOM JEZIKU
n5Numerous tools and platforms are emerging in the digital humanities, intending to advance and enrich work with digitized documents.n5U svetu digitalne humanistike pojavljuju se mnogobrojni alati i platforme koje imaju za cilj da unaprede i obogate rad sa digitalizovanom građom.
n6 At the core of these tools are complex machine learning algorithms for image and text processing, trained on appropriately prepared document repositories. Their most common functionalities include image quality enhancement, document layout analysis, optical character recognition, and text post-correction.n6 U osnovi ovih alata su kompleksni algoritmi mašinskog učenja za obradu slika i teksta obučavani nad podesno pripremljenim repozitorijumima dokumenata, dok su njihove najčešće funkcionalnosti unapređivanje kvaliteta slika, prostorna analiza dokumenata, optičko prepoznavanje karaktera i korekcija raščitanog sadržaja.
n7 Newer tools also offer support for standardizing orthography, convenient and more comprehensive document retrieval, toponyms extraction, topic recognition, and document summary generation.n7 Noviji alati nude podršku i za standardizovanje ortografije, lakše i sveobuhvatnije pretraživanje dokumenata, izdvajanje toponima, prepoznavanje tema u sadržajima i generisanje sažetaka dokumenata.
n8This work will present experiences collected using modern open-source tools for digitizing documents in Serbian.n8U ovom radu biće predstavljena iskustva u korišćenju modernih alata u otvorenom pristupu za digitalizaciju dokumenata na srpskom jeziku.
n9 The tools in question are Calamari-OCR, docTr, LayoutParser, Kraken, Tesseract, OCR4All, and others, designed to address individual steps in the digitization process or the complete end-to-end pipeline.n9 U pitanju su alati Calamari-OCR, docTr, LayoutParser, Kraken, Tesseract, OCR4All i drugi, dizajnirani za pojedinačne korake procesa digitalizacije ili potpun proces prateći paradigmu sa-kraja-na-kraj.