Bibliša: Aligned Collection Search Tool

En/De/Fr/It- (first 9 out of 14 sentences) [pdf] Srpski - (prvih 9 od 14 rečenica) [pdf]
Danilo Aleksić
n2Department of Serbian with South Slavic Languages Faculty of Philology University of Belgraden2Katedra za srpski jezik sa južnoslovenskim jezicima Filološki fakultet Univerzitet u Beogradu
n5The short Python program “Ka minimalnim parovima” (“Towards Minimal Pairs”; “KaMP” was chosen as the Serbian abbreviation), first presented in Aleksić and Šandrih 2021, was primarily conceived as a tool which teachers of Serbian as a foreign language can use to gather word pairs for pronunciation exercises.n5Kratki program na Python-u Ka minimalnim parovima (KaMP), prvi put predstavljen u Aleksić, Šandrih 2021, zamišljen je prvenstveno kao alat pomoću kojeg nastavnici srpskog kao stranog jezika mogu prikupiti parove reči za vežbe izgovora.
n6KaMP automatically excerpts segmental minimal pairs, e.g. lak ~ luk (lak ~ luk), and the word pairs which are related to segmental minimal pairs (i.e. the pairs which would be segmental minimal pairs if prosody were ignored), e.g. gel ~ gen (gel ~ gen), from a Latin Serbian input corpus encoded in Unicode.n6 KaMP iz latiničkog srpskog ulaznog korpusa u Unicode-u automatski ekscerpira segmentalne minimalne parove, npr. lak ~ luk (lak ~ luk), i parove srodne segmentalnim minimalnim parovima (tj. parove koji bi bili segmentalni minimalni parovi kada bi se ignorisala prozodija), npr. gel ~ gen (gel ~ gen).
n7 In Aleksić and Mrkela 2022, faster variants of KaMP, KaMP 2 and KaMP 2.1 respectively, are presented, both with improved sorting and with a supplementary mode. n7 U Aleksić, Mrkela 2022 predstavljene su brže varijante KaMP-a sa poboljšanim sortiranjem i sa suplementarnim modom, KaMP 2 i KaMP 2.1.
n8Now, even faster variants of KaMP are presented, KaMP 2.2 and KaMP 2.3.n8 Ovom prilikom predstavljaju se još brže varijante KaMP-a, KaMP 2.2 i KaMP 2.3.
n9 According to the averages of 20 consecutive measurements per version, KaMP, KaMP 2, KaMP 2.1, KaMP 2.2, and KaMP 2.3 took 122.66, 74, 63.84, 56.51, and 52.74 seconds respectively to excerpt segmental minimal and related pairs which differ from each other by substrings "dž" and "đ" from the corpus POL.xml in Python 3.12.4.n9 Segmentalne minimalne i srodne parove koji se razlikuju po podniskama "dž" i "đ" iz korpusa POL.xml (bez razlikovanja velikih i malih slova) u Python-u 3.12.4 KaMP ekscerpira za 122,66, KaMP 2 za 74, KaMP 2.1 za 63,84, KaMP 2.2 za 56,51, a KaMP 2.3 za 52,74 sekunde (proseci 20 uzastopnih merenja po verziji).