Bibliša: Aligned Collection Search Tool

[ Log In ] [ Register ]
Serbian ELTeC Sub-Collection in WikidataSrpska ELTeC potkolkcija u Vikipodacima
INFOtheca, Scientific paper [pdf]INFOteka, Naučni rad [pdf] [WikiData]
ID: 1.2021.2.4 Number: 2 Volume: 21 Year: 2021 UDC: 004.62: [030:004.738.5 [tmx] [bow]
Milica Ikonić Nešić
Institution: University of Belgrade, Faculty of Philology
Mail: milica.ikonic.nesic@fil.bg.ac.rs
Milica Ikonić Nešić
Institucija: Univerzitet u Beogradu, Filološki fakultet
E-pošta: milica.ikonic.nesic@fil.bg.ac.rs
Ranka Stanković
Institution: University of Belgrade, Faculty of Mining and Geology
Mail: ranka.stankovic@rgf.bg.ac.rs
Ranka Stanković
Institucija: Univerzitet u Beogradu, Rudarsko-geološki fakultet
E-pošta: ranka.stankovic@rgf.bg.ac.rs
Biljana Rujević
Institution: University of Belgrade, Faculty of Mining and Geology
Mail: biljana.rujevic@rgf.bg.ac.rs
Biljana Rujević
Institucija: Univerzitet u Beogradu, Rudarsko-geološki fakultet
E-pošta: biljana.rujevic@rgf.bg.ac.rs
Abstract
This paper presents an example of integration of Wikidata with digital libraries and external systems, as well as some best practices for speeding up the process of data preparation and import to Wikidata, on the use case of SrpELTeC, Serbian subcollection of the ELTeC multilingual collection (European Literary Text Collection). After preliminary work on the manual Wikidata population with SrpELTeC novels, the goal was to automate the process of preparing and importing information, so different solutions were analysed and finally synergy of two, OpenRefine and QuickStatements, was chosen as the best option. The paper also brings examples of SPARQL queries for retrieval of authors, novel titles, publication places and other metadata with different visualisation options.
Apstrakt
Rad prikazuje primer integracije Vikipodataka u digitalne biblioteke i spoljne sisteme, kao i najbolju praksu za ubrzavanje procesa pripreme podataka i učitavanja u bazu Vikipodaci, a na primeru kolekcije SrpELTeC, srpska potkolekcija višejezičnog korpusa ELTeC (Evropska kolekcija književnih tekstova). Posle preliminarnog rada na ručnom kreiranju podataka u bazi Vikipodaci za romane iz kolekcije SrpELTeC, počeo je proces automatizacije pripreme i učitavawa informacija. Analizirana su različita rešenja i na kraju su odabrani alati OpenRefine i QuickStatements kao najbolje rešenje. Rad, takođe, prikazuje i primere SPARQL upita za pronalaženje informacija kao što su: autor, naslov, mesto izdavanja i drugi metapodaci sa različitim rešenjima za prikazivanje.
Keywords: Wikidata, distant reading, literary corpus, named entity linking, ELTeC, SrpELTeCKljučne reči: Vikipodaci, udaljeno čitanje, književni korpus, povezivawe imenovanih entiteta, ELTeC, SrpELTeC
Pages: 60-86Strane:
Publishing place:
Publisher:
Publishing year:
Mesto izdanja:
Izdavač:
Godina izdanja:
Translator: Prevodilac:
C:\inetpub\BiblishaMongo\export\11\svg\1_2021_2_4_tmx_0.svg