Serbian ELTeC Sub-Collection in Wikidata | Srpska ELTeC potkolkcija u Vikipodacima |
INFOtheca, Scientific paper [pdf] | INFOteka, Naučni rad [pdf] [WikiData] |
ID: 1.2021.2.4 Number: 2 Volume: 21 Year: 2021 UDC: 004.62: [030:004.738.5 [tmx] [bow] |
Milica Ikonić Nešić Institution: University of Belgrade, Faculty of Philology Mail: milica.ikonic.nesic@fil.bg.ac.rs | Milica Ikonić Nešić Institucija: Univerzitet u Beogradu, Filološki fakultet E-pošta: milica.ikonic.nesic@fil.bg.ac.rs |
Ranka Stanković Institution: University of Belgrade, Faculty of Mining and Geology Mail: ranka.stankovic@rgf.bg.ac.rs | Ranka Stanković Institucija: Univerzitet u Beogradu, Rudarsko-geološki fakultet E-pošta: ranka.stankovic@rgf.bg.ac.rs |
Biljana Rujević Institution: University of Belgrade, Faculty of Mining and Geology Mail: biljana.rujevic@rgf.bg.ac.rs | Biljana Rujević Institucija: Univerzitet u Beogradu, Rudarsko-geološki fakultet E-pošta: biljana.rujevic@rgf.bg.ac.rs |
Abstract This paper presents an example of integration of Wikidata with digital libraries and external systems, as well as some best practices for speeding up the process of data preparation and import to Wikidata, on the use case of SrpELTeC, Serbian subcollection of the ELTeC multilingual collection (European Literary Text Collection). After preliminary work on the manual Wikidata population with SrpELTeC novels, the goal was to automate the process of preparing and importing information, so different solutions were analysed and finally synergy of two, OpenRefine and QuickStatements, was chosen as the best option. The paper also brings examples of SPARQL queries for retrieval of authors, novel titles, publication places and other metadata with different visualisation options. | Apstrakt Rad prikazuje primer integracije Vikipodataka u digitalne biblioteke i spoljne sisteme, kao i najbolju praksu za ubrzavanje procesa pripreme podataka i učitavanja u bazu Vikipodaci, a na primeru kolekcije SrpELTeC, srpska potkolekcija višejezičnog korpusa ELTeC (Evropska kolekcija književnih tekstova). Posle preliminarnog rada na ručnom kreiranju podataka u bazi Vikipodaci za romane iz kolekcije SrpELTeC, počeo je proces automatizacije pripreme i učitavawa informacija. Analizirana su različita rešenja i na kraju su odabrani alati OpenRefine i QuickStatements kao najbolje rešenje. Rad, takođe, prikazuje i primere SPARQL upita za pronalaženje informacija kao što su: autor, naslov, mesto izdavanja i drugi metapodaci sa različitim rešenjima za prikazivanje. |
Keywords: Wikidata, distant
reading, literary corpus, named entity
linking, ELTeC, SrpELTeC | Ključne reči: Vikipodaci, udaljeno čitanje, književni korpus, povezivawe imenovanih entiteta, ELTeC, SrpELTeC |
Pages: 60-86 | Strane: |
Publishing place: Publisher: Publishing year: | Mesto izdanja: Izdavač: Godina izdanja: |
Translator: | Prevodilac: |