Bibliša: Aligned Collection Search Tool

[ Log In ] [ Register ]
Medical domain document classification via extraction of taxonomy concepts from MeSH ontologyKlasifikacija dokumenata iz medicinskog domena ekstrahovanjem taksonomskih koncepata iz MeSH ontologije
INFOtheca, Scientific paper [pdf]INFOteka, Naučni rad [pdf] [WikiData]
ID: 1.2019.1.3 Number: 1 Volume: 19 Year: 2019 UDC: 004.82:025.43MESH [tmx] [bow]
Mihailo Škorić
Institution: University of Belgrade
Mail: mihailo.skoric@rgf.bg.ac.rs
Mihailo Škorić
Institucija: Univerzitet u Beogradu
E-pošta: mihailo.skoric@rgf.bg.ac.rs
Mauro Dragoni
Institution: Fondazione Bruno Kessler Trento, Italy
Mail: dragoni@fbk.eu
Mauro Dragoni
Institucija: Fondacija
E-pošta: dragoni@fbk.eu
Abstract
This paper is a result of a task presented to attendants of Keyword Search in Big Linked Data summer school, that was organized by Vienna University of Technology, under the Keystone COST action in the summer of 2017. It presents a specific approach to the classification via creation of minimal document surrogates based on the US National medical library’s MeSH ontology, which is derived from the Medical Subject Headings thesaurus. In a series of previously classified medically related texts, which are the bases for the task, all of the significant terms are located and replaced with taxonomical references from the MeSH ontology. Extracted references are used for the classification within the ontology using a rather simple algorithm and the results are evaluated in compresence to previous manual classification of the same documents.
Apstrakt
Rad je nastao kao odgovor na zadatak klasifikacije medicinskih dokumenata, postavljen tokom letnje škole Keyword Search in Big Linked Data, održane u okviru COST akcije Keystone 2017. godine na Tehnološkom univerzitetu u Beču. U njemu se prikazuju rezultati specifičnog pristupa klasifikaciji zasnovanog na kreiranju minimalnih surogata teksta. Kao osnova klasifikacije uzeta je MeSH ontologija, zasnovana na tezaurusu Medical Subject Headings. U tekstovima, prethodno klasifikovanim pomoću taksonomije ove ontologije, najpre se pronalaze pojmovi od važnosti, a potom se zamenjuju taksonomskim referencama. Tako ekstrahovane reference koriste za klasifikaciju unutar MeSH taksonomije pomoću prostog algoritma, a rezultati se evaluiraju u odnosu na ručno klasifikovane dokumente.
Keywords: document classification, MeSH, ontology, information extraction.Ključne reči: klasifikacija dokumenata, MeSH, ontologije, ekstrakcija informacija
Pages: 55-69Strane: 57-73
Publishing place:
Publisher:
Publishing year:
Mesto izdanja:
Izdavač:
Godina izdanja:
Translator: Prevodilac:
C:\inetpub\BiblishaMongo\export\11\svg\1_2019_1_3_tmx_0.svg