Ontology-based Recognition of Rhetorical Figures | Ontološko prepoznavanje figura |
INFOtheca, Scientific paper [pdf] | INFOteka, Naučni rad [pdf] [WikiData] |
ID: 1.2016.1/2.2 Number: 1/2 Volume: 16 Year: 2016 UDC: 811.163.41'322.2 [tmx] [bow] |
Miljana Mladenović Institution: University of Belgrade, Faculty of Mathematics Mail: ml.miljana@gmail.com | Miljana Mladenović Institucija: Univerzitet u Beogradu, Matematički fakultet E-pošta: ml.miljana@gmail.com |
Abstract Automatic recognition of rhetorical figures (similes, irony, sarcasm, humor, metaphors, etc.) is increasingly used in natural language processing tasks, primarily to improve sentiment classification, machine translation, but also for analysis of linguistic structures on different levels. In this paper, we propose a method of automatic recognition and classification of rhetorical figures from the group of tropes that uses ontological inference rules in an ontology based on Serbian WordNet (SWN). A binary classification method was carried out on the rhetorical figure simile and evaluated by ROC curve (AUC = 0.696) which indicates that it can be successfully used in solving these types of tasks. We also propose a semi-automatic ontology learning method, for further learning of SWN ontology, by increasing the number and the type of relationships that can assist in the detection of figurative language in the texts in Serbian. | Apstrakt Automatsko prepoznavanje retoričkih figura (komparacije, ironije, sarkazma, humora, metafore i sl.) sve češće se koristi u zadacima obrade prirodnog jezika, pre svega za unapređenje sistema klasifikacije teksta prema osećanjima, mašinskog prevođenja, ali i sistema koji analiziraju jezičke strukture na različitim nivoima. U ovom radu predložena je metoda automatskog prepoznavanja i klasifikacije retoričkih figura iz grupe tropi koja koristi pravila ontološkog zaključivanja u ontologiji Srpski vordnet (SWN). Evaluacija metode izvedena je nad retoričkom figurom komparacija, a statistička ocena binarnog klasifikatora ROC krivom (AUC=0.696) ukazuje da se on može uspešno koristiti u rešavanju ove vrste zadataka. Za dalje obučavanje ontologije SWN, predložena je polu-automatska metoda učenja ontologije povećanjem broja i vrsta relacija koje mogu pomoći u otkrivanju figurativnog govora u tekstovima na srpskom jeziku. |
Keywords: rhetorical figures, simile, ontology-based classification, WordNet | Ključne reči: retoričke figure, komparacija, klasifikacija pomoću ontologije, WordNet |
Pages: 24-47 | Strane: 25-48 |
Publishing place: Publisher: Publishing year: | Mesto izdanja: Izdavač: Godina izdanja: |
Translator: | Prevodilac: |