Bibliša: Aligned Collection Search Tool

[ Log In ] [ Register ]
Ontology-based Recognition of Rhetorical FiguresOntološko prepoznavanje figura
INFOtheca, Scientific paper [pdf]INFOteka, Naučni rad [pdf] [WikiData]
ID: 1.2016.1/2.2 Number: 1/2 Volume: 16 Year: 2016 UDC: 811.163.41'322.2 [tmx] [bow]
Miljana Mladenović
Institution: University of Belgrade, Faculty of Mathematics
Mail: ml.miljana@gmail.com
Miljana Mladenović
Institucija: Univerzitet u Beogradu, Matematički fakultet
E-pošta: ml.miljana@gmail.com
Abstract
Automatic recognition of rhetorical figures (similes, irony, sarcasm, humor, metaphors, etc.) is increasingly used in natural language processing tasks, primarily to improve sentiment classification, machine translation, but also for analysis of linguistic structures on different levels. In this paper, we propose a method of automatic recognition and classification of rhetorical figures from the group of tropes that uses ontological inference rules in an ontology based on Serbian WordNet (SWN). A binary classification method was carried out on the rhetorical figure simile and evaluated by ROC curve (AUC = 0.696) which indicates that it can be successfully used in solving these types of tasks. We also propose a semi-automatic ontology learning method, for further learning of SWN ontology, by increasing the number and the type of relationships that can assist in the detection of figurative language in the texts in Serbian.
Apstrakt
Automatsko prepoznavanje retoričkih figura (komparacije, ironije, sarkazma, humora, metafore i sl.) sve češće se koristi u zadacima obrade prirodnog jezika, pre svega za unapređenje sistema klasifikacije teksta prema osećanjima, mašinskog prevođenja, ali i sistema koji analiziraju jezičke strukture na različitim nivoima. U ovom radu predložena je metoda automatskog prepoznavanja i klasifikacije retoričkih figura iz grupe tropi koja koristi pravila ontološkog zaključivanja u ontologiji Srpski vordnet (SWN). Evaluacija metode izvedena je nad retoričkom figurom komparacija, a statistička ocena binarnog klasifikatora ROC krivom (AUC=0.696) ukazuje da se on može uspešno koristiti u rešavanju ove vrste zadataka. Za dalje obučavanje ontologije SWN, predložena je polu-automatska metoda učenja ontologije povećanjem broja i vrsta relacija koje mogu pomoći u otkrivanju figurativnog govora u tekstovima na srpskom jeziku.
Keywords: rhetorical figures, simile, ontology-based classification, WordNetKljučne reči: retoričke figure, komparacija, klasifikacija pomoću ontologije, WordNet
Pages: 24-47Strane: 25-48
Publishing place:
Publisher:
Publishing year:
Mesto izdanja:
Izdavač:
Godina izdanja:
Translator: Prevodilac:
C:\inetpub\BiblishaMongo\export\11\svg\1_2016_1\2_2_tmx_0.svg