Bibliša: Aligned Collection Search Tool

[ Log In ] [ Register ]

 Kešelj et al., 2008, vol. IX:1/2, ID: 1.2008.1/2.4[About]



En/De/Fr/It- (first 9 out of 289 sentences) [pdf] Srpski - (prvih 9 od 289 rečenica) [pdf]
n1A Suffix Subs umption -based Approach to Building Stemmers and Lemmatizers for Highly Inflectional Languages with Sparse Resources n1Pristup izgradnji stemera i lematizatora za jezike s bogatom fleksijom i oskudnim resursima zasnovan na obuhvatanju sufiksa
n2Vlado Kesxelx, Dalhousie University; Danko Sxipka, Arizona State University n2Vlado Kešelj, Univerzitet Dalhousie; Danko šipka, Državni univerzitet Arizona
n3Abstract: We present a general suffix-based method for construction of stemmers and lemmatizers for highly inflectional languages with only sparse resources. n3Apstrakt: Predstavljamo opšti sufiksni metod za konstruisanje stemera i lematizera za jezike sa bogatom fleksijom i oskudnim resursima.
n4The process is directly implementable with described efficient design and it is evaluated on a construction of a stemmer for the Serbian language. n4Opisali smo jedan efikasan pristup pomoću koga se proces može direktno implementirati, a evaluacija je izvršena na konstrukciji stemera za srpski jezik.
n5The evaluation on real data has shown an accuracy of 79%. n5Evaluacija na verodostojnim podacima dala je tačnost od 79%.
n61 Introduction n61 Uvod
n7Two important tasks at the low level of Natural Language Processing (NLP) are stemming and lemmatization. n7Dva važna zadatka niskog nivoa u obradi prirodnih jezika su steming i lematizacija.
n8Stemming is well-known in the NLP, IR (Information Retrieval), and Text Mining research areas as an essential preprocessing step for some tasks, such as text and document retrieval, document clustering, classification, information extraction, and other content-related applications. n8Steming je dobro poznat u obradi prirodnih jezika, pronalaženju informacija, i istraživanjima vezanim za kopanje po tekstu, kao neophodna priprema za druge zadatke, kakvi su npr. pronalaženje teksta i dokumenata, grupisanje dokumenata, klasifikacija, ekstrakcija informacija i u drugim primenama koja zavise od sadržaja.
n9Descriptively speaking, stemming is a word transformation in which a word may be stripped of some suffixes without loosing its core semantic content. n9Steming bi se mogao opisati kao transformacija reči kod koje može doći do uklanjanja nekih sufiksa pri čemu se ne gubi osnovni semantički sadržaj.