Euskarazko izena+aditza konbinazioak corpusetik automatikoki erauztea eta idiomatikotasunaren arabera karakterizatzea

dc.contributor.authorGurrutxaga Hernaiz, Anttoneus
dc.contributor.authorAlegria Loinaz, Iñakieus
dc.contributor.authorArtola Zubillaga, Xabiereus
dc.date.accessioned2024-11-27T11:49:07Z
dc.date.available2024-11-27T11:49:07Z
dc.description.abstractEuskarazko izena+aditza egiturako unitate fraseologikoak (UFak) corpusetik automatikoki erauzi etaidiomatikotasun-mailaren arabera karakterizatzeko lan esperimentala egin dugu. Corpusetik hautagaiakerauzteko sistema landu ondoren, idiomatikotasunaren lau ezaugarri edo propietateetako bakoitzaneurtzeko teknikak garatu eta ebaluatu ditugu, hiru adituk eskuz sailkatutako erreferentzia erabiliz.Hiru kategoria bereizi dira: esapide idiomatikoa, kolokazioa eta konbinazio librea. Azkenik, ezaugarribakunen neurketak ikasketa automatikoko sailkatze-ataza batean konbinatu dira.Ondorio nagusiada arlo honetan estandar diren agerkidetza-tekniken emaitzak modu esanguratsuan gainditu direla,batez ere teknika semantikoen bidez, baina baita malgutasun morfosintaktikoaren neurketaren bidez ere.eus
dc.description.abstractWe present an experimental study on the automatic extraction of phraseological units of noun+verbstructure in Basque, and their characterization according to the idiomaticity level. After automaticallyextracting candidates from corpora, we develop several techniques for quantifying the four basic propertiesof idiomaticity, using for evaluation a gold standard of candidates classified by three experts. We usethree categories: idioms, collocations and free combinations. Finally, the results of those experimentshave been combined using Machine Learning for classification.The results show that the standardcooccurence techniques are significantly ourtperformed by semantic measures, and, to a lower extent, bymeasures of morphosyntactic flexibility.en
dc.identifier.doihttps://dx.doi.org/10.26876/ikergazte.i.82
dc.identifier.otherproduction.37409
dc.identifier.urihttps://gordailua.ueu.eus/handle/123456789/2201
dc.relation.ispartofI. Ikergazte: Nazioarteko ikerketa euskaraz. Kongresuko artikulu-bilduma
dc.subjectfraseologia konputazionalaeus
dc.subjectidiomatikotasunaeus
dc.subjectesapide idiomatikoakeus
dc.subjectkolokazioakeus
dc.subjectcomputational phraseologyen
dc.subjectidiomaticityen
dc.subjectidiomsen
dc.subjectcollocationsen
dc.subject.otherEuskaraeus
dc.subject.otherHizkuntzalaritzaeus
dc.subject.otherInformatikaeus
dc.titleEuskarazko izena+aditza konbinazioak corpusetik automatikoki erauztea eta idiomatikotasunaren arabera karakterizatzeaeus
dc.typeintroductionen

Files

Collections