Larramendiren "Hiztegi Hirukoitza"ren digitalizazioa. Karaktereen ezagutze optikoa eta "Wikiteka"ra igotzea

dc.contributor.authorAlonso Arrospide, Mikeleus
dc.contributor.authorLindemann , Davideus
dc.date.accessioned2024-11-27T11:50:58Z
dc.date.available2024-11-27T11:50:58Z
dc.description.abstractArtikulu honetan Larramendiren Hiztegi Hirukoitzaren digitalizazioko OCR prozesua deskribatzenda, ikasketa automatikoa baliatuz. Horretarako, irudien tratamendua deskribatu eta eskuztranskribatutako laginetik abiatuta testua ezagutuko duen ereduaren trebakuntza azaltzen da. EmaitzakWikiteka plataforman eskuragarri daudenez, auzolanaz transkripzio osoa zuzendutakoan informazioerauzketa prozesutik pasako da hiztegiaren egitura lexikografikoa ikasketa automatikoz erauzteko.eus
dc.description.abstractIn this article, we describe the OCR process using machine learning in the digitization ofLarramendi’s Diccionario Trilingüe. For this purpose, the treatment of images is described and thetraining of the model from the transcribed sample that will recognize the text. As the results areavailable on the Wikisource platform, the transcription can be corrected using crowdsourcing, so thatwe can carry out the information extraction process using machine learning to extract thelexicographic structure of the dictionary.en
dc.identifier.doihttps://dx.doi.org/10.26876/ikergazte.iv.01.15
dc.identifier.otherproduction.44730
dc.identifier.urihttps://gordailua.ueu.eus/handle/123456789/2539
dc.relation.ispartofIV. Ikergazte. Nazioarteko ikerketa euskaraz. Kongresuko artikulu bilduma. Giza Zientziak eta Artea
dc.subjecthiztegi historikoakeus
dc.subjectLarramendieus
dc.subjectOCReus
dc.subjectikasketa automatikoaeus
dc.subjectWikitekaeus
dc.subjecthistorical dictionariesen
dc.subjectLarramendien
dc.subjectOCRen
dc.subjectmachine learningen
dc.subjectWikisourceen
dc.subject.otherHizkuntzalaritzaeus
dc.subject.otherInformatikaeus
dc.subject.otherTerminologiaeus
dc.titleLarramendiren "Hiztegi Hirukoitza"ren digitalizazioa. Karaktereen ezagutze optikoa eta "Wikiteka"ra igotzeaeus
dc.typeintroductionen

Files

Collections