4517 results
Search Results
Now showing 1 - 10 of 4517
Item Euskararen Sorkuntza Automatikoa: lehen urratsakAgirrezabal Zabaleta, Manex; Gonzalez Dios, Itziar; Lopez Gazpio, IñigoLan honetan euskararen sorkuntza automatikoan eman diren lehen urratsak azaltzen ditugu.Urratshoriek azaltzeko, hiru ikerketa-lerrotan egin diren lanak aurkezten ditugu:i) poesiaren sorkuntzan,ii) testuen sinplifikazioan eta iii) galderen sorkuntzan.Atzerriko hizkuntzetan egin den lana azalduondoren, ikerketa-lerro horietan hizkuntzaren sorkuntza nola erabiltzen den banan-banan deskribatzendugu adibideekin batera.Azkenik, etorkizunerako planteatu ditugun erronkak eta soluzio posibleakzerrendatzen ditugu.Item Ama-hizkuntza gaztelania duten euskara-ikastun helduen euskal txistukarien oharmena eta ekoizpenaSegura , MaitaneLan honetan L1 gaztelania duten eta euskara ikasten ari diren pertsona helduen euskal txistukarien oharmen eta ekoizpen prozesuak aztertu dira. Euskarak sei txistukari ditu, gaztelania estandarrak bi txistukari dituen bitartean. Horregatik, lehenik eta behin, ikastun hauek euskal txistukariak nola hautematen dituzten aztertu da: txistukari hauetako bi ̶ /s̺ / y /tʃ/ ̶ beren L1aren sistema fonologikoaren parte ere badira, baina beste lauak ̶ /s̻ /, /ʃ/, /ts̻ / y /ts̺ / ̶ ez dira beren L1ean existitzen. Bestalde, txistukari hauen ekoizpena ere aztertu da ikastun berdinen kasuan eta emaitzak akustikoki aztertu dira. Azkenik, oharmen-analisian eta analisi-akustikoan lortutako emaitzen arteko konparaketa egin da bi prozesuen artean paralelotasunik dagoen, edo aitzitik, prozesu batek bestearen garapenean eraginik ez duen egiaztatzeko.Item Euskarazko denbora-egituren tratamendu automatikorako azterketaAltuna Diaz, BegoñaHizkuntzaren prozesamenduan (HP) balio handikoa da denbora-informazioa, horrek kokatzen baititutestuko gertaerak kronologian edo horien iraupena adierazten baitu.Erauzitako informazio horigertaerak noiz jazo diren jakiteko baliatu ahal izango da, baita gertaerak denboran zehar ordenatuedo etorkizunean zer gertatuko den aurrikusteko. Horiek lortzeko, ordea, denbora-egiturak eta eurenezaugarriak identifikatu eta tresna informatikoentzat atzigarri egin behar dira eta zeregin horietarakohizkuntza-baliabideak eta konputazio-baliabideak sortu behar dira.Item Konbitzul: euskarazko eta gaztelaniazko izen+aditz konbinazioen datu-baseaIñurrieta Urmeneta, UxoaKonbitzul datu-basea azterketa linguistiko baten emaitza da, eta euskarazko eta gaztelaniazko izen+aditzkonbinazioak biltzen ditu, euren ordainekin eta beste hainbat datu linguistikorekin batera. Lan honek,batetik, azterketa linguistikoaren berri ematen du, eta, bestetik, datu-basean bilaketak egiteko sortudugun interfaze publikoaren ezaugarriak azaltzen ditu.Item Euskararako HPSG gramatikaren lehen proposamenaAlkorta Agirrezabala, JonSintaxi konputazionala Hizkuntzalaritza Konputazionala ikerlerroko adarretako bat da. Bere helburuasintaxiko ezagutza formalizatzea da. Sintaxi konputazionalean, sintaxia formalizatzeko hainbat formalis-mo daude, ezaugarri eta helburu ezberdinekin. Artikulu honetan, euskararako HPSG gramatikaren lehenurratsak azalduko ditugu eta bidean izandako arazoak eta bilatutako konponbideak kontatuko ditugu.Item Unitate fraseologikoen itzulpena: alemana-euskara. Corpusean oinarritutako analisiaSanz Villar, ZuriñeArtikulu honek alemanetik euskaratutako unitate fraseologikoen itzulpena izango du aztergai.Horiegin ahal izateko, 3,5 milioi hitz inguru dituen corpus digitalizatu, lerrokatu eta eleanitza sortudugu, AleuskaPhraseo corpusa, alegia. Itzulpen moduak –hau da, sorburu- eta xede-testuaren artekoharremanak– berebiziko garrantzia dauka gure kasuan, itzulpen asko –batez ere haur eta gazte literaturan(HGL)– zeharka, zubi-bertsio batetik abiatuta, egin izan direlako, eta egiten direlako. Corpusean, baiustez zuzenean bai ustez zeharka itzuli diren testuak jaso ditugu, bien artean dauden berdintasun etadesberdintasunak deskribatzeko asmoz. Horretaz gain, HGLko eta helduen literaturako (HL) testuakitzultzearen artean alderik ba ote dagoen ere aztertuko dugu.Item Corpusetan oinarritutako hiztegi elebidun berria sortzenLindemann , David; San Vicente Roncal, IñakiLan honetan, hiztegigintza egitasmo berria aurkezten dugu, EHUn garatzen ari dena: Euskara-alemanerazko EuDeLex hiztegi elebidun elektronikoa, hizkuntza-ikasleei zuzentzen dieguna. Sarrera,hizkuntza-bikote honentzako hiztegi berria baten beharrari dagokio.EuDeLex egitasmoak ez du eguneratu edo egokitu litekeen aurrekaririk. Hala ere, baliabidelagungarriak ditugu hiztegia sortu eta editatzean: alde batetik, datu-base lexikografiko nahiz corpuselebakarrak, eta bestetik, sortu berri diren euskara-alemanerazko corpus paraleloak. Hiztegiarenmakroegitura eta mikroegitura osatzeko corpusetan oinarritutako eman ditugun ikerketa-urratsakaurkezten ditugu.Item Euskarazko izena+aditza konbinazioak corpusetik automatikoki erauztea eta idiomatikotasunaren arabera karakterizatzeaGurrutxaga Hernaiz, Antton; Alegria Loinaz, Iñaki; Artola Zubillaga, XabierEuskarazko izena+aditza egiturako unitate fraseologikoak (UFak) corpusetik automatikoki erauzi etaidiomatikotasun-mailaren arabera karakterizatzeko lan esperimentala egin dugu. Corpusetik hautagaiakerauzteko sistema landu ondoren, idiomatikotasunaren lau ezaugarri edo propietateetako bakoitzaneurtzeko teknikak garatu eta ebaluatu ditugu, hiru adituk eskuz sailkatutako erreferentzia erabiliz.Hiru kategoria bereizi dira: esapide idiomatikoa, kolokazioa eta konbinazio librea. Azkenik, ezaugarribakunen neurketak ikasketa automatikoko sailkatze-ataza batean konbinatu dira.Ondorio nagusiada arlo honetan estandar diren agerkidetza-tekniken emaitzak modu esanguratsuan gainditu direla,batez ere teknika semantikoen bidez, baina baita malgutasun morfosintaktikoaren neurketaren bidez ere.Item Euskarazko corpus orokorrak osatzeko weba ustiatzenLeturia Azkarate, IgorTestu-corpusak behar-beharrezkoak dira egoera normalean bizi nahi duen hizkuntza batentzat, eta hala da euskararentzat ere. Baina euskarazko corpus orokorren tamaina oso txikia da beste hizkuntza handiagoenekin konparatzen badugu. Horregatik, logikoa da, beste hizkuntza horiek egin duten bezala, euskarak ere “Web-as-Corpus” planteamendua (hau da, weba eta metodo automatikoak) baliatzea. Artikulu honetan azaltzen dira egileak bere doktore-tesian euskarazko corpus orokor handi bat biltzeko eta weba euskarazko corpus gisa kontsultatzeko egindako ikerketak, garatutako tresnak eta lortutako emaitzak. Lan horretan lehenbiziko aldiz lortu da 100 milioi hitzetik gorako euskarazko corpus bat osatzea, eta online jarri dira gizartearen eskura corpus hori eta weba corpus bat bailitzan kontsultatzeko tresna.Item Konbinatu eta Irabazi! Hitzen Semantikaren Errepresentazio Osoagoaren BilaGoikoetxea Salutregi, JosuArtikulu honetan hitzen semantikaren errepresentazio osoagoa lortzeko algoritmo berria aurkezten dugu.Gure proposamenak bi metodo konbinatzen ditu: ezagutza-baseetan eta corpusetan oinarritutakoak.Hasieran, konbinatu barik, bi metodo horiekin antzekotasuna deituriko prozesu kognitiboa aztertudugu, eta gero azken horiek uztartzen dituen algoritmoa enpirikoki frogatu dugu.Bi faseetan gizairizpideetan oinarritutako antzekotasun urre-patroiak hartu ditugu ebaluaziorako erreferentzia legez.Metodoak konbinatzerakoan baliabideak asko optimizatu ditugu, konbinatu barik lortutako emaitzakberdinduz edota gaindituz. Ondorioz, teknika horiek informazio semantiko osagarria dutela frogatu dugu.