Linguatecen ikerketa-artikulu bat onartu dute LREC 2020 kongresuan

8 July, 2020 By 0 Comments

Covid-19ak munduan eragindako osasun-krisialdiak eraginda garai zaila bizitzea egokitu bazaigu ere, Linguatec proiektua eratzen duen kontsortzioak lanean eta aurrera darrai. Eta emaitzak ere lortzen ari dira elkarlan horri esker.

LREC 2020 (12th Language Resources and Evaluation Conference) kongresuak onartu du bertan aurkeztea Linguatec proiektuaren partzuergoko kide batzuek egindako ikerketa-lan bat. Maiatzaren 11 eta 16 bitartean egitekoa zen kongresua, Marseillan. Alabaina, covid-19ak eragindako pandemiaren eraginez, bertan behera utzi dute ekitaldia, eta ezin izan da inolako aurrez aurreko aurkezpenik egin.

Nolanahi ere, nabarmentzekoa da lan hori kongresuan aurkezteko onartu izana. Izan ere, hizkuntza-baliabideei (LR) eta hizkuntza-teknologien ebaluazioari (LT) buruzko kongresu nagusia da LREC, eta haren helburua da teknika horien egoeraren ikuspegi orokorra eskaintzea, I+Grako bide berriak eta gorantz doazen joerak esploratzea, hizkuntza-baliabideei eta haien aplikazioei buruzko informazioa trukatzea, baita ebaluatzeko metodologia eta tresnei buruzko, martxan dauden eta egitekoak diren jarduerei buruzko, industriaren erabilera eta beharrei buruzko eta gizarte elektronikoak dituen beharrei buruzko informazioa trukatzea ere, hala ikuspuntu politikotik nola ikuspuntu teknologikotik edo antolakuntzari dagokionetik.

LREC 2020an onartutako artikuluan, hizketaren sintesia (text-to-speech edo TTS) egiteko sistema baten diseinua aurkezten da, okzitanieraren aldaera nagusietako batentzat: gaskoiarentzat. Linguatec proiektuaren barruan garatu dute sistema hori partzuergoa eratzen duten erakundeetako zenbait ikertzailek elkarlanean. Azken belaunaldiko TTS neuronal bat erabili dute gaskoierako, grabazio-ordu gutxi erabilita, eta frantsesezko izen propioak modu estandarrean ahoskatzen dituena. Sistema bat baino gehiago garatu eta ebaluatu dituzte; batzuek testua dute oinarri eta, besteek, berriz, fonemak, eta batzuek frantsesezko hitzen grabazioak ere badituzte eta besteek ez.