Un artículo de investigación del proyecto Linguatec ha sido aprobado en el LREC 2020

8 julio, 2020 By

A pesar del difícil período que estamos viviendo a nivel mundial con motivo de la crisis sanitaria provocada por la covid-19, el consorcio que conforma el proyecto Linguatec continúa trabajando y avanzando conjuntamente. Y este trabajo está dando sus frutos.

Un trabajo de investigación desarrollado por miembros del consorcio del proyecto Linguatec ha sido aprobado para ser presentado en el congreso LREC 2020 (12th Language Resources and Evaluation Conference), que iba a tener lugar entre los días 11 y 16 de mayo en Marsella. Sin embargo, debido a la pandemia provocada por la covid-19, el evento ha sido cancelado, por lo que finalmente todas las ponencias han quedado sin ser expuestas presencialmente.

No obstante, el hecho de que este trabajo haya sido aprobado para ser presentado en la conferencia es digno de mención. La conferencia LREC es el principal evento sobre Recursos del Lenguaje (LR) y Evaluación de Tecnologías del Lenguaje (LT). El objetivo del LREC es ofrecer una visión general del estado de la técnica, explorar nuevas direcciones de I+D y tendencias emergentes, intercambiar información sobre los RL y sus aplicaciones, metodologías y herramientas de evaluación, actividades en curso y previstas, usos y necesidades industriales, requisitos procedentes de la sociedad electrónica, tanto en lo que respecta a cuestiones políticas como tecnológicas y organizativas.

El artículo aceptado por el LREC 2020 presenta el diseño de un sistema de síntesis de habla (text-to-speech o TTS) para una de sus principales variedades del occitano, el gascón, que ha sido desarrollado dentro del proyecto Linguatec por una serie de investigadores pertenecientes a las diferentes entidades que conforma el consorcio. Se ha utilizado un TTS neuronal de última generación para el occitano gascón con pocas horas de grabación que pronunciaría los nombres propios franceses de manera estándar, se han desarrollado y evaluado diferentes sistemas, algunos de ellos basados en texto y otros basados en fonemas,  y algunos de ellos incluyen grabaciones de palabras francesas y otros no.