Le projet utilisera et participera au progrès et au développement de ses propres ressources et outils linguistiques pour progresser dans la numérisation des langues des Pyrénées. Étant donné que la situation de départ des langues basque, occitan et aragonais dans le domaine de la numérisation est très diverse, chaque langue a besoin de moyens et outils spécifiques capables de répondre aux besoins de niveau de numérisation spécifique pour chacune d’entre elles.

BASQUE

 

ARAGONAIS

  • Synthèse vocale en aragonais.Clé pour l’interface de nombreux dispositifs mobiles
  • Amélioration de la traduction automatique du couple espagnol – aragonais.
  • Dictionnaire d’aragonais en-ligne.
 

OCCITAN

  • Lexique occitan monolingue : collection des formes fléchies de l’occitan
  • Lexique bilingue occitan / autres langues : collection de mots usuels et équivalents dans une autre langue
  • Analyse morphosyntaxique occitan : définition des schémas et des guides d’annotation morphosyntaxique ; construction du corpus annoté en parties du discours (POS) ; élaboration de l’analyseur morphosyntaxique automatique
  • Analyse syntaxique occitan : définition des schémas et des guides d’annotation syntaxique ; construction du corpus annoté en dépendances ; élaboration de l’analyseur syntaxique automatique
  • Synthèse vocale en occitan :clé pour l’interface de nombreux dispositifs mobiles
  • Détecteur textuel de l’occitan : identifier la langue occitane dans un texte
  • Détecteur textuel de variantes de l’occitan : identifier et différencier les différentes variantes de l’occitan.
  • Amélioration de la traduction automatique du couple français – occitan.