Moyens

Le projet utilisera et participera au progrès et au développement de ses propres ressources et outils linguistiques pour progresser dans la numérisation des langues des Pyrénées. Étant donné que la situation de départ des langues basque, occitan et aragonais dans le domaine de la numérisation est très diverse, chaque langue a besoin de moyens et outils spécifiques capables de répondre aux besoins de niveau de numérisation spécifique pour chacune d’entre elles.

Voici une liste de tous les outils, applications et ressources développés dans le cadre du projet, divisés en fonction de la langue pour laquelle ils ont été créés. Le développement de ces ressources a permis de créer, enfin, une série d’applications ou d’outils multilingues, fondamentaux pour faire tomber les barrières linguistiques, et exemples remarquables des résultats de la coopération entre les langues.

BASQUE

 

ARAGONAIS

 

OCCITAN

  • Lexique occitan monolingue : collection des formes fléchies de l’occitan
  • Lexique bilingue occitan / autres langues : collection de mots usuels et équivalents dans une autre langue
  • Analyse morphosyntaxique occitan : définition des schémas et des guides d’annotation morphosyntaxique ; construction du corpus annoté en parties du discours (POS) ; élaboration de l’analyseur morphosyntaxique automatique
  • Analyse syntaxique occitan : définition des schémas et des guides d’annotation syntaxique ; construction du corpus annoté en dépendances ; élaboration de l’analyseur syntaxique automatique
  • VOTZ : Synthèse vocale en occitan : clé pour l’interface de nombreux dispositifs mobiles
  • ReVOc : outil de reconnaissance vocale en occitan
  • Amélioration de la traduction automatique du couple français – occitan

 

RESSOURCES MULTILINGUES

  • Application de traduction automatique de CMS