-
Partager cette page
Corpus Occitan d’Arièja
Laboratoire : CLLE – Equipe de Linguistique
Responsable : Clamença Poujade (CLLE)
Participants : Myriam Bras, Louise Esher, Clamença Poujade, Jean Sibille (CLLE)
L’Ariège est le berceau de nombreux auteurs et autrices qui ont écrit ou écrivent en occitan. La grande diversité des parlers rencontrés confère à cette aire géographique une richesse linguistique remarquable. En effet, ce département comporte plusieurs isoglosses séparant le gascon du languedocien, ainsi aucun auteur n’écrit dans le même parler. Le but de ce projet est de réunir un corpus de textes qui soit le plus large et le plus varié possible. Pour cela, il sera fait l’acquisition de textes de toutes époques, de tous genres (théâtre, prose, poésie, chroniques, …) et dans toutes les graphies utilisées par les auteurs. L’acquisition des textes se fera par scanérisation et océrisation pour les textes non disponibles au format numérique, grâce aux outils développés dans le projet ROC. Pour les textes au format numérique il faudra récupérer les fichiers numériques auprès des éditeurs. Les textes seront ensuite encodés au format des bases textuelles comme BaTelòc. Ce corpus de textes pourra servir de matériel de base pour des travaux de recherche sur l’occitan d’Ariège ou sur les zones de transitions entre dialectes.