ParCoLoca

Laboratoire : CLLE – Equipe de Linguistique

Responsables : Myriam Bras (CLLE) et Dejan Stosic (CLLE)

Participants : Myriam Bras, Jean Sibille, Dejan Stosic (Fabrice Corrons (LLA-CREATIS).

ParCoLoca est un projet de constitution de corpus parallèles en occitan et en catalan, avec d’autres langues (français, espagnol, anglais, serbe, italien etc.). Il prendra appui sur la base textuelle multilingue ParCoLab destinée à la recherche en linguistique, à l’enseignement et à l’apprentissage de langues, conçue et dirigée par Dejan Stosic du laboratoire CLLE. Au départ corpus de textes alignés en français, serbe et anglais, ParCoLab s’est ouverte en 2018 aux langues de France grâce au projet ParCoLaF soutenue par la DGLFLF qui a permis l’intégration de quelques textes en occitan (http://parcolab.univ-tlse2.fr/parcolaf/), Puis grâce au projet ANR DIVITAL qui a permis d'inclure d'autres langues de France : alsacien, corse, poitevin-saintongeais. C’est aujourd’hui un grand corpus parallèle de textes en français, serbe, anglais, espagnol, italien, occitan, corse, alsacien, poitevin-saintongeais, avec des alignements au niveau des phrases manuellement vérifiés, qui est interrogeable gratuitement en ligne.