ECTS
3 crédits
Composante
UFR Études Interculturelles de Langues Appliquées
Volume horaire
24h
Période de l'année
Semestre 1
Description
Programme :
Familiarisation avec la construction et l'exploitation des corpus
1. Construction et compilation d'un corpus à utiliser pour l'activité d'analyse terminologique et pour la traduction spécialisée
2. Familiarisation avec les formats de fichiers
3. Utilisation des concordanciers pour l'interrogation des corpus
4. Introduction aux expressions régulières
5. Introduction à l'annotation des corpus
6. Connaissances de base sur les outils d'analyse automatique: tokenisation, étiquetage morphosyntaxique
Objectifs
Compétences visées
• Connaître les différents types de corpus et d’outils d’annotation et d’exploitation des corpus.
• Connaître les principaux formats de fichiers impliqués dans la constitution des corpus (.txt, .pdf, .html, .xml) et les principaux langages utilisés pour l’interrogation des corpus : les expressions régulières, le langage de requête CQP
Heures d'enseignement
- Outils d'interrogation corpusTravaux Dirigés24h
Pré-requis nécessaires
Connaissances bureautiques de base
Dernière mise à jour le 20 juin 2023