ECTS
2 crédits
Liste des enseignements
Bases de programmation
2 créditsEnquête de terrain
2 créditsManipulation de corpus textuels
2 créditsStatistiques descriptives
2 créditsRaisonnement statistique
2 créditsMontage d'expériences
2 créditsRecueil et structuration de corpus
2 créditsOutils d'analyse automatique de corpus
2 crédits
Bases de programmation
ECTS
2 crédits
SL4AY010
Ce cours a pour but d'introduire les bases de programmation en Python. Remarque: ce cours est un prérequis obligatoire pour le cours de Raisonnement statistique
Enquête de terrain
ECTS
2 crédits
SL4AY020
This course, which will be taught in English, will introduce Masters' level students to various aspects of fieldwork methodology and the analysis of resulting materials.
We will present various resources available to field linguists (databases, field manuals, elicitation materials, software, archives) as well as important concepts related to fieldwork and the resulting data.
Each of the 6 2-hour sessions will involve a practical exercise covering one aspect of field methodology and field data analysis.
Manipulation de corpus textuels
ECTS
2 crédits
SL4AY030
L'objectif de ce bloc de méthodologie est de prendre en main deux outils d'exploration de corpus linguistiques. La manipulation de ces outils nous amènera à aborder le langage de requête CQL et les expressions régulières, particulièrement utiles pour effectuer des requêtes sur corpus. Les dernières heures de cours seront consacrées à l'analyse statistique des résultats obtenus. Dans cet objectif, les principes de base de la statistique textuelle seront présentés.
Statistiques descriptives
ECTS
2 crédits
SL4AY050
Ce cours a pour but de maitriser les bases de traitement de données typiquement recueillies et traitées dans des études empiriques en sciences du langage. Le cours se concentrera sur la compréhension et le calcul de statistiques descriptives ainsi que les techniques et stratégies de visualisation de données. Les étudiants apprendront également les bases de R.
Remarque: ce cours est un prérequis ou co-requis (i.e., avant ou en même temps) pour le cours de Raisonnement statistique (Deuxième partie S1/S3) et très conseillé pour le cours de Montage d’expériences (Première partie S2/S4).
Prérequis recommandé: Bases de programmation
Raisonnement statistique
ECTS
2 crédits
SL4B040
Ce cours a pour but de maitriser les bases conceptuelles et pratiques nécessaires à l'analyse statistique de données. Les étudiants développeront également leurs capacités à programmer en python.
Pré-requis ou co-requis obligatoires pour ce cours: Bases de programmation et Statistiques descriptives (peut être fait en même temps), ou permission préalable de l'enseignant en début d'année.
Montage d'expériences
ECTS
2 crédits
SL4BY030
Ce cours a pour but de mettre en pratique le montage d'expériences psycholinguistiques. Les étudiants mettront en place une expérience comportementale sur une thématique reliée au langage.
Le cours est dispensé en anglais.
Pré-requis fortement recommandés: Statistiques descriptives, Bases de programmation
Pré-requis recommandés: Psycholinguistique, Raisonnement statistique
Recueil et structuration de corpus
ECTS
2 crédits
SL4BY010
De la détection d'encodage à la normalisation de données en passant par l'extraction de contenus Web, les étudiants aborderont au cours de ce module les étapes préalables à la constitution d'un corpus textuel en vue de son exploitation par les outils état de l'art. Ils tireront partie de méthodes de nettoyage et de structuration automatisées (python, perl) pour produire des documents dans des formats variés (TXT, CSV, XML/TEI).
Outils d'analyse automatique de corpus
ECTS
2 crédits
SL4BY020
Ce bloc concerne l'analyse automatique de textes: tokenisation, lemmatisation, identification des parties du discours (tagging) et des relations syntaxiques (parsing). On abordera les problématiques liées à l'annotation (choix de tokenisation, de lemmes, d'étiquettes…), l'utilisation de ressources existantes (modèles de langue) pour l'analyse automatique de texte, l'évaluation de l'analyse obtenue, et l'adaptation des ressources en fonction du type de texte.
Dernière mise à jour le 30 août 2021