• Votre sélection est vide.

    Enregistrez les diplômes, parcours ou enseignements de votre choix.

Outils d'analyse automatique de corpus

  • ECTS

    2 crédits

Description

SL4BY020

Ce bloc concerne l'analyse automatique de textes: tokenisation, lemmatisation, identification des parties du discours (tagging) et des relations syntaxiques (parsing). On abordera les problématiques liées à l'annotation (choix de tokenisation, de lemmes, d'étiquettes…), l'utilisation de ressources existantes (modèles de langue) pour l'analyse automatique de texte, l'évaluation de l'analyse obtenue, et l'adaptation des ressources en fonction du type de texte.

Lire plus