Niveau d'étude
BAC +4
ECTS
3 crédits
Composante
École d'ingénieur Denis Diderot
Période de l'année
Semestre 1
Objectifs
Savoir utiliser les bibliothèques python scikit-learn, numpy, pandas.
Savoir effectuer une analyse exploratoire des données, identifier les clusters présents dans les données et produire une visualisation informative aussi bien qu'interpréter ces résultats.
Syllabus
Apprendre les bases des méthodes utilisées pour leur clustering à l’aide d’apprentissage automatique :
- Méthodes de clustering classique : clustering hiérarchique, K-means, clustering spectral, méthodes à base de densité.
- Évaluation de qualité de clustering.
- Application et adaptation des méthodes utilisées pour différents types des données biologiques et médicales. Interprétation et analyse des résultats.
- Réalisation d’un projet de clustering des données en grande dimension.
Dernière mise à jour le 24 février 2025