Cours 2020-2021

Machine learning et data mining [IDASM102]

  • 6 crédits
  • 40h+15h
  • 1er quadrimestre
Langue d'enseignement: Français
Enseignant: Frénay Benoît

Acquis d'apprentissage

A l'issue du cours, l'étudiant devra pouvoir faire preuve d'une compréhension des différents thèmes abordés (cf. contenu), c'est-à-dire être capable d'exprimer avec ses propres mots la théorie et les méthodes vues au cours et expliquer dans quel contexte celles-ci sont utiles. Il doit également être capable de mettre en oeuvre les techniques vues au cours sur des problèmes simples d'analyse de données et de se documenter sur une question d'actualité en machine learning et de data mining.

Contenu

Le cours introduit au machine learning et au data mining et permettra à l’étudiant d’attaquer une large palette de problèmes en data science. En premier lieu, quatre sujets sont abordés en machine learning :

  • notion de modèle, modèles simples (Dts, kNN…), overfitting, sélection de modèles

  • apprentissage supervisé (modèles linéaires, ensembles, réseaux de neurones, SVMs...)

  • apprentissage non-supervisé (clustering, visualisation, estimation de densité...)

  • apprentissage probabiliste (inférence probabiliste et modèles probabilistes)

Ensuite, l’étudiant sera confronté aux problèmes qui se posent en pratique :

  • identification des risques (pré-analyse des données en lien avec risques potentiels)

  • analyse de modèles (interprétabilité, feature importance, instance importance)

  • préparation de features (réduction de dimensionalité, feature selection, feature extraction...)

  • préparation des données (centrage + scaling, outlier detection…)


Méthodes d'enseignement

Les modalités d'enseignement et d'évaluation des unités d'enseignement ont été rédigées en fonction de la situation à la rentrée académique 2020-2021. Cependant, ces modalités pourraient faire l'objet de modifications en fonction de l'évolution de la crise sanitaire liée à la covid-19. Les étudiants seront informés de toute modification de la situation générale (passage à l'enseignement à distance partiel ou complet) par les autorités de l'UNamur tandis que les modifications propres à chaque unité d'enseignement leur seront communiquées par les enseignants, via webcampus

Mode d'évaluation

Les modalités d'enseignement et d'évaluation des unités d'enseignement ont été rédigées en fonction de la situation à la rentrée académique 2020-2021. Cependant, ces modalités pourraient faire l'objet de modifications en fonction de l'évolution de la crise sanitaire liée à la covid-19. Les étudiants seront informés de toute modification de la situation générale (passage à l'enseignement à distance partiel ou complet) par les autorités de l'UNamur tandis que les modifications propres à chaque unité d'enseignement leur seront communiquées par les enseignants, via webcampus

Le cours est divisé en deux activités d'apprentissage. La première est constituée des cours magistraux et est évaluée par un examen oral portant sur la théorie du cours. La seconde est une évaluation continue de la capacité des étudiants à mettre en oeuvre les techniques vues au cours et de se documenter sur une question d'actualité en machine learning. Cela consiste en la résolution de des problèmes simples d'analyse de données et en une présentation orale sur un sujet d'actualité. L'examen et l'évalution continue comptent respectivement pour 70% et 30% de la note du cours.

Sources, références et supports éventuels

Des références sont données pendant le cours.

Langue d'enseignement

Français

Lieu de l'activité

NAMUR

Faculté organisatrice

Faculté d'informatique
rue Grandgagnage 21
5000 NAMUR
T. 081725252
F. 081724967
secretariat.info@unamur.be

Cycle

Etudes de 2ème cycle