Cours 2017-2018

Machine learning et data mining [IDASM102]

  • 6 crédits
  • 40h+15h
  • 1er quadrimestre
Langue d'enseignement: Français
Enseignant: Frénay Benoît

Acquis d'apprentissage

A l'issue du cours, l'étudiant devra pouvoir faire preuve d'une compréhension des différents thèmes abordés (cf. contenu), c'est-à-dire être capable d'exprimer avec ses propres mots la théorie et les méthodes vues au cours et expliquer dans quel contexte celles-ci sont utiles. Il doit également être capable de mettre en oeuvre les techniques vues au cours sur des problèmes simples d'analyse de données et de se documenter sur une question d'actualité en machine learning et de data mining.

Contenu

Le cours introduit au machine learning et au data mining et permettra à l’étudiant d’attaquer une large palette de problèmes en data science. En premier lieu, quatre sujets sont abordés en machine learning :

  • notion de modèle, modèles simples (Dts, kNN…), overfitting, sélection de modèles

  • apprentissage non-supervisé (clustering, visualisation, estimation de densité...)

  • apprentissage supervisé (modèles linéaires, ensembles, réseaux de neurones, SVMs...)

  • apprentissage probabiliste (inférence probabiliste et modèles probabilistes)

Ensuite, l’étudiant sera confronté aux problèmes qui se posent en pratique :

  • identification des risques (pré-analyse des données en lien avec risques potentiels)

  • analyse de modèles (interprétabilité, feature importance, instance importance)

  • préparation de features (réduction de dimensionalité, feature selection, feature extraction...)

  • préparation des données (centrage + scaling, outlier detection…)


Mode d'évaluation

Le cours est divisé en deux activités d'apprentissage. La première est constituée des cours magistraux et est évaluée par un examen oral portant sur la théorie du cours. La seconde est une évaluation continue de la capacité des étudiants à mettre en oeuvre les techniques vues au cours et de se documenter sur une question d'actualité en machine learning. Cela consiste en la résolution de des problèmes simples d'analyse de données et en une présentation orale sur un sujet d'actualité. L'examen et l'évalution continue comptent respectivement pour 70% et 30% de la note du cours.

Sources, références et supports éventuels

Des références sont données pendant le cours.

Langue d'enseignement

Français

Lieu de l'activité

NAMUR

Faculté organisatrice

Faculté d'informatique
rue Grandgagnage 21
5000 NAMUR
T. 081725252
F. 081724967
secretariat.info@unamur.be

Cycle

Etudes de 2ème cycle