Cours 2019-2020

Statistiques avancées [SMATM120]

  • 6 crédits
  • 30h+30h
  • 2e quadrimestre
Langue d'enseignement: Français
Enseignant: VAN BEVER GERMAIN

Acquis d'apprentissage

Ce cours se veut une introduction à certaines méthodes modernes dans le domaine de la statistique. En particulier, celui-ci s'intéressera aux données dites ``à grande dimension". Au terme du cours, l'étudiant maîtrisera les outils permettant d'analyser des données pour lequel les méthodes ``classiques" (telles que, par exemple, celles vues au cours de statistiques multivariées) ne sont plus valables ou même disponibles.

Le cours sera divisé en deux volets, dans chacun desquels les outils mathématiques utilisés diffèrent: (1) l'étude de vecteurs aléatoires à grande dimension (grand p, petit n); (2) l'analyse de données fonctionnelles. 

Objectifs

L'objectif du cours est de couvrir de nombreuses méthodes d'analyse des données à haute dimension et des données fonctionnelles. Au terme du cours, l'étudiant pourra (i) reconnaître quand et pourquoi l'utilisation de telles méthodes est nécessaire; (ii) implémenter ces méthodes sur des jeux de données simulées et réelles; (iii) en justifier les fondements théoriques.

Contenu

Le cours se divise en deux volets. Le premier volet, dédié à l'analyse multivariée en haute dimension, couvrira, entre autres, les méthodes classiques portant sur la sélection de variable, la sparsité, la régression (telle que la régression ridge ou le LASSO), l'analyse en composantes principales, la classification (supervisée ou non), etc. Le second volet s'intéressera à l'analyse de données fonctionnelles. Après une première partie théorique, dédiée aux distributions de probabilités sur des espaces fonctionnels, le cours couvrira de nombreux résultats du domaine.

Table des matières

I. Introduction,

(A) II. Régression linéaire III. Propriétés IV. Sélection de modèle et validation V.Estimation de covariance

(B) VI. Représentation de données fonctionnelles VII. Analyse fonctionnelle VIII. Inférence statistique Hilbertienne

Description des exercices

Illustration des concepts et résultats du cours. Preuve de résultats théoriques. Implémentation des méthodes. 


Méthodes d'enseignement

Le cours magistral s'articule autour de slides, présentés et suivis en cours, et de notes de cours détaillées. Toutes les ressources du cours (y compris les séances d'exercices et leurs corrigés) seront disponibles sur Webcampus.

Mode d'évaluation

En raison des mesures prises dans la lutte contre la propagation du covid-19 et de celles mises en place au niveau de l'UNamur, les modalités d'évaluation font l'objet de modification pour être adaptées à la situation. Les modalités d'évaluation qui sont ainsi d'application pour la période d'évaluation de fin de troisième quadrimestre (seconde session) sont communiquées par l'enseignant, aux étudiants, via WebCampus pour chaque unité d'enseignement

L'évaluation du cours se fera via un projet détaillé de l'étudiant, qui sera ensuite défendu oralement. L'objectif du projet sera d'analyser un jeu de données (à fournir par l'étudiant ou fourni, au choix) et, ce faisant, de démontrer la maîtrise (technique, théorique et pratique) du cours. La défense orale du projet se fera en public, à l'issue de laquelle l'étudiant se verra poser diverses questions afin de tester sa compréhension de la matière. 

Un examen oral vérifiera la bonne compréhension des concepts du cours.

Sources, références et supports éventuels

Toutes les sources et références seront disponibles sur Webcampus.

Langue d'enseignement

Français

Lieu de l'activité

NAMUR

Faculté organisatrice

Faculté des sciences
Rue de Bruxelles, 61
5000 NAMUR

Cycle

Etudes de 2ème cycle