Cours 2021-2022

Analyse des données biologiques [SBOEM112]

  • 5 crédits
  • 24h+36h
  • 1er quadrimestre
Langue d'enseignement: Anglais / English

Acquis d'apprentissage

Partim UNamur:

EN: Know how to apply mixed and generalized modelling and interpret the output, including statistical results in scientific publications.

FR: Savoir appliquer les modèles mixtes et généralisés et interpréter les résultats, y compris les résultats statistiques dans les publications scientifiques.

Partim UCLouvain:

EN: Know how to apply ordination methods in multivariate data analysis in order to reveal structures and patterns in ecological data, in particular linking species composition on different sites and environmental descriptors of those sites.

FR: Savoir appliquer les méthodes d'ordination dans l'analyse des données multivariées afin de révéler les structures et les tendances dans des données écologiques, en particulier en reliant la composition des espèces sur différents sites et les descripteurs environnementaux de ces sites.

Objectifs

Partim UNamur:

EN: Train the students on applying and interpreting mixed and generalized models.

FR: Former les étudiants à l'application et à l'interprétation de modèles mixtes et généralisés.

Partim UCLouvain:

EN: Train the students on applying methods for multivariate data analysis, in particular ordination methods, and correctly interpreting the results.

FR: Former les étudiants à l'application des méthodes d'analyse des données multivariées, notamment les méthodes d'ordination, et à l'interprétation correcte des résultats.

Contenu

Partim UNamur:

EN: Theoretical introduction into mixed and generalised models (6h); two case studies on mixed and generalized models (2x3h). At the end of each case study lecture, the teacher will present a scientific article that resembles the case study just presented. The teacher asks the students to interpret the statistical results in that paper (e.g. what is wrong with the statistical techniques? what could have been done better? what do the results mean/imply?). The students will write up their answers in their group report, which serves as evaluation (see ‘Evaluation’).

FR: Introduction théorique aux modèles mixtes et généralisés (6h) ; deux études de cas sur des modèles mixtes et généralisés (2x3h). À la fin de chaque cours magistral, l'enseignant présentera un article scientifique qui ressemble à l'étude de cas qui vient d'être présentée. L'enseignant demande aux élèves d'interpréter les résultats statistiques de cet article (par exemple, qu'est-ce qui ne va pas avec les techniques statistiques ? Qu'est-ce qui aurait pu être mieux fait ? Que signifient/impliquent les résultats ?). Les étudiants écriront leurs réponses dans leur rapport de groupe, qui sert d'évaluation (voir « Évaluation »).

Partim UCLouvain:

EN: After a brief reminder on linear algebra and Euclidean geometry (vectors, matrices, distances, angles), the following (canonical) ordination techniques will be treated : principal component analysis, correspondence analysis, redundancy analysis (also called principal component analysis on instrumental variables), and canonical correspondence analysis. The lectures (12h) will treat both some theoretical background as well as the practical implementation via modern statistical software (R, package ade4).

FR: Après un bref rappel sur l'algèbre linéaire et la géométrie euclidienne (vecteurs, matrices, distances, angles), les techniques d'ordination (canoniques) suivantes seront traitées : analyse en composantes principales, analyse des correspondances, analyse des redondances (aussi appelée analyse en composantes principales sur variables instrumentales) et analyse des correspondances canoniques. Les cours (12h) traiteront à la fois du contexte théorique et de l'implémentation pratique via un logiciel statistique moderne (R, librairie ade4).

Table des matières

Partim UNamur:

EN: Theoretical introduction into mixed and generalised models (6h); two case studies on mixed and generalized models (2x3h). At the end of each case study lecture, the teacher will present a scientific article that resembles the case study just presented. The teacher asks the students to interpret the statistical results in that paper (e.g. what is wrong with the statistical techniques? what could have been done better? what do the results mean/imply?). The students will write up their answers in their group report, which serves as evaluation (see ‘Evaluation’).

FR: Introduction théorique aux modèles mixtes et généralisés (6h) ; deux études de cas sur des modèles mixtes et généralisés (2x3h). À la fin de chaque cours magistral, l'enseignant présentera un article scientifique qui ressemble à l'étude de cas qui vient d'être présentée. L'enseignant demande aux élèves d'interpréter les résultats statistiques de cet article (par exemple, qu'est-ce qui ne va pas avec les techniques statistiques ? Qu'est-ce qui aurait pu être mieux fait ? Que signifient/impliquent les résultats ?). Les étudiants écriront leurs réponses dans leur rapport de groupe, qui sert d'évaluation (voir « Évaluation »).

Partim UCLouvain:

EN: After a brief reminder on linear algebra and Euclidean geometry (vectors, matrices, distances, angles), the following (canonical) ordination techniques will be treated : principal component analysis, correspondence analysis, redundancy analysis (also called principal component analysis on instrumental variables), and canonical correspondence analysis. The lectures (12h) will treat both the theoretical background as well as the practical implementation via modern statistical software (R, package ade4).

FR: Après un bref rappel sur l'algèbre linéaire et la géométrie euclidienne (vecteurs, matrices, distances, angles), les techniques d'ordination (canoniques) suivantes seront traitées : analyse en composantes principales, analyse des correspondances, analyse des redondances (aussi appelée analyse en composantes principales sur variables instrumentales) et analyse des correspondances canoniques. Les cours (12h) traiteront à la fois du contexte théorique et de l'implémentation pratique via un logiciel statistique moderne (R, librairie ade4).

Description des exercices

EN: learn to solve a statistical problem. Find the appropriate analysis when faced with a problem, check the application conditions relating to the use of this analysis, perform the statistical test on the R software, interpret the results obtained and illustrate them.

FR: apprendre à résoudre un problème statistique. Trouver l’analyse adéquate face à un problème, vérifier les conditions d’application relatives à l’utilisation de cette analyse, réaliser le test statistique sur le logiciel R, interpréter les résultats obtenus et les illustrer.


Méthodes d'enseignement

Partim UNamur:

EN: Seminars and exercise sessions; self-study.

FR: Séminaires et séances d’exercices; auto-apprentissage.

Partim UCLouvain:

EN: Lectures and exercise sessions in a computer room. The exercise sessions will take place at UNamur.

FR: Cours magistraux et séances d’exercices dans une salle informatique. Les séances d’exercices auront lieu à l’UNamur.

Mode d'évaluation

EN: The partims UNamur and UCLouvain will be evaluated separately, each partim contributing 10/20 to the final score.

FR: Les partims UNamur et UCLouvain seront évalués séparément, chaque partim contribuant 10/20 à la note finale.

 

Partim UNamur:

EN: A group report serves as evaluation:

/Groups of 4 students (2 with stronger and 2 with weaker background in statistics).

/The exercises during the exercise sessions are used to ‘train’ the students. The solutions to these problems should not be in the reports.

/For the report, students get a new problem to solve. 

/In the report, the students also have to answer a question on the interpretation of an analysis in a published article.

FR: Un rapport de groupe sert d’évaluation:

/Groupes de 4 étudiants (2 avec des connaissances plus solides et 2 avec des connaissances plus faibles en statistiques).

/Les exercices pendant les séances d'exercices sont utilisés pour « former » les étudiants. Les solutions à ces problèmes ne devraient pas figurer dans les rapports.

/Pour le rapport, les élèves ont un nouveau problème à résoudre.

/Dans le rapport, les étudiants doivent également répondre à une question sur l'interprétation d'une analyse dans un article publié.

Partim UCLouvain:

EN: The evaluation consists of two parts : a written exam (open course) on the correct interpretation of the numerical and graphical output of a given data analysis ; group report on an actual data analysis, covering both the implementation of the method and the interpretation of the output, to be carried out by the students. The exam and the report count both for 5/10.

FR: L'évaluation se compose de deux parties : un examen écrit (à cours ouvert) sur l'interprétation correcte des résultats numériques et graphiques d'une analyse d’un jeu de données écologiques ; un rapport de groupe sur une analyse de données à réaliser par les étudiants, couvrant à la fois la mise en œuvre de la méthode et l'interprétation des sorties. L'examen et le rapport comptent tous les deux pour 5/10.

Sources, références et supports éventuels

Slides, capsules vidéo, articles scientifiques.

Références optionnelles :

- Alain F. Zuur, Elena N. Iono, Graham M. Smith, 2007. Analysing Ecological Data, Springer Science.

- Pierre Legendre, Louis Legendre, 2012. Numerical Ecology, Elsevier.

Langue d'enseignement

Anglais / English

Lieu de l'activité

NAMUR

Faculté organisatrice

Faculté des sciences
Rue de Bruxelles, 61
5000 NAMUR

Cycle

Etudes de 2ème cycle