Analyse de données 2

Présentation

  • Mesures et quantité statistiques élémentaires : covariance, matrice de données (S-form), normalisation d’un jeu de donnée (1h CM + 2h TD/TP)
  • Méthodes d’interpolation : linéaire, polynôme du second degré, spline cubique (2h CM + 4h TD/TP)
  • Méthodes d’interpolation optimale (2h CM + 4h TD/TP)
  • Méthodes de « fit » basées sur les moindres carrés (2h CM + 4h TD/TP)
  • Introduction aux analyses en composantes principales (1h30 CM + 3h TD/TP)
  • Analyses Spectrales 2D (1h30 CM + 3h TD/TP)

Le module intègre aussi une sortie de terrain en mer (16h)

 

Pré-requis nécessaires

Algèbre linéaire (niveau L1-L2) – Programmation scientifique (L3) - Analyse de données 1 (M1)

Objectifs

  • Connaître et savoir utiliser les méthodes d’analyse de données couramment rencontrés en physique marine
  • Acquérir les connaissances théoriques de base en statistique pour être en mesure de choisir, de manière critique, une méthode et d’en ajuster ses paramètres d’entrée
  • Acquérir les connaissances techniques pour pouvoir implémenter ces méthodes numériquement
  • Acquérir l’autonomie suffisante pour être en mesure d’apréhender la littérature sur le sujet

Compétences visées

  • Appliquer les outils statistiques et mathématiques couramment rencontrés dans le traitement et l’analyse de données
  • Privilégier l’aller-retour entre la formulation mathématique d’une méthode statistique et son implémentation numérique
  • Avoir le savoir théorique et technique pour appréhender une « nouvelle » méthode présentée dans une littérature spécialisée et l’implémenter numériquement

Descriptif

L’enseignement présente des cours magistraux (30%) et des séances de travaux dirigés sur machine (70%). Pour chaque méthode, les cours magistraux mettent l’accent sur : i) le contexte scientifique de son utilisation ; ii) le cadre théorique et statistique sur laquelle elle repose ; iii) sa formulation mathématique. Les séances de travaux dirigés sur machine mettent l’accent sur : i) le passage d’une formulation mathématique à une formulation numérique sous l forme d’un algorithme ; ii) le codage sous MATLAB et/ou PYTHON ; iii) l’application à un jeu de données concret ; iv) une présentation critique des résultats avec une estimation des incertitudes et des études de sensibilité pour les paramètre d’entrée.

L’évaluation se compose de deux devoirs surveillés qui ont lieu sur machine et d’un projet à faire à la « maison ». Les devoirs surveillés ont une partie écrite (30%) et une partie pratique sous MATLAB (70%).