Journée MAD - 26/05/2025
LabPsy - UR4139, Université de Bordeaux
LabPsy - UR4139, Université de Bordeaux & Réseau so-maté
Valeurs extrêmes ou Valeurs aberrantes ? 
Tout démarre de notre pratique
Aguinis et al. 2013 proposent 14 définitions différentes

Extraits :
Valeur extrême par construction : Valeurs inhabituellement grandes ou petites par rapport aux autres valeurs du même construit. En général, en queue(s) de distribution.
Valeur extrême d’intérêt : Des points de données précis qui se trouvent à distance des autres points de données et qui peuvent contenir des informations valables ou des connaissances inattendues.
Valeur extrême liées à des analyses (modèles, cluster, etc.) : par exemple, valeurs extrêmes résultant de la conduite d’une analyse en cluster.
“An outlying observation, or”outlier,” is one that appears to deviate markedly from other members of the sample in which it occurs.” (Grubbs, 1969, p. 1)
“The intuitive definition of an outlier would be an observation that deviates so much from other observations as to arouse suspicion that it was generated by a different mechanism” (Hawkins, 1980, p. 1)
Catastrophique (Cowell & Victoria-Feser, 1996a)
Négligeable (Cowell & Victoria-Feser, 1996b) 
Ca dépend (André, 2022; Hlasny & Verme, 2018; Karch, 2023) 
Comparaison des méthodes de détection des valeurs extrêmes sur des designs simples (univariés ou bivariés).
Travaux d’un groupe de travail interne au LabPsy :
N. Pillaud, S. Roux, B. Subra, T. Alexopoulos & F. Ric
Comparaison de 7 méthodes de détection :
Comparaison des méthodes sur 3 designs :

Résultats :
La plupart des méthodes se basent sur les modèles (résidus)
\[y = \beta0 + \beta1x1 + \epsilon\]
Comment rendre compte des multioutliers en s’extrayant du modèle ?
En créant des modèles insensibles aux valeurs extrêmes
Comment rendre compte des multioutliers en s’extrayant du modèle ?
En adaptant les données et non le modèle : Transformations (Tukey)
Package performance (Lüdecke et al., 2021)
Mahalanobis & MCD :
Package performance (Lüdecke et al., 2021)
Méthodes de réduction de dimension (clustering) :
Package DHARMa : (Hartig, F., 2024)
Approche par simulation
Plusieurs recommandations (Leys et al., 2019) :