Pour ajouter à la confusion qui règne autour des diagrammes Q-Q et des diagrammes de probabilité dans les mondes Python et R, voici ce qu'il faut entendre par l'expression "diagramme Q-Q". Manuel SciPy dit :
" probplot
génère un graphique de probabilité, qui ne doit pas être confondu avec avec un graphique Q-Q ou P-P. Statsmodels dispose d'une fonctionnalité plus étendue de ce type, voir statsmodels.api.ProbPlot".
Si vous essayez scipy.stats.probplot
vous verrez qu'en effet, il compare un ensemble de données à une distribution théorique. Les graphiques Q-Q, en revanche, comparent deux ensembles de données (échantillons).
R a des fonctions qqnorm
, qqplot
y qqline
. À partir de l'aide R (version 3.6.3) :
qqnorm
est une fonction générique dont la méthode par défaut produit un fichier graphique QQ normal des valeurs de y. qqline
ajoute une ligne à une "théorique, par défaut normal, qui passe par les quantiles de la probs, par défaut le premier et le troisième quantile. par les quantiles de la probs, par défaut le premier et le troisième quartile.
qqplot
produit un graphique QQ de deux ensembles de données.
En bref, les R qqnorm
offre la même fonctionnalité que scipy.stats.probplot
fournit avec le paramètre par défaut dist=norm
. Mais le fait qu'ils l'aient appelé qqnorm
et qu'il est censé "produire un tracé QQ normal" peut facilement dérouter les utilisateurs.
Enfin, un mot d'avertissement. Ces graphiques ne remplacent pas les tests statistiques appropriés et ne doivent être utilisés qu'à des fins d'illustration.