Les boîtes à moustaches avec R

Un fichier de données

Travaillons sur une enquête de satisfactions dans un hôpital, récupéré lors d’un cours de FUN (France Unité Numérique). Les fichiers sont disponibles ici.

Par la suite, ces données seront stockées dans la variable satis .

Dans ces données comme souvent, les observations sont en lignes et les variables en colonnes.

Les couleurs

Pour ne pas rester sur le gris par défaut, voici la liste des couleurs de R.

Un aperçu des données

Intéressons-nous aux âges.

summary(satis$age)


Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
18.00 45.00 60.00 58.21 72.00 97.00 6

Le diagramme par défaut

boxplot(satis$age)

boxplot_age_01.png

En utilisant les options

boxplot(satis$age,horizontal=TRUE,col="brown",main="Répartition des âges",ylim=c(0,100))

boxplot_age_02.png

NB : l’option range=0 assure que les moustaches se terminent aux valeurs minimales et maximales.

Pour comparer deux diagrammes en fonction d’un paramètre

Étudions la répartition des âges selon le sexe :

boxplot(satis$age~satis$sexe)

boxplot_age_sexe_01.png

boxplot(satis$age~satis$sexe,names=c("Homme","Femme"),col=c("blue","pink"),main="Répartition des âges par sexe")

boxplot_age_sexe_02.png